아하
검색 이미지
기계공학 이미지
기계공학학문
기계공학 이미지
기계공학학문
탈퇴한 사용자
탈퇴한 사용자23.12.07

구글의 인공지능 제미나이가 멀티모달 설계라는데 이게 뭔가요?

구글의 인공지능 모델인 제미니, 또는 제미나이가 발표되면서

구글이 내세우는게 멀티모달 기능이라고 하던데

이 멀티모달 기능 또는 설계 라는게 어떤 개념인가요?

왜 메인으로 내세울정도로 중요한 것인가요?

55글자 더 채워주세요.
답변의 개수
1개의 답변이 있어요!
  • 신기한친칠라145
    신기한친칠라14523.12.07

    안녕하세요. 송종민 과학전문가입니다.

    구글은 6일(현지시간) AI의 기반이 되는 LLM '제미나이'(Gemini)를 공개했다.


    제미나이는 오픈AI의 챗GPT의 LLM인 'GPT'와 같은 AI 모델로, 오픈AI의 최신 모델인 'GPT-4'보다 성능이 우수하다고 구글은 밝혔다.


    이미지를 인식하고 음성으로 말하거나 들을 수 있으며 코딩 능력까지 갖춘 '멀티모달 AI'로 만들어졌다. 멀티모달은 다양한 모드 즉 시각, 청각 등을 활용해 텍스트 뿐만 아니라 이미지, 음성, 영상 등으로 상호작용하는 것을 말한다.


    또 제미나이는 수학 문제를 풀거나 데이터를 분석하는 추론 능력도 갖췄다.


    이 LLM은 머신 러닝(기계학습·인간의 학습능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술)의 규모에 따라 울트라(Ultra)와 프로(Pro), 나노(Nano) 등 3개 모델로 출시된다.


    가장 범용으로 쓰이는 '제미나이 프로'는 이날부터 구글의 AI 챗봇 서비스인 '바드'에 탑재된다. 바드에는 지금까지 팜2(PaLM2)가 탑재돼 왔다.


    제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다.

    만족스러운 답변이었나요?간단한 별점을 통해 의견을 알려주세요.