구글, 새로운 멀티모달 기반 AI 모델 '제미나이(Gemini)' 공개
상태바
구글, 새로운 멀티모달 기반 AI 모델 '제미나이(Gemini)' 공개
  • 석주원 기자
  • 승인 2023.12.07 18:03
  • 댓글 0
이 기사를 공유합니다

AI 경쟁에서 한 발 뒤쳐져 있던 구글이 새로운 AI 모델 '제미나이(Gemini)'를 공개하며 본격적인 AI 시장 확장에 나섰다. 제미나이는 멀티모달 기반 AI 모델로 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 유형의 정보를 일반화하고 원활하게 이해하며 여러 정보를 동시에 조합하여 활용할 수 있다.

구글은 제미나이가 구글 딥마인드와 구글 리서치 등 구글 조직 전반에 걸친 대규모 협업의 결과이며 구글 역사상 가장 큰 과학적 및 기술적 노력 중 하나라고 소개했다. 제미나이 1.0은 서비스 규모에 맞춰 다음의 세 종류로 제공될 예정이다.

제미나이 울트라(Gemini Ultra): 방대하고 복잡한 작업에 적합한 가장 유용하고 규모가 큰 모델

제미나이 프로(Gemini Pro): 다양한 작업에서 확장하기에 가장 적합한 모델

제미나이 나노(Gemini Nano): 온디바이스(on-device) 작업에 가장 효율적인 모델

[출처: 구글 제공]

 

처음부터 멀티모달로 설계된 AI 모델

지금까지 멀티모달 인공지능 모델을 만드는 표준 접근 방식은 서로 다른 모달리티에 대해 별도의 구성 요소를 학습시킨 다음, 이를 서로 연결하여 일부 기능을 비슷하게 모방하는 것이었다. 이와 같은 모델은 이미지 설명과 같은 일부 작업은 잘 수행할 수 있지만 보다 개념적이거나 복잡한 추론에는 어려움을 겪을 수 있다.

구글은 제미나이를 개발 단계 초기부터 다양한 모달리티로 사전 학습시켜 '태생적 멀티모달(natively multimodal)'이 되도록 설계했으며 추가적인 멀티모달 데이터로 미세 조정하여 그 효과를 더욱 개선했다고 밝혔다.

제미나이 울트라는 AI 업계에서 대형 언어 모델(LLM) 연구 개발 평가에 주로 사용하는 32개의 벤치마크 중 30개에서 기존의 최신 기술을 뛰어넘는 결과를 나타냈다.

수학, 물리학, 역사, 법률, 의학, 윤리 등 총 57개의 주제를 복합적으로 활용해 세계 지식과 문제 해결 능력을 평가하는 MMLU(Massive Multitask Language Understanding, 대규모 다중 작업 언어 이해) 테스트에서는 90.04%의 점수를 기록했다. 이 점수는 사람 전문가보다도 높은 결과다.

또한, 고도의 추론 능력이 요구되는 다양한 영역에 걸친 멀티모달 작업으로 구성된 새로운 MMMU(Massive Multi-discipline Multimodal Understanding) 벤치마크에서도 59.4%의 높은 점수를 획득했다.

[출처: 구글 제공]

 

구글의 다양한 서비스와 연동

구글은 제미나이 1.0을 구글의 여러 제품 및 플랫폼과 연동할 예정이라고 밝혔다. 일반 사용자들은 공개 당일부터 제미나이 프로가 적용된 바드를 이용할 수 있는데 현재는 영어만 지원한다고 한다.

구글의 휴대전화 픽셀(Pixel)에도 제미나이가 탑재될 예정다. 픽셀 8 프로 모델은 제미나이 나노가 실행되도록 설계됐으며 녹음 앱의 요약하기와 같은 기능을 지원한다. 내년에는 왓츠앱을 시작으로 더 많은 메시징 앱에 적용될 예정이다.

이 외에도 몇 달 안에 구글 검색, 광고, 크롬, 듀엣 AI 등에 순차적으로 제미나이를 적용해 나갈 계획이다.

개발자와 기업 고객은 Google AI Studio 또는 Vertex AI의 제미나이 API를 통해 제미나이 프로를 이용할 수 있다.

Google AI Studio는 API 키로 앱을 빠르게 프로토타이핑하고 출시할 수 있도록 도와주는 무료 웹 기반 개발자 도구다. 완전 관리형 AI 플랫폼이 필요한 경우 Vertex AI를 사용해 데이터를 제어할 수 있는 제미나이를 맞춤 설정하고 기업 보안, 안전, 개인정보 보호, 데이터 거버넌스 및 규정 준수를 위한 구글 클라우드의 추가 기능을 활용할 수 있다.

안드로이드 개발자는 AICore를 통해 디바이스 작업에 가장 효율적인 모델인 제미나이 나노로 앱을 개발할 수 있다. AICore는 픽셀 8 프로 기기부터 안드로이드 14에서 사용할 수 있는 새로운 시스템 기능이다. 지금은 사전 체험을 신청하면 이용할 수 있다.

한편, 구글은 제미나이 울트라 출시를 앞두고 신뢰할 수 있는 외부 기관 소속 레드팀의 리뷰 등 광범위한 신뢰성 및 안전 점검을 완료한 후 미세 조정과 사람의 피드백을 통한 강화 학습(RLHF: Reinforcement Learning from Human Feedback)을 통해 모델을 더욱 개선하는 작업을 진행 중이라고 밝혔다.

이를 바탕으로 제미나이 울트라를 적용한 바드 어드밴스드(Bard Advanced)는 내년 초에 선보일 예정이다.

[출처: 구글 제공]

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.