본문 바로가기

#소프트웨어#앱#서비스

구글, GPT에 대항하는 제미니(Gemini) AI 모델 1.0 발표

반응형

 

구글이 가장 크고 강력한 AI 모델인 제미니(Gemini) 1.0을 발표했습니다.

 

구글의 생성형 AI 모델 제미니 1.0은 규모에 따라 다음과 같이 세가지로 최적화 되어있습니다.

 

  • Gemini Ultra - 매우 복잡한 작업을 위한 크고 성능이 뛰어난 모델
  • Gemini Pro - 다양한 작업에 걸쳐 확장할 수 있는 모델
  • Gemini Nano - 온디바이스 작업을 위한 효율적인 모델

 

제미니 울트라는 대규모 언어 모델(LLM) 연구 및 개발에 널리 사용되는 32개의 학술 벤치마크 중 30개에서 가장 높은 평가를 받을 정도로 높은 성능을 갖고 있습니다.


MMLU(massive multitask language understanding)에서 90.0%로 인간 전문가보다 높은 점수를 받은 최초의 모델이며, 어려운 질문에 답하기 전에 더 신중하게 생각하는 추론 기능의 활용으로 평가 결과가 더 좋아졌습니다.

 

제미니 울트라는 신중한 추론이 필요한 여러 영역에 걸친 멀티모달 작업으로 구성된 새로운 MMMU 벤치마크에서 59.4%의 가장 높은 점수를 달성하였으미 이미지 벤치마크에서 별도로 OCR의 도움을 받지 않고도 이전 세대 모델보다 더욱 뛰어난 성능을 보였습니다.

 

아래는 GPT-4와의 비교 평가 결과입니다.

 

 

 

제미니는 글과 화상에 대한 정교한 멀티모달 추론 기능을 갖고 있으며, 문서, 이미지, 오디오 등을 인식하게 만들어져 있습니다. Python, Java, C++, Go와 같은 유명 프로그래밍 언어로 높은 수준의 코드를 이해하고 설명하며 만들어 낼 수 있습니다.

 

 

제미니 1.0은 구글이 자체 설계한 TPU(Tensor Processing Unit) v4/v5e로 학습시켰으며, 구글은 제미니와 함께 차세대 TPU로 Cloud TPU v5p 또한 공개했습니다.

 

새로운 TPU v5p는 이전 세대인 TPU v4보다 2.8배 빠른 속도로 대규모 LLM 모델을 훈련시킬 수 있으며 2세대 스파스코어(SparseCore)를 통해 TPU v5p는 임베딩-밀도(embedding-dense) 모델을 TPU v4보다 1.9배 빠르게 훈련시키는게 가능합니다.

 

 

구글의 ChatGPT에 해당하는 바드(Bard)는 오늘부터 정교하게 조정된 제미니 프로를 이용하게 되며, 170개 이상의 국가/지역에서 영어로 제공되며, 조만간 모드와 언어, 지역을 늘릴 예정입니다.

 

가장 작은 온디바이스 AI 모델인 제미니 나노는 픽셀 8 프로에 처음 들어가며 녹음기 앱의 요약하기 기능을 지원합니다. 내년에는 왓츠앱을 시작으로 많은 메시지 앱에서 G보드의 스마트 리플라이(Smart Reply) 기능이 제공될 예정입니다.

 

 

이 밖에도 검색, 광고, Chrome, 듀엣 AI 등 더 많은 제품과 서비스에서 제미니를 사용할 수 있게 될 것입니다. 개발자와 기업 고객은 Google AI Studio 또는 Google Cloud Vertex AI의 Gemini API를 통해 Gemini Pro에 액세스할 수 있습니다.

 

아래는 제미니가 얼마나 다재다능한지 보여주는 소개 영상입니다. 한국어 자막도 있으니 관심있는 분들 참고하세요.

 

 

(출처 : 구글)

반응형