구글, GPT에 대항하는 제미니(Gemini) AI 모델 1.0 발표
구글이 가장 크고 강력한 AI 모델인 제미니(Gemini) 1.0을 발표했습니다.
구글의 생성형 AI 모델 제미니 1.0은 규모에 따라 다음과 같이 세가지로 최적화 되어있습니다.
- Gemini Ultra - 매우 복잡한 작업을 위한 크고 성능이 뛰어난 모델
- Gemini Pro - 다양한 작업에 걸쳐 확장할 수 있는 모델
- Gemini Nano - 온디바이스 작업을 위한 효율적인 모델
제미니 울트라는 대규모 언어 모델(LLM) 연구 및 개발에 널리 사용되는 32개의 학술 벤치마크 중 30개에서 가장 높은 평가를 받을 정도로 높은 성능을 갖고 있습니다.
MMLU(massive multitask language understanding)에서 90.0%로 인간 전문가보다 높은 점수를 받은 최초의 모델이며, 어려운 질문에 답하기 전에 더 신중하게 생각하는 추론 기능의 활용으로 평가 결과가 더 좋아졌습니다.
제미니 울트라는 신중한 추론이 필요한 여러 영역에 걸친 멀티모달 작업으로 구성된 새로운 MMMU 벤치마크에서 59.4%의 가장 높은 점수를 달성하였으미 이미지 벤치마크에서 별도로 OCR의 도움을 받지 않고도 이전 세대 모델보다 더욱 뛰어난 성능을 보였습니다.
아래는 GPT-4와의 비교 평가 결과입니다.
제미니는 글과 화상에 대한 정교한 멀티모달 추론 기능을 갖고 있으며, 문서, 이미지, 오디오 등을 인식하게 만들어져 있습니다. Python, Java, C++, Go와 같은 유명 프로그래밍 언어로 높은 수준의 코드를 이해하고 설명하며 만들어 낼 수 있습니다.
제미니 1.0은 구글이 자체 설계한 TPU(Tensor Processing Unit) v4/v5e로 학습시켰으며, 구글은 제미니와 함께 차세대 TPU로 Cloud TPU v5p 또한 공개했습니다.
새로운 TPU v5p는 이전 세대인 TPU v4보다 2.8배 빠른 속도로 대규모 LLM 모델을 훈련시킬 수 있으며 2세대 스파스코어(SparseCore)를 통해 TPU v5p는 임베딩-밀도(embedding-dense) 모델을 TPU v4보다 1.9배 빠르게 훈련시키는게 가능합니다.
구글의 ChatGPT에 해당하는 바드(Bard)는 오늘부터 정교하게 조정된 제미니 프로를 이용하게 되며, 170개 이상의 국가/지역에서 영어로 제공되며, 조만간 모드와 언어, 지역을 늘릴 예정입니다.
가장 작은 온디바이스 AI 모델인 제미니 나노는 픽셀 8 프로에 처음 들어가며 녹음기 앱의 요약하기 기능을 지원합니다. 내년에는 왓츠앱을 시작으로 많은 메시지 앱에서 G보드의 스마트 리플라이(Smart Reply) 기능이 제공될 예정입니다.
이 밖에도 검색, 광고, Chrome, 듀엣 AI 등 더 많은 제품과 서비스에서 제미니를 사용할 수 있게 될 것입니다. 개발자와 기업 고객은 Google AI Studio 또는 Google Cloud Vertex AI의 Gemini API를 통해 Gemini Pro에 액세스할 수 있습니다.
아래는 제미니가 얼마나 다재다능한지 보여주는 소개 영상입니다. 한국어 자막도 있으니 관심있는 분들 참고하세요.
(출처 : 구글)