구글 신형AI ‘제미나이2.0’ 공개
속도 2배↑···멀티모달 입출력도
마리너, 브라우저 이해·추론
연구 돕는 ‘딥 리서치’도 공개
구글이 멀티모달(복합정보처리) 능력이 향상된 신형 인공지능(AI) 모델 ‘제미나이 2.0’을 공개하고 AI 에이전트(비서) 시장 공략을 가속화한다.
구글은 11일(현지 시간) 제미나이 2.0를 출시한다고 밝혔다. 구글의 새 AI 모델 출시는 올 2월 ‘제미나이1.5’를 내놓은 지 약 10개월만이다.
구글은 이날부터 제미나이2.0 플래시를 개발자를 위한 플랫폼인 ‘구글 AI 스튜디오’와 기업용 플랫폼인 ‘버텍스 AI’에서 실험 모델로 제공한다. 제미나이2.0 플래시는 주요 벤치마크에서 ‘제미나이1.5 프로’에 비해 두 배 빠른 속도를 나타냈다. 이미지, 동영상, 오디오와 같은 멀티모달 입력이 가능할 뿐만 아니라 텍스트와 이미지를 결합한 이미지도 생성할 수 있다. 데미스 하사비스 구글 딥마인드 최고경영자(CEO)는 “짧은 지연 시간과 향상된 성능을 자랑하는 제미나이 2.0 플래시는 최첨단 기술을 대규모로 구현한 구글의 최신 주력 모델”이라고 소개했다.
구글은 제미나이2.0을 기반으로 복잡한 작업을 지원하는 새 AI 비서 ‘프로젝트 마리너’를 선보였다. 프로젝트 마리너는 브라우저 화면을 이해하고 추론한다. 아울러 사람처럼 보고 듣고 음성으로 대화하는 비서인 ‘프로젝트 아스트라’의 개발도 제미나이2.0 탑재를 계기로 속도를 낸다. 제미나이2.0가 장착된 프로젝트 아스트라는 다국어로 대화할 수 있고 구글 검색과 구글 렌즈, 구글 맵스 등 다양한 기능을 활용할 수 있다. 기억력도 강화됐다. 최대 10분 동안의 대화 내용을 기억하고 과거 대화를 바탕으로 개인화된 경험을 제공한다. 구글은 제미나이 앱뿐 아니라 안경 형태의 폼팩터에서도 프로젝트 아스트라를 구현할 예정이다. 순다르 피차이 구글 CEO는 “멀티모달의 새로운 발전을 통해 ‘유니버설 어시스턴트’라는 구글의 비전에 더 가까이 다가갈 수 있게 됐다”고 강조했다.
복잡한 작업을 지원하는 AI 비서 ‘프로젝트 마리너’ 예시. 사진제공=구글
구글은 복잡한 연구 보고서 작성을 도와주는 ‘딥 리서치’도 소개했다. AI 기반의 딥 리서치는 복잡한 주제를 탐구한 뒤 결과를 이해하기 쉬운 보고서로 제공한다. 개발자의 지시와 감독 하에 명령을 수행하는 ‘줄스’도 공개했다. 딥 리서치는 이날부터 유료 구독제인 제미나이 어드밴스드에서 사용할 수 있다.
구글은 제미나이2.0의 고급 추론 기능을 10억 명이 이용하는 AI 검색 서비스 ‘AI 오버뷰’에도 적용할 예정이다. 수학 방정식이나 멀티모달 질문 및 코딩 등 더 복잡한 질문을 처리할 수 있도록 할 계획이다.
제미나이2.0 출시를 계기로 AI 비서 시장을 선점하기 위한 빅테크 간 경쟁은 한층 치열해질 전망이다. 챗GPT 개발사 오픈AI는 전날 AI와 상호 작용하는 협업 도구 ‘캔버스’를 공식 출시했다. 캔버스는 챗GPT 내에서 이용자들이 AI로 글쓰기 및 코딩 프로젝트를 더 원활하게 할 수 있도록 지원하는 인터페이스다. 기존의 채팅 인터페이스와 달리 글쓰기와 코딩 작업을 위한 별도의 창이 열려 이용자가 실시간 편집과 세부적인 수정을 할 수 있다. 올해 10월 첫 선을 보인 캔버스는 챗GPT 플러스 등 일부 유료 이용자들에게 베타 버전으로 이용돼 왔으나 이날부터 모든 챗GPT 이용자에게 제공된다. 아마존은 최근 새 거대언어모델 ‘노바’를 공개하고 ‘노바 스피치 투 스피치 모델’과 ‘애니 투 애니 모델’ 등 멀티모달 모델도 내년에 출시할 계획이다.