AI 업계 최강이 된 구글, Google I/O 주요 업데이트 15분 총 정리

구글 I/O 2025에서 발표된 주요 AI 업데이트들을 총정리한 영상으로, Veo 3 영상 생성 모델, Gemini 2.5 Pro Deep Think, Android XR 안경 등 구글이 AI 업계에서 압도적인 기술력을 보여준 다양한 제품들을 소개합니다.

Veo 3 – 소리까지 생성하는 영상 생성 모델

입모양, 립싱크까지 완벽하게 구현된 영상을 소리와 함께 한 번에 생성할 수 있는 혁신적인 기술입니다. 물튀기는 모션, 애니메이션, 기계식 키보드 소리 등 디테일한 표현이 가능하며, 요리 영상에서 양파가 익어가는 과정까지 자연스럽게 표현할 수 있습니다.

유저들이 게임 영상, 테크 유튜버 언박싱, ASMR, 랩 영상, 스탠드업 코미디, 요리 방송 등 다양한 콘텐츠를 제작하고 있으며, Flow라는 AI 편집 툴도 함께 공개되어 생성된 영상의 편집도 가능합니다.

Project Astra 및 에이전트 기능 진화

제품 설명서 다운로드뿐만 아니라 직접 스크롤하며 탐색하고 정보를 제공할 수 있습니다. 자전거 수리를 위해 YouTube 영상까지 자동으로 찾아서 재생하며, 중간에 대화가 끊겨도 맥락을 이해하고 기존 대화 내용을 지속할 수 있습니다.

제품 추천 및 쇼핑 리스트 제공 기능과 Agent Mode를 통해 룸메이트와 살 아파트를 지속적으로 찾아주는 기능, MCP 연결 및 웹사이트 정리까지 자동화가 가능합니다.

Gemini 모델 업데이트 및 새로운 기능들

Gemini 2.5 Pro Deep Think: 생각 시간을 길게 주어 심층적 분석이 가능하며, 수학과 코딩에서 OpenAI O3를 뛰어넘는 SOTA를 달성했습니다.

Gemini 2.5 Flash: 가성비 좋은 모델로 GPT-4o보다 뛰어난 성능을 제공합니다.

Gemini Diffusion: 토큰 단위가 아닌 이미지 생성 방식으로 1,479 토큰/초의 압도적 속도를 자랑합니다.

Native Voice: 더욱 자연스러워진 음성 생성 기능

Stitch: 해변 바이브 음악 앱 같은 UI 디자인을 바로 생성하고 Figma로 연동하는 도구

Jules: Gemini 2.5 Pro 기반 AI 코딩 에이전트로, GitHub 연동을 통한 병렬 작업이 가능합니다.

구글 서비스 통합 AI 기능

Try On: 내 사진을 업로드하면 다양한 옷을 가상으로 입어볼 수 있는 쇼핑 기능

AI Mode: 구글 검색에 Perplexity 같은 AI 검색 기능을 적극 도입

Google Meet 실시간 번역: 영어-스페인어 등 실시간 동시 통역 기능

Gmail 개인화: 구글 드라이브, 메일, 문서, 스프레드시트 등의 개인 정보를 종합한 스마트 답장 기능

Android XR 안경

젠틀몬스터와 협업한 투명한 안경 형태의 XR 디바이스로, 무게는 일반 안경과 동일한 수준입니다. Gemini AI가 내장되어 카메라, 스피커 기능을 포함하며, 시간, 날씨 정보 표시 및 사진 설명, 음악 재생, 커피숍 찾기, 내비게이션 안내 등이 가능합니다. 실시간 번역 기능도 지원합니다.

Gemma 3n – 온디바이스 AI

Claude 3.7 Sonnet과 유사한 성능을 가진 온디바이스 모델로, 최소 2GB RAM에서 구동 가능한 초경량 모델입니다. 인터넷 연결 없이도 AI 기능을 사용할 수 있습니다.

핵심 인사이트

구글이 AI 업계에서 OpenAI를 압도하며 기술적 우위를 확고히 하고 있습니다. 영상 생성, 음성 생성, 이미지 생성, 코딩, 검색, 번역 등 모든 AI 영역에서 통합적이고 혁신적인 솔루션을 제시하고 있습니다.

개인의 창작 능력을 혁신적으로 확장시키는 도구들을 통해 상상력과 시나리오만 있으면 누구나 고품질 콘텐츠를 제작할 수 있게 되었습니다. 구글 생태계(Gmail, Drive, Meet 등) 내 AI 통합으로 일상 업무의 혁신적 변화가 예고되며, 온디바이스 AI로 인터넷 없이도 강력한 AI를 활용할 수 있는 새로운 패러다임을 제시하고 있습니다.

AR/XR 기술과 AI의 결합으로 일상생활의 근본적 변화가 시사되고 있습니다.

Leave a Comment