구글 정말 미쳤습니다… 구글 I/O 2025 키노트 | 직접 보고 체험 후 총정리

개요

구글이 I/O 2025에서 AI 업계의 판도를 뒤흔들 만한 발표를 쏟아냈습니다. Gemini 2.5 Pro의 성능 향상, Deep Think 추론 모델 출시, Imagen 4와 Veo 3의 놀라운 생성 능력, 그리고 XR 디바이스까지—구글은 AI 모델, 에이전틱 AI, AI 검색 서비스, AI 제품 하드웨어 전 분야에서 1등을 선언했습니다. 특히 TPU 7세대 칩을 통한 비용 효율화로 AI 서비스의 대중화 기반을 마련하며, 오픈AI와 메타를 비롯한 경쟁사들에게 강력한 도전장을 내밀었습니다.

이 영상은 실리콘밸리 현장에서 직접 I/O 2025 키노트를 참석하고 체험한 에러(Error) 채널의 분석입니다. 에러는 AI와 기술 트렌드를 깊이 있게 다루는 한국의 대표적인 테크 유튜버로, 실제로 Google Beam, 안드로이드 XR 헤드셋, Google Glass 프로토타입을 직접 체험한 생생한 인사이트를 제공합니다.

핵심 내용

1. AI 모델: 모든 리더보드에서 1등 달성

구글은 Gemini 2.5 Pro를 통해 AI 모델 성능 경쟁에서 압도적인 우위를 점했습니다. 현재 거의 모든 벤치마크 리더보드에서 1등을 차지하고 있으며, 특히 코딩, 수학, 멀티모달리티에서 탁월한 성능을 보입니다.

실제로 영상에서는 손으로 그린 스케치를 업로드하면 Gemini 2.5 Pro가 이를 이해하고 3D 애니메이션 코드를 자동으로 생성하는 시연이 공개되었습니다. 이미지, 코드, 애니메이션을 한 번에 처리하는 멀티모달 능력이 실용적인 수준에 도달했음을 보여주는 사례입니다.

Gemini Pro Deep Think (추론 모델)의 등장:

OpenAI의 O3, O4-mini보다 뛰어난 성능
수학(mathematics), 코딩, 멀티모달리티 벤치마크에서 모두 우위
“추론(reasoning)” 단계를 효율적으로 밟아 복잡한 문제 해결 능력 향상

Gemini Diffusion 모델:

텍스트 생성에 Diffusion 방식 적용
Transformer가 토큰을 하나씩 생성하는 방식과 달리, 전체를 한 번에 생성하여 속도 향상 가능
아직 실험적 단계이지만 향후 LLM 성능 최적화의 새로운 방향 제시

구글의 월간 토큰 처리량은 2024년 4월 9.7조 개에서 1년 만에 50배 증가했으며, Gemini 앱의 월간 활성 사용자는 4억 명을 돌파했습니다. Vertex AI의 Gemini 사용량은 40배 증가, 개발자 수는 700만 명 이상으로 작년 대비 5배 성장했습니다.

2. 이미지·영상 생성 AI: Imagen 4와 Veo 3

Imagen 4:

최대 2K 해상도 지원으로 인쇄물, 발표 자료에도 활용 가능
물방울, 디테일 표현 능력 대폭 향상
철자, 타이포그래피 능력 강화로 포스터 제작에 최적화

Veo 3 (텍스트/이미지 → 영상 생성 AI):

오디오까지 함께 생성하는 최초의 동영상 생성 AI
립싱크, 물리 효과(world model) 정확도 향상
프롬프트에 원하는 대사를 입력하면 자동으로 음성과 영상을 생성

Flow (AI 영상 제작 도구):

Imagen 4, Veo 3, Gemini를 결합한 통합 영상 제작 플랫폼
이미지 합성, 아웃페인팅, 뷰 변경 등 고급 편집 기능 제공
미국 내 Google AI Pro/Ultra 구독자에게 즉시 제공 시작

3. 에이전틱 AI: 실생활에 통합되는 AI 에이전트

Gemini Live (구 프로젝트 Astra):

실시간 카메라를 통해 주변 환경 인식
음성 명령으로 스마트폰을 자동 제어
멀티모달(오디오, 비디오, 텍스트) 통합 경험 제공

4. 하드웨어 및 디바이스: XR 시장 진출

안드로이드 XR:

삼성, 퀄컴과 협력하여 개발한 새로운 OS
헤드셋부터 스마트 안경까지 다양한 기기 지원
Gemini가 네이티브로 통합된 첫 번째 안드로이드 플랫폼

Google Glass (안드로이드 XR 안경):

디스플레이가 탑재되어 텍스트와 이미지를 투명하게 표시
실시간 번역 기능: 힌두어와 영어를 1~2초 레이턴시로 번역
젠틀몬스터, Warby Parker와 협력하여 상용화 준비 중

핵심 요점

영상을 본 후 기억해야 할 다섯 가지:

Gemini 2.5 Pro와 Deep Think는 현재 대부분의 AI 벤치마크에서 1위를 차지하며, 멀티모달(이미지+코드+애니메이션) 처리 능력이 실용 수준에 도달했습니다. 실제로 손그림 스케치를 3D 애니메이션 코드로 변환하는 시연은 창작 도구로서의 가능성을 보여주며, 개발자와 디자이너가 즉시 활용할 수 있는 수준입니다.
Veo 3는 최초로 오디오와 영상을 동시 생성하는 AI로, Flow 플랫폼을 통해 구독자들에게 즉시 제공됩니다. 8초 영상 제한이 있지만 립싱크와 물리 효과가 정확해 짧은 소셜 미디어 클립 제작에 활용 가능하며, 향후 영상 길이가 늘어나면 본격적인 콘텐츠 제작 도구로 자리잡을 것입니다.
Gemini Live는 실시간 환경 인식과 스마트폰 자동 제어를 통해 진정한 AI 에이전트 경험을 제공하며, 일상 업무 자동화의 문을 열었습니다. “자전거 타이어 공기 넣는 법”을 물으면 매뉴얼 검색부터 유튜브 영상 재생까지 자동 수행하는 시나리오는, AI가 단순 질의응답을 넘어 복잡한 작업을 대신 처리하는 단계로 진입했음을 보여줍니다.
안드로이드 XR의 등장은 구글이 스마트폰 다음 플랫폼으로 XR 기기를 선택했음을 의미하며, Google Glass의 실시간 번역 기능(1~2초 레이턴시)은 언어 장벽 제거라는 오랜 약속을 실현 가능하게 만들었습니다. 젠틀몬스터와의 협업은 XR 안경의 대중화 가능성을 높이며, 메타의 Ray-Ban 스마트 안경과의 경쟁 구도를 형성합니다.
TPU 7세대 Ironwood는 이전 세대 대비 10배 성능 향상으로 구글이 AI 서비스를 비용 효율적으로 대중화할 수 있는 핵심 인프라이며, 이는 OpenAI와 Meta가 쉽게 따라올 수 없는 장기적 경쟁 우위입니다. 자체 설계 칩을 통해 전력 소비와 비용을 절감하는 전략은 AI 서비스의 수익성 확보에 필수적이며, NVIDIA GPU에만 의존하는 경쟁사 대비 구조적 이점을 제공합니다.

이 글은 YouTube 자동 생성 자막(자막 추출일: 2025-12-21)을 바탕으로 작성되었습니다. 영상의 핵심 내용을 정리한 것이므로, 보다 완전한 이해를 위해서는 원본 영상 시청을 권장합니다.

개요