구글이 또 미친 물건을… ‘진짜’ 실시간 통역 출시 | 스마트 글래스 큰 그림 | Speech-to-Speech 원리
개요 구글이 Gemini 2.5 Flash Native Audio 기반의 실시간 통역 기술을 공개했습니다. 이 기술은 단순히 번역 성능이 향상된 것을 넘어, 음성을 텍스트로 변환하지 않고 직접 다른 언어의 음성으로 변환하는 “Speech-to-Speech” 방식을 채택해 거의 지연 없는 실시간 통역을 구현했습니다. 이는 기존 음성 인식(ASR) → 번역(Translation) → 음성 합성(TTS) 단계를 거치던 방식의 구조적 한계를 극복한 것으로, AI가 … Read more