요약
최신 AI 업계 동향을 다룬 종합 뉴스로, 알리바바의 Z-Image 오픈소스 이미지 생성 모델, 앤트로픽의 Claude Opus 4.5 코딩 모델, 마이크로소프트의 Fara-7B 온디바이스 AI 에이전트 등 주요 AI 모델 출시 소식과 함께 오픈AI의 쇼핑 리서치 기능, 구글의 TPU 공급 확대, 일리야 수츠케버의 ‘확장의 시대에서 연구의 시대로’ 전환 발언 등 업계 주요 이슈들을 종합적으로 다룹니다.
주요 내용
1. 알리바바 Z-Image: 고품질 오픈소스 이미지 생성 모델
- 모델 특징: 6 빌리언 파라미터의 경량 모델로 소비자용 GPU(16GB VRAM)에서도 실행 가능
- 성능: 0.94초의 빠른 이미지 생성 속도, 포토리얼리스틱 퀄리티 제공
- 글씨 표현: 텍스트와 글씨 표현이 정교하게 구현되어 포스터 제작에 유용
- 모델 라인업:
- Z-Image Turbo (현재 공개): 빠른 속도의 이미지 생성
- Z-Image Base (예정): 비중류 기반 더 고품질 모델
- Z-Image Edit (예정): 이미지 편집 작업 특화 모델
- 경쟁 모델 비교: Midjourney Niji, Flux 2와 비교해도 경쟁력 있는 품질
- 검열: 검열이 거의 없어 다양한 이미지 생성 가능
2. Black Forest Labs Flux 2 출시
- 모델 구성:
- Flux Pro: 최고 성능의 API 모델
- Flux Control: 모델 제어 기능
- Flux Dev: 32 빌리언 파라미터 오픈소스 모델
- Flux Fill (예정): 경량화된 오픈소스 모델 (아파치 2.0 라이센스)
- 성능: Midjourney Niji보다 우수한 벤치마크 점수 달성
- 특징: 포스터 표현, 이미지 변형, 인물 유지, 이미지 합성 등 다양한 기능
- 평가: Z-Image에 비해 성능과 경량성 면에서 다소 아쉬운 평가
3. 앤트로픽 Claude Opus 4.5: 코딩 최강 모델
- 성능: SWE-bench Verified 기준 80.9점으로 1위 달성
- 가격: 이전 Opus 4.0 대비 1/3 수준으로 가격 인하 (9달러, 이전 27달러)
- 특징: 앤트로픽 입사 시험에서 2시간 제한 시간 내 모든 인간 지원자보다 높은 점수 획득
- 경쟁사 비교: Gemini 3 Pro, GPT-5.1 Pro Max보다 코딩 성능 우수
- 종합 지능 점수: 70점으로 2위 (여전히 가격은 가장 비쌈)
4. 오픈AI 쇼핑 리서치 기능 & 광고 루머
- 쇼핑 리서치: ChatGPT에 쇼핑 심층 분석 기능 추가, 예산 기반 제품 추천 및 비교 분석 제공
- 광고 기능 루머: Android 앱 베타 버전에서 광고 관련 API 정보 발견
- 재정 상황: HSBC 추정 기준 2030년까지 최소 2,070억 달러 추가 자금 조달 필요
- 음성 기능 통합: ChatGPT 음성 기능이 기본으로 통합되어 텍스트 대화 중에도 사용 가능
5. 일리야 수츠케버: “확장의 시대에서 연구의 시대로”
- 핵심 메시지: AI 발전이 스케일링(규모 확장)에서 연구 중심 혁신으로 전환 중
- 현재 한계:
- AI가 인간처럼 유연하게 사고하지 못함
- 사전 학습은 방대한 데이터에서 지식을 얻지만 실제 환경 적응력 부족
- 미래 전망: 5~20년 후 초지능(AGI) 달성 예상
- 필요한 변화:
- 컴퓨팅 파워와 데이터만 늘리는 것이 아닌 새로운 학습 원리 필요
- 초고속 지속 학습 능력 필요
- 새로운 ML 패러다임 개발 필요
기타 주요 소식
- 샘 알트먼 & 조니 아이브 AI 기기: 2년 내 출시 예정, 디스플레이 없이 마이크와 카메라로 작동하는 주머니 크기 기기
- 구글 TPU 공급 확대: 메타에 대규모 공급, 엔비디아 경쟁자로 부상
- 마이크로소프트 Fara-7B: 7B 파라미터 온디바이스 AI 에이전트, 컴퓨터 제어 가능
- DeepSeek Math V2: 수학 올림피아드 금메달 달성 오픈소스 모델
- 바이트댄스 Vidi2: Gemini 3 Pro보다 우수한 영상 이해 모델
- 텐센트 HunyuanOCR: GPT-4.5, Gemini보다 우수한 1B 파라미터 OCR 모델
- 일론 머스크 vs T1: Grok 5와 League of Legends 대결 제안
핵심 인사이트
- 오픈소스 AI의 급성장: 알리바바 Z-Image, DeepSeek Math V2 등 중국 오픈소스 모델들이 상업 모델과 경쟁할 수 있는 수준으로 발전하며 AI 기술의 민주화가 가속화되고 있습니다.
- AI 발전 패러다임의 전환: OpenAI의 핵심 인물이었던 일리야 수츠케버가 “확장의 시대에서 연구의 시대로” 전환을 언급하며, 단순 스케일링이 아닌 새로운 학습 원리와 연구 중심 혁신의 필요성을 강조했습니다.
- 온디바이스 AI 에이전트의 부상: 마이크로소프트 Fara-7B 같은 경량 모델이 로컬에서 컴퓨터를 제어하며, 클라우드 의존도를 줄이고 개인정보 보호를 강화하는 방향으로 발전하고 있습니다.
- 코딩 AI의 진화: Claude Opus 4.5가 앤트로픽 입사 시험에서 모든 인간 지원자를 능가하며, AI가 전문 엔지니어 수준의 코딩 능력을 갖추기 시작했음을 보여줍니다.
- AI 비즈니스의 현실: 대부분의 AI 스타트업이 외부 API 래퍼임에도 성공 가능하며, 기술보다는 UX와 제품 기획이 더 중요한 차별화 요소가 되고 있습니다.
관련 자료
- 조코딩 영상 속 소식 모아보기: https://cafe.naver.com/youtubejocoding/767
- 조코딩 강의 모아보기: https://jocoding.net/
- 어도비 MAX 2025 정리 영상: https://youtu.be/dyXEGfzjRnk
- 조코딩 프로덕트 빌더 채용: https://careers.jocoding.net/job_posting/7leoIN1r