AI뉴스 – 앤트로픽 Skills, 4.5 하이쿠, 챗GPT 성인 콘텐츠, Veo 3.1, 일론머스크 AGI, World Labs RTFM, 면도 로봇 등

요약

매주 최신 AI 업계 소식을 전하는 뉴스로, 앤트로픽의 스킬즈(Skills) 기능과 하이쿠 4.5 출시, 오픈AI의 성인 콘텐츠 정책 변화, 구글의 Veo 3.1 동영상 모델 출시, 일론 머스크의 AGI 예측, 그리고 최신 로봇 기술까지 다양한 AI 관련 소식을 다룹니다.

주요 내용

1. 앤트로픽(Anthropic)의 주요 업데이트

  • Claude Skills 공개: AI 에이전트가 업무 흐름에 맞춰 전문성을 확장할 수 있게 하는 새로운 기능. 명령어, 스크립트, 리소스가 포함된 폴더 단위 구성 요소로, 필요한 순간에 Claude가 로드할 수 있음
  • MCP(Model Context Protocol)보다 더 큰 혁신이 될 수 있다는 평가를 받고 있음
  • 브랜드 가이드라인, 포스터 디자인, 이미지 편집, Word 문서 작성 등 다양한 스킬을 장착하여 사용 가능
  • 마크다운이나 YAML 기반의 단순한 구조로 다른 모델이나 도구에도 즉시 활용 가능
  • 토큰 효율성이 매우 높음 – 세션 시작 시 각 스킬의 메타데이터만 로드하고 필요할 때 전체 내용을 불러옴
  • Claude Haiku 4.5 출시: 소넷보다 작은 모델로 속도는 2배 빠르고 비용은 1/5 수준의 가성비 모델
  • 코딩 성능이 이전 세대 Sonnet 4, GPT-4o, Gemini 2.5보다 우수함
  • Claude Code 웹 버전 공개: 브라우저에서 GitHub와 연결하여 클라우드 상에서 작업 가능
  • Claude Code 모바일 앱 출시 준비 완료
  • 대화형 질문 기능 추가: 추가 정보가 필요하거나 여러 경로가 있을 때 구체적으로 질문하여 사용자 의도를 파악

2. 오픈AI(OpenAI) 동향

  • 성인 콘텐츠 허용 정책: 12월부터 ChatGPT에서 성인 콘텐츠 허용. “성인 사용자는 성인처럼 대우한다”는 원칙 하에 정책 전환
  • 샘 알트만이 공식적으로 발표했으며, 에로티카 같은 콘텐츠를 더 많이 허용할 예정
  • 한국에서는 법적 규제로 인해 도입이 어려울 것으로 예상됨 (AI를 이용한 성인 콘텐츠 생성이 형사 처벌 대상)
  • 브로드컴과 10GW 칩 계약: 원전 10개에 해당하는 칩 계약, 누적 26GW
  • 브로드컴과 AI 칩 직접 설계: NVIDIA에만 의존하지 않기 위해 브로드컴과 손잡고 AI 칩을 직접 설계
  • 메타도 데이터 센터 확장을 위해 역대 최대 규모인 43조 원 조달 완료

3. 구글(Google)의 AI 발전

  • Veo 3.1 동영상 모델 출시: 고품질 영상 생성이 가능하며, 시작과 끝 프레임을 지정하여 생성 가능
  • Gemini에서 바로 사용 가능하며, Vids(구글의 영상 편집 도구)에서도 즉시 활용 가능
  • 광고, 인터뷰 영상 등 다양한 용도로 활용 가능
  • Nano Banana를 검색, NotebookLM, 포토에 추가: AI 기능이 구글의 주요 서비스에 통합
  • 지도와 대화하는 API 출시: Grounding with Google Maps 기능으로 Gemini가 지도 데이터와 결합
  • 가게 정보, 별점, 리뷰 등을 활용하여 더욱 정확한 정보 제공
  • Stitch와 Jules 결합: AI 디자인 툴 Stitch와 코딩 도구 Jules를 연결하여 디자인부터 코딩까지 통합 작업 가능
  • 구글 CEO 인터뷰: 10년 내 양자 컴퓨터 현실화 확신, 연내 Gemini 3.0 출시 예고

4. X.AI(일론 머스크)의 움직임

  • Grok Imagine 비디오 생성 기능 업데이트: 무료로 사용 가능하며 품질이 지속적으로 개선되고 있음
  • 일론 머스크의 AGI 발언: Grok 5가 AGI를 달성할 확률이 현재 10%이며 계속 증가하고 있다고 언급
  • AGI 정의: 인간이 컴퓨터로 할 수 있는 모든 일을 할 수 있지만, 인간과 컴퓨터를 합친 것보다 똑똑하진 않은 수준
  • 3~5년 내 달성 가능할 것으로 예상
  • 세계 모델(World Model) 경쟁 합류: 내년 말 AI 생성 게임 공개 예정
  • 게임 스튜디오를 준비 중이며, 실시간 영상 생성 기반의 게임 개발 중

5. 세계 모델(World Model) 관련 프로젝트들

  • Interactive Sora: Matt Shumer가 Sora 2를 기반으로 만든 인터랙티브 게임. 선택에 따라 즉시 새로운 장면을 생성
  • 선택지에 따라 스토리가 달라지는 어드벤처 게임 형태
  • World Labs의 RTFM: 단일 H100 GPU로 실시간 3D 일관성 세계를 생성하는 차세대 실시간 영상 생성 모델
  • 사진 한 장만 넣으면 월드 모델을 돌아다닐 수 있음
  • 실시간으로 카메라 조작 및 인터랙션 가능
  • 데모에서 직접 키보드로 움직이며 탐험 가능

6. 기타 주목할 만한 AI/로봇 기술

  • Anduril의 Eagle Eye(이글 아이): 오큘러스 창시자가 만든 전투용 스마트 고글
  • AR 기능으로 실시간 정보 확인, 야간 투시, 열 감지 등 가능
  • DreamOmni2: ByteDance에서 공개한 나노바나의 오픈 소스 버전
  • 멀티모달 지시 기반 편집·생성을 지원하는 차세대 AI 모델
  • 이미지 합성, 포즈 변경, 헤어 스타일 변경 등에서 나노바나보다 우수한 성능
  • NVIDIA DGX Spark 출시: AI 개발자를 위한 소형 PC
  • 128GB RAM을 탑재했으나 가성비는 맥 미니나 맥 스튜디오보다 낮음
  • 큰 모델을 돌릴 수 있는 연구용 장비로 적합
  • Noematrix의 면도 로봇: 알리바바 주도의 기업에서 공개한 로봇이 정교한 움직임으로 면도를 해줌
  • Dragon 드론: 용 모양의 드론으로 프로펠러를 이용해 자유롭게 이동하고 무게를 들거나 밀 수 있음
  • Booster Robotics K1 로봇: 아이들과 함께 뛰어노는 로봇
  • Unitree G1 로봇 무술 영상: 쿵푸 등 무술 동작을 정교하게 수행하는 로봇. 실제 시연 영상도 공개되어 공연 퍼포먼스 등에 활용 가능

핵심 인사이트

  • 앤트로픽의 Skills는 MCP를 넘어서는 혁신이 될 가능성이 높음. 마크다운/YAML 기반의 단순한 구조로 인해 다른 모델에도 쉽게 적용 가능하고, 토큰 효율성이 매우 높아 빠른 속도로 생태계가 확장될 것으로 예상됨
  • 오픈AI의 성인 콘텐츠 허용 정책은 사용자 체류 시간과 사용량을 늘릴 수 있지만, 한국과 같은 규제 강한 국가에서는 도입이 어려워 지역별로 서비스 차이가 발생할 수 있음
  • 세계 모델(World Model) 경쟁이 본격화되고 있음. 구글의 Genie 3, X.AI의 게임 스튜디오, World Labs의 RTFM 등 다양한 프로젝트가 진행 중이며, 실시간 인터랙티브 경험이 게임뿐만 아니라 교육, 시뮬레이션 등 다양한 분야에 적용될 것으로 전망됨
  • 로봇 기술의 빠른 발전: 면도 로봇, 무술 로봇, 어린이 놀이 로봇 등 다양한 분야에서 로봇의 정교함과 실용성이 빠르게 향상되고 있으며, 일상생활에 로봇이 통합되는 미래가 가까워지고 있음
  • 하드웨어 경쟁 심화: 오픈AI와 메타가 막대한 자본을 투자하여 데이터 센터를 확장하고 있으며, NVIDIA 의존도를 낮추기 위해 자체 칩 설계에 나서고 있음. 이는 AI 인프라 경쟁이 소프트웨어뿐만 아니라 하드웨어 영역까지 확대되고 있음을 의미함

관련 자료

Leave a Comment