AI뉴스 – GLM-5.2 열풍, 구글 심각한 위기, GPT-5.6 소식, Codex Record & Replay, Mythos 논란, 미드저니 근황 등

개요

이 영상은 한 주간 쏟아진 AI 분야의 핵심 소식을 정리한 콘텐츠로, 오픈웨이트 모델 GLM-5.2의 충격적인 성능, 구글의 핵심 인재 유출, GPT-5.6 출시 임박설, 코덱스의 새로운 자동화 기능 등을 다룹니다. 클로즈드 소스 최상위 모델들과 어깨를 나란히 하는 오픈웨이트 모델의 등장이 로컬 AI 생태계에 어떤 변화를 가져오는지를 핵심 메시지로 전달합니다.

이 영상은 AI 소식을 주간 단위로 전달하는 채널 조코딩이 제작한 콘텐츠입니다. 바이브 코딩 1인 창업 책 출간과 조코헌트 사이트 운영 등 AI 실무·창업 분야에서 활동하는 채널로, 최신 모델 동향을 실제 벤치마크 자료와 사용자 후기를 근거로 정리해 전달합니다.

핵심 내용

GLM-5.2 오픈웨이트 공개

ZI에서 GLM-5.2 모델을 오픈웨이트로 공개했습니다. 누구나 다운받아 무료로 돌릴 수 있고 MIT 라이선스로 상업적 활용까지 가능한 모델입니다. 성능이 어마어마한데, 에이전틱 코딩에서 클로드 오퍼스 4.8과 거의 비슷한 성능을 내고, 종합 점수에서도 클로드 오퍼스 4.8, GPT-5.5, 제미나이 3.1 프로와 비교됩니다. 일반적인 오픈 소스가 아니라 실리콘 밸리 최고 회사들의 클로즈드 소스 모델과 비견될 정도의 성능을 보입니다.

아티피셜 애널리시스 조사에서 인텔리전스 점수는 전체 모델 비교 시 페이블 5.5 다음으로 회사 중 3등이며, 제미나이 3.1을 한참 앞섰습니다. 가격도 합리적이어서 비싼 클로즈드 모델들에 비해 거의 반값 수준으로 저렴하게 나왔습니다. 웹데브 코드 아레나에서는 클로드 페이블 5 다음으로 GLM-5.2가 위치할 정도로 놀라운 결과를 보였고, 이는 오픈웨이트 모델로서 미친 성과입니다.

할루시네이션(환각률)도 28%로 굉장히 낮습니다. 탑티어 클로즈드 소스 모델인 페이블 5가 48%, GPT-5.5는 GLM-5.2보다 환각률이 세 배 높다고 합니다. 자신있게 지어내는 불확실성을 인식하는 데 훨씬 뛰어난 정확한 모델이라는 의미입니다.

벤치마크 전반과 양자화

GLM-5.2는 디자인 아레나에서 페이블 5를 웹 디자인 능력으로 넘어섰고, 자판기 운영 능력을 검사하는 밴딩 벤치에서 2등, 포스트 트레인 벤치에서는 1등을 했습니다. 많은 영역에서 오픈웨이트 모델이 탑티어 모델들을 앞서가는 모습입니다.

양자화도 가능해서, 2비트 양자화를 하면 82%의 정확도를 유지하면서 238GB 정도를 사용한다고 합니다. 이 정도면 DGX 스파크 두 대를 연결해 사용할 수도 있습니다. 벌셀 CEO는 GLM-5.2의 코딩 성능에 진심으로 감탄하고 충격을 받았다고 극찬했으며, “GLM-5.2는 로컬 AI의 챗GPT 순간이 될지도 모른다”는 후기도 나왔습니다. 딥 소프트웨어 엔지니어 벤치마크에서도 제미나이 3.5 플래시(구글 아이오에서 공개한 최신 모델)보다 좋은 점수를 받았습니다. 모델 공개 후 ZI 관련 주식은 26% 급등했습니다.

구글 인재 유출과 안전 강조

구글은 핵심 인재 유출 상황을 맞고 있습니다. 트랜스포머 아키텍처 논문 “Attention is All You Need”의 공동 저자이자 제미나이 공동 리드였던 노암 샤지어가 오픈AI 합류를 발표했고, 알파폴드를 만들어 노벨 화학상을 받은 존 점퍼는 구글 딥마인드를 떠나 앤트로픽 합류를 발표했습니다. 알파고·알파제로 수석 연구원 데이비드 시버, 수백만 명이 사용하는 개발자 도구를 만든 에디 오스마이 등 거물들이 떠나는 상황입니다. 다만 데미스 하사비스, 제프 딘이 남아 있고 막대한 데이터 센터 인프라가 있어 끝난 것은 아니지만 핵심 인물 유출은 큰 손실로 보입니다.

구글 딥마인드는 “Securing the future of AI 에이전트” 블로그를 공개하며 AI 에이전트를 안전하게 관리하는 방법, 완벽하게 정렬되지 않은 AI로부터 내부 시스템을 보호하는 AI 제어 방법을 자세히 다뤘습니다. 기술 프레임워크인 에이전트 보안 3계층도 발표했습니다. 오픈AI 역시 “출시 전 배포 시뮬레이션을 통해 모델 동작을 예측한다”는 안전 연구 블로그를 공개했습니다. 페이블 사태 이후 기업들이 안전을 더 신경 쓴다는 이미지를 구축하는 모습입니다.

GPT-5.6 소문과 코덱스 신기능

GPT-5.6 및 5.6 프로에 대한 소문이 돌고 있습니다. 출시가 매우 유력한 날짜는 6월 25일 목요일이며, 페이블 5보다 약 다섯 배 저렴하고 2밀리언 토큰을 처리할 수 있을 것으로 예상됩니다. 에이전트 코딩 워크플로에서 페이블을 능가하고 웹사이트 디자인을 복사할 수 있다는 소문도 있습니다.

오픈AI는 코덱스의 레코드 앤 리플레이 기능을 공개했습니다. 사람이 작업하는 과정을 녹화하면 코덱스가 이를 인식해 작업 내용을 묶어 skill.md로 만들어 줍니다. 예를 들어 유튜브 업로드 작업을 한 번 보여주면 “유튜브 업로드” 스킬이 생기고, 이후 코덱스가 직접 마우스를 움직여 반복 작업을 자율 수행합니다. 또한 로컬 호스트와 원격 호스트 간 쓰레드를 넘겨주는 기능도 추가됐습니다. 컴퓨터에서 작업하던 것을 클라우드로 핸드오프하면, 컴퓨터를 끄거나 인터넷을 끊어도 리모트 박스에서 작업이 계속됩니다.

Mythos 논란과 앤트로픽 한국 진출

지난주 소개된 페이블 5(아마존 보고로 정지)와 관련해, Mythos가 NSA(미국 국가안보국)와 미국 사이버 사령부에 속한 거의 모든 기밀 시스템에 몇 시간 만에 침투했다는 내용이 공개됐습니다. 사이버 사령부가 위험을 확인해 정지시킨 것으로 보입니다. 또한 앤트로픽 Mythos 논란의 원인이 SK텔레콤이라는 이야기도 나옵니다. SK텔레콤은 의혹을 부인했으나, 위어드 보도에 따르면 백악관이 모델 차단을 명령하기 며칠 전 SK텔레콤의 Mythos 접근권 회수를 요구했고 그 배경에 중국 연계 의혹이 있었다고 합니다.

앤트로픽은 서울 사무소 공식 개소식을 열며 한국에 공식 진출했습니다. 한국의 1인당 클로드 사용량은 116개국 중 세계 평균의 3.5배에 달해, 클로드에 진심인 국가로 꼽힙니다.

미드저니 메디컬과 기타 소식

미드저니는 신모델 대신 메디컬 분야로 전환했습니다. 사람이 기계에 들어가면 초음파 스캐닝 장치가 신체 내부를 MRI·CT처럼 볼 수 있는 기기를 공개했고, 샌프란시스코 중심부에 초음파 검사를 해주는 스파도 연다고 합니다. 이미지 모델 경쟁에서 밀리는 감이 있던 미드저니가 의료 영역으로 턴한 셈입니다.

스페이스엑스는 90조원 전액 주식 교환 방식으로 커서를 인수했습니다. 컴퓨팅 파워 접근 부족으로 성장이 제약됐던 부분이 스페이스엑스의 막대한 컴퓨팅 파워와 합쳐지며, 그록 빌드를 통한 CLI 코딩 도구 등 코딩 쪽 발전이 기대됩니다. XAI는 그록 이매진 비디오 1.5 버전을 공개했는데, 속도가 두 배 빨라지고 움직임과 눈동자 표현이 자연스러워졌습니다. LTX는 오픈 소스 영상 생성 소타 자리에서 로라 훈련용 LTX 트레이너를 공개해, 인페인팅·아웃페인팅 학습으로 특정 물체를 바꾸거나 요소를 추가할 수 있게 됐습니다.

실전 가이드

영상에서 소개된 도구와 모델을 실제로 활용하려면 다음 과정을 따라볼 수 있습니다.

먼저 오픈웨이트 모델을 활용하려면 GLM-5.2를 다운받아 로컬 환경에 설치하는 것부터 시작합니다. MIT 라이선스라 상업적 활용도 가능하며, 메모리가 충분하지 않다면 2비트 양자화 버전(약 238GB, 82% 정확도 유지)을 고려하고 DGX 스파크 두 대 연결 같은 구성을 검토하면 좋습니다.

다음으로 반복 작업 자동화를 원한다면 코덱스의 레코드 앤 리플레이를 활용합니다. 자주 하는 작업(예: 파일 정리, 업로드)을 한 번 녹화해 skill.md로 만들어두면, 이후 코덱스가 직접 화면을 조작해 동일 작업을 자율 수행합니다. 작업 중 자리를 비워야 할 때는 원격 호스트로 쓰레드를 핸드오프해 컴퓨터를 꺼도 클라우드에서 작업이 이어지게 할 수 있습니다.

마지막으로 영상 생성이 필요하다면 그록 이매진 비디오 1.5로 제품 이미지 기반 광고 영상을 만들거나, LTX 2.3 오픈웨이트 모델에 LTX 트레이너로 로라를 학습시켜 인페인팅·아웃페인팅을 적용해볼 수 있습니다.

비판적 검토

영상은 매주 쏟아지는 방대한 AI 소식을 벤치마크 수치와 사용자 후기 등 구체적 근거와 함께 압축적으로 정리한다는 점이 강점입니다. 특히 GLM-5.2의 성능을 여러 벤치마크(인텔리전스 점수, 웹데브 아레나, 환각률, 디자인 아레나)로 다각도로 제시한 부분이 인상적입니다.

다만 GPT-5.6 출시일·성능, SK텔레콤 중국 연계 의혹 등 일부 내용은 영상에서도 “소문” 또는 “사실인지 알 수 없다”고 명시한 미확정 정보입니다. 실무에 적용하실 분들은 모델 성능 수치가 공식 벤치마크와 실제 사용 환경에서 차이가 날 수 있다는 점, 오픈웨이트 모델 구동에 상당한 하드웨어 자원이 필요하다는 점을 함께 고려하시길 권장합니다.

핵심 요점

  1. GLM-5.2는 MIT 라이선스 오픈웨이트 모델임에도 클로드 오퍼스 4.8·GPT-5.5급 성능을 내고 환각률(28%)이 클로즈드 모델보다 낮아, 로컬 AI의 전환점으로 평가받습니다.
  2. 양자화(2비트, 82% 정확도, 238GB)를 통해 개인이 고성능 모델을 로컬에서 구동할 수 있는 길이 넓어졌습니다.
  3. 코덱스 레코드 앤 리플레이는 반복 작업을 녹화→skill.md→자율 수행으로 자동화하며, 원격 호스트 핸드오프로 작업 연속성까지 확보합니다.
  4. 구글은 트랜스포머 논문 저자, 알파폴드 개발자 등 핵심 인재 유출과 안전 강조 블로그 공개라는 상반된 흐름을 동시에 보이고 있어, 페이블 사태 이후 안전 경쟁이 본격화되고 있습니다.
  5. GPT-5.6 출시 임박설(6월 25일 유력), 스페이스엑스의 커서 인수, 앤트로픽 한국 진출 등은 향후 모델 가격·코딩 도구·한국 시장 전략에 영향을 줄 장기적 변화 신호입니다.

참고자료

  • 조코딩의 바이브 코딩 1인 창업 책: https://www.yes24.com/product/goods/189855418
  • 조코헌트: https://jocohunt.jocoding.io/
  • AX 컨설팅 및 교육 문의: https://jocodingax.ai

Leave a Comment