개요
Claude Code나 Cursor 같은 AI 코딩 도구를 사용하다 보면 컨텍스트 윈도우(200K 토큰)가 빠르게 소진되는 문제를 겪게 됩니다. 이 영상은 토큰 사용량을 최적화하는 네 가지 핵심 전략을 제시하며, 개발자가 더 효율적으로 AI 도구를 활용할 수 있는 실전 노하우를 공유합니다.
이 영상은 코드팩토리 채널의 실무 경험을 바탕으로 제작되었습니다. 채널 운영자는 한 달에 수천 달러치 토큰을 사용하며 Claude Code 완벽 가이드 서적을 출간할 정도로 해당 분야의 전문성을 갖추고 있으며, 실제 프로젝트에서 겪은 시행착오와 해결책을 투명하게 공유합니다.
핵심 내용
컨텍스트 윈도우 현황 파악하기
AI 코딩 도구를 효율적으로 사용하려면 먼저 현재 상태를 정확히 파악해야 합니다. Claude Code에서 /context 명령을 실행하면 토큰 사용 현황이 시각적으로 표시됩니다.
기본 세팅 상태에서 아무 메시지도 입력하지 않았는데 컨텍스트 윈도우의 약 36%가 이미 소진되어 있습니다. 시스템 프롬프트(1.4%), 시스템 툴, MCP 서버, 메모리 파일 등이 기본적으로 로드되기 때문입니다.
현재 Claude Code는 API와 달리 200K 토큰만 제공하므로(1M 토큰 미제공), 최적화 전략이 필수적입니다. 실제 사용 가능한 여유 공간(Free Space)이 63.8%에 불과하다는 점에서, 효율적인 토큰 관리는 선택이 아닌 필수입니다.
MCP 서버 최적화: 필요할 때만 로드하기
문제점: MCP(Model Context Protocol) 서버를 .mcp.json에 등록하면 세션 시작 시 모두 로드되어 10% 이상의 토큰을 소비합니다. 하지만 Playwright(테스팅용), shadcn(UI 생성용), FileCrawl(크롤링용) 등은 특정 작업 시에만 필요합니다.
해결책: 동적 MCP 로딩 전략을 사용합니다.
- 용도별 MCP 설정 파일 생성 (예:
shadcn-mcp.json,playwright-mcp.json) - Claude Code 실행 시
--mcp-config플래그로 특정 파일 지정 - 필요한 MCP만 로드하여 토큰 사용량을 10%에서 2%로 대폭 절감
이 방법으로 MCP 토큰 사용량을 약 80% 절감할 수 있습니다(10.4% → 2%).
CLAUDE.md 파일 최적화 전략
기본 원칙: CLAUDE.md는 프로젝트의 “목차”와 “아키텍처 지도” 역할을 해야 하며, 코드 예제나 상세 구현은 포함하지 않습니다.
포함해야 할 내용:
- 필수 준수 규칙 (Must Follow Rules)
- 개발 가이드 (사용 가능한 커맨드)
- 기술 스택 (Technology Stack)
- 디렉토리 구조 (인덱스 역할)
- 아키텍처 패턴 (레이어별 파일 생성 규칙)
요약 최적화 기법: CLAUDE.md 작성 후 AI에게 “정보 손실 없이 최대한 요약” 요청하면 200줄 분량을 115줄로 줄일 수 있습니다. 커밋 전 반드시 이 과정을 거치면 토큰 효율이 크게 향상됩니다.
Nested CLAUDE.md 전략: 서브디렉토리별로 별도의 CLAUDE.md 파일을 생성하여 상세 정보를 분산 저장합니다. 이렇게 하면 프로젝트 루트 CLAUDE.md는 간결하게 유지하고, 서브디렉토리 CLAUDE.md는 필요할 때만 로드할 수 있습니다.
시스템 프롬프트 활용: Output Style 설정
프롬프트 우선순위 체계:
- 시스템 프롬프트 (최고 우선순위, 항상 유지)
- 현재 유저 프롬프트 (높은 우선순위)
- 과거 유저 프롬프트 (낮은 우선순위)
시스템 프롬프트는 절대적으로 가장 높은 우선순위를 가지므로, 반복적으로 요청하는 규칙을 여기에 정의하면 매번 메시지에 포함할 필요가 없어집니다.
/output-style new 명령으로 커스텀 Output Style을 생성하여 언어 설정, Nested CLAUDE.md 읽기 규칙 등을 시스템 프롬프트에 포함시킬 수 있습니다.
Subagent 활용: 독립적인 컨텍스트 윈도우 확보
핵심 개념: Subagent는 메인 에이전트와 독립적인 200K 토큰 컨텍스트 윈도우를 가집니다. Subagent가 작업하는 동안 메인 에이전트의 토큰은 소비되지 않으며, 완료 후 결과만 메인 에이전트에게 보고합니다.
적용 시나리오:
- 반복 작업: 테스팅, 빌드, 린팅
- 규격화된 작업: shadcn 컴포넌트 생성
- 독립적 구현: 특정 모듈 개발
긴 작업을 여러 Subagent로 분산하고 메인 에이전트는 조율만 담당하면 컨텍스트 윈도우 부족 없이 대규모 프로젝트를 진행할 수 있습니다.
실전 가이드
1단계: 현재 상태 파악
터미널에서 /context 명령을 실행하여 토큰 사용 현황을 확인합니다. 각 영역(시스템 프롬프트, MCP 툴, 메모리 파일, 메시지)이 차지하는 비율을 파악하세요. 대략 2-3분 소요됩니다.
2단계: MCP 서버 정리
.mcp.json 파일을 열어 등록된 MCP 서버 목록을 확인합니다. 용도별로 MCP 설정 파일을 분리 생성하고(예: ui-mcp.json, test-mcp.json), --mcp-config 플래그로 필요한 것만 로드하는 습관을 들입니다.
3단계: CLAUDE.md 최적화
기존 CLAUDE.md를 열어 코드 예제, 과도한 설명, 중복 정보를 제거합니다. AI에게 “CLAUDE.md를 정보 손실 없이 요약해줘” 요청하여 간결화합니다. 서브디렉토리에 별도 CLAUDE.md를 생성해 상세 정보를 분산하고, 루트 CLAUDE.md에 “서브디렉토리 작업 시 해당 CLAUDE.md 읽기” 규칙을 추가합니다.
4단계: Output Style 설정
/output-style new 명령으로 커스텀 Output Style을 생성합니다. 반복적으로 요청하는 규칙(언어 설정, Nested CLAUDE.md 읽기 규칙 등)을 시스템 프롬프트에 포함시킵니다.
5단계: Subagent 활용
반복 작업(테스팅, 빌드)이나 독립적인 모듈 개발 시 Subagent를 적극 활용합니다. .claude/agents/ 폴더에 자주 사용하는 Subagent 템플릿을 만들어두고 필요할 때 호출하세요.
심층 분석
이 영상은 실무자의 경험을 기반으로 한 실용적인 조언을 제공하지만, 몇 가지 보완이 필요한 부분도 있습니다.
강점:
- 구체적인 토큰 절감 수치 제시 (MCP 10% → 2%, CLAUDE.md 200줄 → 115줄)
- 실제 명령어와 파일 구조를 화면으로 시연
- 단계별 실행 과정을 따라하기 쉽게 설명
보완 필요 사항:
- 팀 협업 시나리오: 여러 개발자가 함께 작업할 때 MCP 설정 파일과 Output Style을 어떻게 공유하고 동기화할지에 대한 가이드가 부족합니다.
- 성능 측정 방법: 최적화 전후 비교를 위한 구체적인 메트릭 수집 방법이 제시되지 않았습니다.
- 프로젝트 규모별 전략: 소규모 프로젝트(~10개 파일)와 대규모 프로젝트(1000개+ 파일)에서 최적화 전략이 어떻게 달라져야 하는지 차별화된 가이드가 필요합니다.
핵심 요점
- MCP는 필요할 때만 로드: 용도별 MCP 설정 파일을 만들고
--mcp-config플래그로 선택적 로드하면 토큰 사용량을 10%에서 2%로 줄일 수 있습니다. - CLAUDE.md는 목차이자 지도: 코드 예제를 제거하고 필수 규칙, 디렉토리 구조, 아키텍처 패턴만 간결하게 정리합니다. 200줄을 115줄로 요약하고, 서브디렉토리별 상세 CLAUDE.md를 만들어 정보를 계층적으로 분산하면 14,800 토큰을 7,600 토큰으로 절감할 수 있습니다.
- 시스템 프롬프트에 반복 규칙 정의:
/output-style new로 커스텀 Output Style을 만들어 언어 설정, Nested CLAUDE.md 읽기 규칙 등 반복 요청 사항을 시스템 프롬프트에 포함시키면 매번 메시지에 추가할 필요가 없습니다. - Subagent로 컨텍스트 분리: 테스팅, 빌드, 컴포넌트 생성 같은 독립 작업은 Subagent로 분리하면 메인 에이전트의 토큰을 소비하지 않습니다.
- 본질은 작업 단위 축소: 200K 토큰(약 7만 줄 코드)을 한 번에 읽어야 하는 상황이라면 작업을 잘못 나눈 것입니다. 최적화 기법도 중요하지만, 애초에 작은 단위로 개발하는 습관이 더 근본적인 해결책입니다.
이 글은 YouTube 자동 생성 자막(자막 추출일: 2025-12-17)을 바탕으로 작성되었습니다. 영상의 핵심 내용을 정리한 것이므로, 보다 완전한 이해를 위해서는 원본 영상 시청을 권장합니다.