클로드 코드 토큰 녹는 분들, 이 6가지만 바꿔보세요

클로드 코드를 사용하면서 토큰이 예상보다 훨씬 빨리 소진된다는 고민을 가진 분들이 많습니다. 이 글은 토큰이 녹는 구조적인 원인을 먼저 설명하고, 모델 설정부터 컨텍스트 관리, 프롬프트 습관까지 바로 적용할 수 있는 6가지 실전 팁을 제공합니다. 단순한 절약 요령이 아니라, AI가 토큰을 소비하는 원리를 이해하면 같은 플랜에서도 훨씬 더 오래, 더 잘 사용할 수 있습니다.

토큰이 녹는 구조적 원인: AI는 대화를 처음부터 끝까지 다시 읽는다

토큰 소진 문제를 이해하려면 AI가 어떻게 동작하는지 먼저 알아야 합니다. 카카오톡 단톡방을 예로 들면, 우리는 새 메시지만 읽지만 AI는 우리가 메시지를 보낼 때마다 그 대화방의 모든 내용을 처음부터 끝까지 다시 읽습니다. 한 달 전 내용이든 1년 전 내용이든 매번 전체를 읽고, 이 모든 것이 토큰입니다.

실제로 열 번째 프롬프트를 요청하면 AI가 이전 아홉 개의 요청과 아홉 개의 응답 전부를 다시 읽습니다. 프롬프트 하나를 보내는 비용이 처음과 끝이 완전히 다른 구조입니다. 결국 대화방에 무엇을 담고 있느냐가 비용을 결정하며, 이를 관리하는 기술을 컨텍스트 엔지니어링이라고 합니다.

컨텍스트를 관리하지 않으면 컨텍스트 롯이 발생합니다. 작업 A를 끝냈는데 치우지 않고 작업 B를 시작하면, A에서 읽었던 파일이나 에러 로그, 작업 결과 같은 잔재가 계속 남아 토큰을 잡아먹으면서 AI에게도 혼란을 줍니다. 이 혼란이 심해지면 AI는 할루시네이션을 겪게 되고, 오류를 수정하다가 다시 토큰을 소진하는 악순환이 반복됩니다.

플랜별 모델 사용 전략

토큰 소진의 가장 직접적인 원인 중 하나는 플랜에 맞지 않는 모델을 사용하는 것입니다. 오퍼스 모델은 소넷 대비 토큰을 네 배에서 다섯 배 더 소모합니다. 앤트로픽의 공식 수치(테크 크런치 기준)에 따르면 플랜별 사용량은 다음과 같습니다.

프로 플랜: 소넷 주당 40~80시간, 오퍼스는 매우 제한적
맥스 100달러 플랜: 소넷 주당 140~280시간, 오퍼스 주당 15~35시간
맥스 200달러 플랜: 소넷 주당 240~480시간, 오퍼스 주당 20~40시간

프로 플랜에서 오퍼스를 계속 쓰다가 2일 만에 주간 사용량의 80%가 찼다는 사례도 있습니다. 프로 플랜은 소넷을 위주로 사용하고 오퍼스는 정말 필요할 때만 써야 합니다.

팁 1: 모델 설정 확인 및 변경

현재 사용 중인 모델은 /model 명령어로 확인할 수 있습니다. 프로 플랜을 사용하는데 오퍼스로 설정되어 있다면 바로 변경이 필요합니다. 설정 파일에서 모델을 소넷으로 지정해두면 클로드 코드를 실행할 때마다 소넷으로 시작합니다.

오퍼스는 시니어 개발자, 소넷은 중급 개발자, 하이쿠는 주니어 개발자에 비유할 수 있습니다. 시니어 개발자에게 복사 붙여넣기를 시키는 건 낭비입니다. 작업 난이도에 맞는 모델을 선택하는 것이 핵심입니다.

팁 2: 오퍼스 플랜 설정 활용

설계는 오퍼스로, 코딩은 소넷으로 하고 싶다면 오퍼스 플랜 설정을 활용하면 됩니다. /model opus-plan 또는 설정 파일에서 오퍼스 플랜으로 설정하면, 계획 모드에서는 오퍼스를 쓰고 계획을 승인해 실행 모드로 넘어가면 자동으로 소넷으로 전환됩니다. 세션 중간에 모델을 바꾸고 싶다면 /model opus 또는 /model sonnet 명령어로 전환할 수 있습니다.

팁 3: 컨텍스트 관리 – 클리어, 리네임, 콤팩트

하나의 작업이 완료되면 /clear 명령어로 메시지를 초기화한 다음 다음 작업을 진행해야 합니다. 클리어 전에 /rename으로 세션 이름을 지정해두면, 나중에 해당 대화로 돌아가고 싶을 때 /resume 명령어로 쉽게 돌아갈 수 있습니다.

컨텍스트 윈도우가 가득 찼는데 대화를 계속 이어가야 한다면 /compact 명령어를 사용합니다. 대화 내용에서 무엇을 남기고 무엇을 버릴지 클로드가 판단하기 때문에, 반드시 유지해야 할 중요한 내용은 요약에 명시적으로 입력해야 합니다.

팁 4: 확장된 사고 기능 조절

눈에는 보이지 않지만 토큰을 꽤 잡아먹는 기능이 확장된 사고 기능입니다. 클로드가 답변하기 전에 깊이 생각하는 이 기능은 기본적으로 활성화되어 있으며 최대 3만 토큰을 넘게 사용합니다. 중요한 점은 이 생각 토큰이 출력 토큰으로 과금된다는 것입니다. 단순한 파일 수정인데도 클로드가 3만 토큰을 생각하는 데 쓸 수 있습니다.

이 옵션을 조절하고 싶다면 /config 명령어로 생각 기능을 끄거나, 환경 변수를 통해 예산을 낮출 수 있습니다.

팁 5: 구체적인 프롬프트 작성 습관

설정이나 명령어 없이 프롬프트 쓰는 습관만 바꿔도 토큰을 크게 절약할 수 있습니다. “이 코드를 개선해 줘”라고 하면 클로드가 프로젝트 전체를 탐색하며 파일을 이것저것 열어보고 분석합니다. 반면에 “해당 파일에 있는 로그인 함수에 입력값을 검증해 줘”처럼 구체적으로 요청하면 그 파일 하나만 열고 바로 작업합니다. 같은 결과인데도 토큰 차이가 수십 배가 날 수 있습니다.

팁 6: 클로드.md 파일 관리

클로드.md 파일 관리도 중요합니다. 공식 문서에서는 클로드.md 파일을 약 500줄 이하로 유지하라고 권장합니다. 나머지 내용은 스킬로 분리하면 됩니다. 클로드.md는 클로드 코드가 실행될 때 매 세션에서 로드되지만, 스킬은 필요할 때만 로드됩니다. 메모리 파일에는 핵심 규칙만 남기고 가끔 쓰는 상세 지식은 스킬로 분리하면 매 세션 기본 토큰 소모가 효과적으로 줄어듭니다.

지금 바로 적용하는 3단계

먼저 현재 모델 설정을 확인합니다. 클로드 코드에서 /model 명령어를 입력해 현재 설정된 모델을 확인합니다. 프로 플랜을 사용 중인데 오퍼스로 설정되어 있다면 즉시 설정 파일에서 모델을 소넷으로 변경합니다. 이 설정 하나만으로도 다음 세션부터 토큰 소모가 크게 줄어듭니다.

다음으로 작업 단위별 컨텍스트 초기화 습관을 만듭니다. 하나의 작업이 완료되면 /rename으로 세션 이름을 저장하고, /clear로 컨텍스트를 비운 다음 다음 작업을 시작합니다. 처음에는 번거롭게 느껴지지만, 이 습관이 토큰 낭비와 AI 오류 모두를 줄여줍니다.

마지막으로 클로드.md 파일을 점검합니다. 현재 클로드.md가 500줄을 넘는다면 자주 사용하지 않는 상세 지침을 별도 스킬 파일로 분리합니다. 매 세션 로드되는 파일의 크기를 줄이는 것만으로도 기본 토큰 소모가 줄어듭니다.

핵심 요점

AI는 매 요청마다 대화 전체를 처음부터 다시 읽는다. 작업 단위별로 컨텍스트를 비우는 습관이 토큰 절약의 기본입니다.
프로 플랜에서 오퍼스를 기본 모델로 쓰는 것은 낭비다. 설정 파일에서 소넷을 기본 모델로 지정하는 것이 가장 빠른 해결책입니다.
설계와 코딩에 다른 모델을 쓰고 싶다면 오퍼스 플랜 설정을 활용한다. 계획 모드에서는 오퍼스, 실행 모드에서는 소넷으로 자동 전환됩니다.
확장된 사고 기능은 눈에 보이지 않지만 최대 3만 토큰을 출력 토큰으로 소비한다. 단순한 작업에서는 /config로 생각 기능을 끄거나 예산을 낮추면 의미 있는 절약이 됩니다.
구체적인 프롬프트와 작은 클로드.md가 매 세션 토큰 소모를 줄인다. 범위를 좁혀 요청하고, 클로드.md는 500줄 이하로 유지하면서 상세 지침은 스킬로 분리합니다.