Claude Code 토큰 절약 가이드

800시간 자율 운용 데이터 기반의 실측 절약 방법.

$13
개발자 1인당 일평균 비용
(공식 데이터)
$150-250
월간 비용/인
+35%
Opus 4.7의 토큰 증가
(신규 tokenizer)

1. 토큰은 어디서 소모되는가

800시간 운용 데이터로 밝혀진 토큰 소비 내역:

소비처비율대책의 효과
CLAUDE.md / 지시문15-30%200줄→35줄로 최대 50% 절감
파일 읽기25-30%read-budget-guard로 제어 가능
코드 생성20-25%모델 선택으로 최적화
툴 스키마 / MCP12-20%미사용 MCP 비활성화
대화 이력 / compaction10-25%/clear, /compact로 관리
최대의 발견: CLAUDE.md가 100줄을 넘으면 매 턴의 토큰 비용이 급증한다. 35줄 템플릿으로도 같은 효과를 얻을 수 있다는 사실이 밝혀졌다.

2. CLAUDE.md 최적화 (효과가 가장 큰 항목)

CLAUDE.md는 매 턴 컨텍스트에 읽힌다. 100줄짜리 CLAUDE.md는 30턴 세션에서 약 75,000토큰을 소비한다.

5가지 최적화 패턴

  1. 허용 리스트 방식: "~하지 마라" 나열 → "~만 허용"으로 변환
  2. 구체적인 예는 1개만: 3가지 예보다 1개의 정확한 예가 낫다
  3. 이유는 1줄: "왜"를 1줄로. 긴 설명은 Skill로 이동
  4. 테이블 형식: 글머리 기호보다 테이블이 토큰 효율이 높다
  5. hook에 위임: 강제 규칙은 CLAUDE.md가 아닌 hook으로 구현
# 최적화된 CLAUDE.md (35줄 예시)
# Project: my-app

## Rules
- Test before commit (hook enforced)
- No force-push (hook enforced)
- TypeScript strict mode

## Architecture
| Layer | Tech | Notes |
|-------|------|-------|
| API | Express + Zod | /src/api/ |
| DB | Prisma + Postgres | /prisma/ |
| Auth | JWT + bcrypt | /src/auth/ |

## Conventions
- Files: kebab-case
- Functions: camelCase
- One export per file

3. hook으로 토큰 낭비 자동 방지

hook은 Claude Code의 동작을 감시하고 토큰 낭비를 방지한다.

# 10초 만에 설치
npx @gaebalai/cc-guard

토큰 절약에 효과적인 hook

Hook효과
read-budget-guard파일 읽기 횟수를 제한. 같은 파일의 반복 읽기를 방지
token-budget-guard세션 내 토큰 소비에 상한선 설정
pre-compact-checkpointcompaction 전 git checkpoint를 자동 생성. 환각으로 인한 헛수고 방지
context-monitor컨텍스트 사용률을 단계적으로 경고. 75%에서 주의, 90%에서 위험
Opus 4.7 대책: 새 tokenizer로 같은 텍스트가 최대 35% 더 많은 토큰을 소비한다. token-budget-guard의 임계값을 기존 대비 70%로 설정하면 안전하다.

4. 모델 구분 사용

태스크권장 모델이유
일상적인 코딩Sonnet 4.6Opus의 1/5 비용. 대부분의 태스크에 충분
복잡한 설계 판단Opus 4.7높은 추론 능력이 필요한 경우에만
서브 에이전트Haiku단순한 태스크에 고성능 모델은 불필요

/model 명령어로 세션 중 모델 전환 가능.

5. 컨텍스트 관리

더 자세히 배우고 싶은 분께

이 페이지는 개요다. 구체적인 설정 절차, before/after 데이터, 팀용 최적화, Opus 4.7 완전 대응의 상세 내용은:

View on GitHub

머리말 + 제1장 "토큰은 어디로 사라지는가" 무료 공개 중

무료 진단: Token Checkup 비용 계산기 CLAUDE.md 분석

6. 자주 묻는 질문

Q: Max Plan ($200/월)인데도 토큰이 부족하다

Max 20x도 1시간 만에 고갈됐다는 보고가 있다 (#23706). 대부분의 원인은 CLAUDE.md의 비대화, 서브 에이전트 남용, 불필요한 MCP 서버다. 위 대책으로 유효 이용 시간을 2-3배로 늘릴 수 있다.

Q: Opus 4.7로 바꾸니 토큰 소비가 늘었다

새 tokenizer로 같은 입력에서 최대 35% 더 많은 토큰을 소비한다 (공식 문서). 또한 thinking token이 늘고 출력도 많다. 대책: effort level 조정 (/effort), 일상 태스크는 Sonnet으로 전환.

Q: hook을 넣으면 세션이 느려지지 않나?

hook 실행 시간은 보통 10-50ms다. 토큰 절약 효과 (수천~수만 토큰/세션)와 비교하면 무시할 수 있다.