800시간 자율 운용 데이터 기반의 실측 절약 방법.
800시간 운용 데이터로 밝혀진 토큰 소비 내역:
| 소비처 | 비율 | 대책의 효과 |
|---|---|---|
| CLAUDE.md / 지시문 | 15-30% | 200줄→35줄로 최대 50% 절감 |
| 파일 읽기 | 25-30% | read-budget-guard로 제어 가능 |
| 코드 생성 | 20-25% | 모델 선택으로 최적화 |
| 툴 스키마 / MCP | 12-20% | 미사용 MCP 비활성화 |
| 대화 이력 / compaction | 10-25% | /clear, /compact로 관리 |
CLAUDE.md는 매 턴 컨텍스트에 읽힌다. 100줄짜리 CLAUDE.md는 30턴 세션에서 약 75,000토큰을 소비한다.
# 최적화된 CLAUDE.md (35줄 예시)
# Project: my-app
## Rules
- Test before commit (hook enforced)
- No force-push (hook enforced)
- TypeScript strict mode
## Architecture
| Layer | Tech | Notes |
|-------|------|-------|
| API | Express + Zod | /src/api/ |
| DB | Prisma + Postgres | /prisma/ |
| Auth | JWT + bcrypt | /src/auth/ |
## Conventions
- Files: kebab-case
- Functions: camelCase
- One export per file
hook은 Claude Code의 동작을 감시하고 토큰 낭비를 방지한다.
# 10초 만에 설치
npx @gaebalai/cc-guard
| Hook | 효과 |
|---|---|
read-budget-guard | 파일 읽기 횟수를 제한. 같은 파일의 반복 읽기를 방지 |
token-budget-guard | 세션 내 토큰 소비에 상한선 설정 |
pre-compact-checkpoint | compaction 전 git checkpoint를 자동 생성. 환각으로 인한 헛수고 방지 |
context-monitor | 컨텍스트 사용률을 단계적으로 경고. 75%에서 주의, 90%에서 위험 |
token-budget-guard의 임계값을 기존 대비 70%로 설정하면 안전하다.
| 태스크 | 권장 모델 | 이유 |
|---|---|---|
| 일상적인 코딩 | Sonnet 4.6 | Opus의 1/5 비용. 대부분의 태스크에 충분 |
| 복잡한 설계 판단 | Opus 4.7 | 높은 추론 능력이 필요한 경우에만 |
| 서브 에이전트 | Haiku | 단순한 태스크에 고성능 모델은 불필요 |
/model 명령어로 세션 중 모델 전환 가능.
/clear: 태스크가 바뀌면 즉시 실행. 오래된 컨텍스트는 매 메시지마다 비용/compact: 긴 세션을 압축. 커스텀 지시도 가능: /compact 코드 변경점만 유지/mcp로 확인. 쓰지 않는 서버는 토큰을 낭비한다이 페이지는 개요다. 구체적인 설정 절차, before/after 데이터, 팀용 최적화, Opus 4.7 완전 대응의 상세 내용은:
View on GitHub머리말 + 제1장 "토큰은 어디로 사라지는가" 무료 공개 중
Max 20x도 1시간 만에 고갈됐다는 보고가 있다 (#23706). 대부분의 원인은 CLAUDE.md의 비대화, 서브 에이전트 남용, 불필요한 MCP 서버다. 위 대책으로 유효 이용 시간을 2-3배로 늘릴 수 있다.
새 tokenizer로 같은 입력에서 최대 35% 더 많은 토큰을 소비한다 (공식 문서). 또한 thinking token이 늘고 출력도 많다. 대책: effort level 조정 (/effort), 일상 태스크는 Sonnet으로 전환.
hook 실행 시간은 보통 10-50ms다. 토큰 절약 효과 (수천~수만 토큰/세션)와 비교하면 무시할 수 있다.