00 / 12
Programa Agencia IA 50K • MasterClass

Economia de Tokens
no Claude Code

Como reduzi 60-90% do custo operacional usando hooks, RTK, skills e memoria inteligente. Dados reais de 15 dias de operacao.

63%
Economia RTK
11.7M
Tokens Economizados
16
Hooks Ativos
83
Skills
Rafael Castro • ZX LAB • 09 Abril 2026
01 / 12
O Problema

O Claude Code consome tokens em cada interacao

Cada sessao carrega contexto fixo (boot tax), cada comando gera tokens de entrada e saida, e o cache replay multiplica tudo.

Sessoes/dia
44
Antes da otimizacao
Cache Read (15d)
1.9B
Tokens acumulados
Skills Carregadas
173
Boot tax alto
Bash Calls
8.027
Em 15 dias
Custo estimado sem otimizacao (plano Pro)
$200/mes
Baseado em 44 sessoes/dia * 1.9B cache read
02 / 12
Anatomia do Gasto

Como os tokens fluem no Claude Code

System Prompt
~8K
+
CLAUDE.md
~3K
+
MEMORY.md
~2K
+
Skills Index
~3K
|
Boot Tax: ~16K tokens por sessao
|
Historico da Conversa
5K - 500K
x
Mensagens
~50/sessao
|
Multiplicador: contexto cresce a cada turn
|
Codigo Gerado
~200
+
Explicacao
~300
+
Tool Calls
~150
|
RTK Filter
-63%
+
Boot Tax
-55%
+
Compact
-25%
=
Total Economia
60-90%
03 / 12
Estrategia

As 5 camadas de otimizacao

1. Boot Tax

Reduzir o que carrega em TODA sessao: CLAUDE.md, MEMORY.md, skills index. Menos overhead fixo = menos tokens repetidos.

90% concluido

2. RTK (Proxy CLI)

Interceptar TODOS os comandos bash e filtrar output desnecessario antes de voltar pro Claude. Binario Rust = zero overhead.

100% ativo

3. Hooks Inteligentes

16 hooks que interceptam acoes antes e depois da execucao: rewrite de comandos, protecao de deploy, validacao de edits.

100% ativo

4. Skills Reutilizaveis

83 skills que encapsulam workflows complexos em um unico comando. Ao inves de explicar tudo, executa /deploy-full.

85% organizado

5. Memoria + Compact

Sistema de memoria persistente para nao repetir contexto. /compact para limpar conversa sem perder estado. Dreaming periodico.

75% implementado

6. Agentes Paralelos

Substituir execucao sequencial por agentes paralelos. 3 agents simultaneos = 3x mais rapido, menos contexto acumulado.

100% padrao
04 / 12
Camada 2

RTK — Rust Token Killer v0.34.2

Proxy CLI em Rust que intercepta e filtra output de TODOS os comandos antes de voltar pro Claude.

Comandos Executados
1.800
Tokens Economizados
11.7M
63.1% de economia global
Oportunidades Restantes
1.8M
11.452 comandos otimizaveis

Top Comandos por Economia

rtk read
7.6M
rtk grep
2.3M
rtk ls
374K

Como Funciona

git status → Hook reescreve → rtk git status
RTK executa o comando real
Filtra linhas irrelevantes, trunca output
Claude recebe apenas o essencial
05 / 12
Camada 3

16 Hooks que protegem e economizam

Interceptam acoes ANTES e DEPOIS da execucao. Zero intervencao manual.

PreToolUse (Antes)

  • rtk-rewrite.sh — Reescreve bash → RTK
  • pre-whatsapp-guard.sh — Bloqueia duplicatas (30min)
  • pre-deploy-guard.sh — Bloqueia sem commit
  • pre-edit-protection.sh — Snapshot antes de editar
  • gsd-prompt-guard.js — Anti prompt injection
  • gsd-read-guard.js — Protege leitura
  • gsd-workflow-guard.js — Valida fluxo
  • gsd-validate-commit.sh — Valida commits

PostToolUse (Depois)

  • post-edit-validation.sh — Detecta regressoes
  • post-session-harvest.sh — Coleta insights
  • gsd-context-monitor.js — Alerta 35% contexto
  • gsd-phase-boundary.sh — Marca limites de fase

Session/Prompt

  • gsd-session-state.sh — Carrega estado anterior
  • gsd-check-update.js — Verifica atualizacoes
  • telegram-dedup.sh — Dedup mensagens
  • rename-session.sh — Renomeia sessao
Economia estimada por hooks
~5-10K tokens/sessao
Previnem erros que gastariam 10x mais para corrigir
06 / 12
Camada 1

Reducao do Boot Tax

Tudo que carrega em TODA sessao foi auditado e compactado.

MEMORY.md

154
69
linhas (-55%)

~/CLAUDE.md

117
69
linhas (-41%)

Arquivos de Memoria

33
10
entradas agrupadas

O que foi feito

  • /memory-dreaming — consolidacao periodica
  • 21 arquivos historicos → _archive/
  • Feedbacks agrupados por tema
  • CLAUDE.md auditado e compactado
  • Skills auditadas e categorizadas
  • 502 sub-skills desabilitadas
Boot tax por sessao
~16K
Antes
~6K
Depois
07 / 12
Visao Geral

Mapa Mental — Otimizacao de Tokens

Otimizacao de Tokens
Claude Code

1. Boot Tax Reduction

  • MEMORY.md 154 → 69 linhas (-55%)
  • CLAUDE.md 117 → 69 linhas (-41%)
  • 21 arquivos → _archive/
  • Feedbacks agrupados por tema
  • Skills auditadas (173 → categorias)

2. RTK (Rust Token Killer)

  • Versao 0.34.2
  • Proxy CLI transparente via hooks
  • 11.7M tokens economizados
  • 63.1% economia global
  • 1.800 comandos filtrados

3. Hooks Inteligentes

  • 16 mecanismos ativos
  • PreToolUse: rewrite, guards, validacao
  • PostToolUse: monitoring, harvest
  • SessionStart: state, updates
  • Anti-duplicata WhatsApp (30min)

4. Skills Reutilizaveis

  • 83 skills operacionais
  • Evitam reescrita de workflows
  • model: + effort: no frontmatter
  • Haiku para simples, Sonnet para complexo
  • Codificam correcoes bem-sucedidas

5. Memoria Inteligente

  • 4 tipos: user, feedback, project, reference
  • /memory-dreaming periodico
  • Protocolo em TODA sessao
  • Regra 10KB por arquivo
  • NUNCA duplicar memorias

6. Agentes Paralelos

  • SEMPRE paralelo, nunca sequencial
  • 2-3 Explore agents desde o inicio
  • Tasks para cada grupo de mudancas
  • Dividir arquivo grande em secoes
  • 3x mais rapido, menos contexto
08 / 12
Dados Reais

Relatorio Claude Code Insights

757 mensagens em 73 sessoes | 26/03 a 07/04/2026 | 10 dias de operacao

Mensagens
757
Linhas Geradas
+30.669
Arquivos Editados
305
Msgs/Dia
75.7

Ferramentas Mais Usadas

Bash
1.326
Read
547
Edit
423
Write
164
Agent
140

Multi-Clauding (Paralelo)

Sobreposicoes
47
Sessoes Envolvidas
53

Distribuicao Horaria

Tarde (12-18h)
344
Manha (6-12h)
288
Noite (18-24h)
125
09 / 12
Relatorio Real

Relatorio Token Optimizer

Skill /token-optimizer executada em 07/04/2026 — metricas de 15 dias

Sprints de Otimizacao

Sprint 1 — Boot Tax Concluido
  • MEMORY.md: 154 → 69 (-55%)
  • 21 arquivos → _archive/
  • Feedbacks agrupados (33 → 10)
  • CLAUDE.md: 117 → 69 (-41%)
Sprint 4 — Monitoramento Ativo
  • Skill /token-optimizer criada
  • Heartbeat check_claude_sessions()
  • Rodar semanalmente

Economia Projetada (4 Sprints)

SprintAcaoEconomia
1Boot Tax~35-40%
2Sessoes/Cache~20-25%
3Subagents~10-15%
TotalTodas as camadas~50-60%
Economia real RTK + Boot Tax combinados
60-90%
RTK (63%) + Boot Tax (55%) + Compact + Skills
10 / 12
Aplicacao Pratica

Como voce pode aplicar isso

Quick Wins (Hoje)

  • ⚡ Instalar RTK: cargo install rtk
  • ⚡ Configurar hook de rewrite no settings.json
  • ⚡ Auditar seu CLAUDE.md (meta: <80 linhas)
  • ⚡ Usar /compact a cada 50 mensagens
  • ⚡ Trocar Opus → Sonnet como default

Medio Prazo (Semana)

  • 🛠 Criar suas primeiras 5-10 skills
  • 🛠 Configurar hooks de protecao (deploy, edit)
  • 🛠 Implementar sistema de memoria
  • 🛠 Adotar agentes paralelos como padrao
  • 🛠 Monitorar com rtk gain semanal

Avancado (Mes)

  • 🚀 Criar skill /token-optimizer customizada
  • 🚀 /memory-dreaming periodico (2-3 semanas)
  • 🚀 GSD Framework para fases de projeto
  • 🚀 Self-healing agents (monitoramento auto)
  • 🚀 Multi-clauding com sessoes paralelas

Regra de Ouro

"Cada correcao bem-sucedida
vira uma skill reutilizavel."
Skills acumulam. Hooks protegem.
Memoria persiste. RTK filtra.
O resultado: operacao 10x mais eficiente.
11 / 12
Resultado

Antes vs Depois

Metrica Antes Depois Economia
MEMORY.md 154 linhas 69 linhas -55%
CLAUDE.md 117 linhas 69 linhas -41%
Boot Tax / sessao ~16K tokens ~6K tokens -62%
Output Bash (RTK) 18.5M tokens 6.8M tokens -63%
Feedbacks na memoria 33 entradas 10 agrupados -70%
Arquivos de memoria dispersos 21 arquivados Organizado
Economia Total Estimada 60-90%
Tokens Economizados (RTK)
11.7M
em 1.800 comandos
Ainda Otimizavel
1.8M
11.452 comandos
Skills Ativas
83
workflows reutilizaveis
12 / 12
Conclusao

Tokens sao dinheiro.
Otimize como tal.

O Claude Code e uma ferramenta poderosa, mas sem otimizacao voce esta pagando 2-3x mais do que precisa. Hooks, RTK, skills e memoria inteligente nao sao luxo — sao infraestrutura basica para quem opera IA profissionalmente.
RTK Filtra
63% de economia no output de comandos
🛡
Hooks Protegem
16 mecanismos previnem erros caros
📚
Skills Acumulam
83 workflows reutilizaveis
Programa Agencia IA 50K
Rafael Castro • ZX LAB
zxlab.com.br