00 / 12

Programa Agencia IA 50K • MasterClass

Economia de Tokens
no Claude Code

Como reduzi 60-90% do custo operacional usando hooks, RTK, skills e memoria inteligente. Dados reais de 15 dias de operacao.

63%

Economia RTK

11.7M

Tokens Economizados

16

Hooks Ativos

83

Skills

Rafael Castro • ZX LAB • 09 Abril 2026

01 / 12

O Problema

O Claude Code consome tokens em cada interacao

Cada sessao carrega contexto fixo (boot tax), cada comando gera tokens de entrada e saida, e o cache replay multiplica tudo.

Sessoes/dia

44

Antes da otimizacao

Cache Read (15d)

1.9B

Tokens acumulados

Skills Carregadas

173

Boot tax alto

Bash Calls

8.027

Em 15 dias

Custo estimado sem otimizacao (plano Pro)

$200/mes

Baseado em 44 sessoes/dia * 1.9B cache read

02 / 12

Anatomia do Gasto

Como os tokens fluem no Claude Code

Entrada (Input Tokens)

System Prompt

~8K

+

CLAUDE.md

~3K

+

MEMORY.md

~2K

+

Skills Index

~3K

|
Boot Tax: ~16K tokens por sessao
|

Cache Replay (a cada mensagem)

Historico da Conversa

5K - 500K

x

Mensagens

~50/sessao

|
Multiplicador: contexto cresce a cada turn
|

Saida (Output Tokens)

Codigo Gerado

~200

+

Explicacao

~300

+

Tool Calls

~150

|

Apos Otimizacao

RTK Filter

-63%

+

Boot Tax

-55%

+

Compact

-25%

=

Total Economia

60-90%

03 / 12

Estrategia

As 5 camadas de otimizacao

1. Boot Tax

Reduzir o que carrega em TODA sessao: CLAUDE.md, MEMORY.md, skills index. Menos overhead fixo = menos tokens repetidos.

90% concluido

2. RTK (Proxy CLI)

Interceptar TODOS os comandos bash e filtrar output desnecessario antes de voltar pro Claude. Binario Rust = zero overhead.

100% ativo

3. Hooks Inteligentes

16 hooks que interceptam acoes antes e depois da execucao: rewrite de comandos, protecao de deploy, validacao de edits.

100% ativo

4. Skills Reutilizaveis

83 skills que encapsulam workflows complexos em um unico comando. Ao inves de explicar tudo, executa /deploy-full.

85% organizado

5. Memoria + Compact

Sistema de memoria persistente para nao repetir contexto. /compact para limpar conversa sem perder estado. Dreaming periodico.

75% implementado

6. Agentes Paralelos

Substituir execucao sequencial por agentes paralelos. 3 agents simultaneos = 3x mais rapido, menos contexto acumulado.

100% padrao

04 / 12

Camada 2

RTK — Rust Token Killer v0.34.2

Proxy CLI em Rust que intercepta e filtra output de TODOS os comandos antes de voltar pro Claude.

Comandos Executados

1.800

Tokens Economizados

11.7M

63.1% de economia global

Oportunidades Restantes

1.8M

11.452 comandos otimizaveis

Top Comandos por Economia

rtk read

7.6M

rtk grep

2.3M

rtk ls

374K

Como Funciona

git status → Hook reescreve → rtk git status

RTK executa o comando real

Filtra linhas irrelevantes, trunca output

Claude recebe apenas o essencial

05 / 12

Camada 3

16 Hooks que protegem e economizam

Interceptam acoes ANTES e DEPOIS da execucao. Zero intervencao manual.

PreToolUse (Antes)

rtk-rewrite.sh — Reescreve bash → RTK
pre-whatsapp-guard.sh — Bloqueia duplicatas (30min)
pre-deploy-guard.sh — Bloqueia sem commit
pre-edit-protection.sh — Snapshot antes de editar
gsd-prompt-guard.js — Anti prompt injection
gsd-read-guard.js — Protege leitura
gsd-workflow-guard.js — Valida fluxo
gsd-validate-commit.sh — Valida commits

PostToolUse (Depois)

post-edit-validation.sh — Detecta regressoes
post-session-harvest.sh — Coleta insights
gsd-context-monitor.js — Alerta 35% contexto
gsd-phase-boundary.sh — Marca limites de fase

Session/Prompt

gsd-session-state.sh — Carrega estado anterior
gsd-check-update.js — Verifica atualizacoes
telegram-dedup.sh — Dedup mensagens
rename-session.sh — Renomeia sessao

Economia estimada por hooks

~5-10K tokens/sessao

Previnem erros que gastariam 10x mais para corrigir

06 / 12

Camada 1

Reducao do Boot Tax

Tudo que carrega em TODA sessao foi auditado e compactado.

MEMORY.md

154

→

69

linhas (-55%)

~/CLAUDE.md

117

→

69

linhas (-41%)

Arquivos de Memoria

33

→

10

entradas agrupadas

O que foi feito

✓ /memory-dreaming — consolidacao periodica
✓ 21 arquivos historicos → _archive/
✓ Feedbacks agrupados por tema
✓ CLAUDE.md auditado e compactado
✓ Skills auditadas e categorizadas
✓ 502 sub-skills desabilitadas

Boot tax por sessao

~16K

Antes

→

~6K

Depois

07 / 12

Visao Geral

Mapa Mental — Otimizacao de Tokens

Otimizacao de Tokens
Claude Code

1. Boot Tax Reduction

MEMORY.md 154 → 69 linhas (-55%)
CLAUDE.md 117 → 69 linhas (-41%)
21 arquivos → _archive/
Feedbacks agrupados por tema
Skills auditadas (173 → categorias)

2. RTK (Rust Token Killer)

Versao 0.34.2
Proxy CLI transparente via hooks
11.7M tokens economizados
63.1% economia global
1.800 comandos filtrados

3. Hooks Inteligentes

16 mecanismos ativos
PreToolUse: rewrite, guards, validacao
PostToolUse: monitoring, harvest
SessionStart: state, updates
Anti-duplicata WhatsApp (30min)

4. Skills Reutilizaveis

83 skills operacionais
Evitam reescrita de workflows
model: + effort: no frontmatter
Haiku para simples, Sonnet para complexo
Codificam correcoes bem-sucedidas

5. Memoria Inteligente

4 tipos: user, feedback, project, reference
/memory-dreaming periodico
Protocolo em TODA sessao
Regra 10KB por arquivo
NUNCA duplicar memorias

6. Agentes Paralelos

SEMPRE paralelo, nunca sequencial
2-3 Explore agents desde o inicio
Tasks para cada grupo de mudancas
Dividir arquivo grande em secoes
3x mais rapido, menos contexto

08 / 12

Dados Reais

Relatorio Claude Code Insights

757 mensagens em 73 sessoes | 26/03 a 07/04/2026 | 10 dias de operacao

Mensagens

757

Linhas Geradas

+30.669

Arquivos Editados

305

Msgs/Dia

75.7

Ferramentas Mais Usadas

Bash

1.326

Read

547

Edit

423

Write

164

Agent

140

Multi-Clauding (Paralelo)

Sobreposicoes

47

Sessoes Envolvidas

53

Distribuicao Horaria

Tarde (12-18h)

344

Manha (6-12h)

288

Noite (18-24h)

125

09 / 12

Relatorio Real

Relatorio Token Optimizer

Skill /token-optimizer executada em 07/04/2026 — metricas de 15 dias

Sprints de Otimizacao

Sprint 1 — Boot Tax Concluido

✓MEMORY.md: 154 → 69 (-55%)
✓21 arquivos → _archive/
✓Feedbacks agrupados (33 → 10)
✓CLAUDE.md: 117 → 69 (-41%)

Sprint 4 — Monitoramento Ativo

✓Skill /token-optimizer criada
✓Heartbeat check_claude_sessions()
○Rodar semanalmente

Economia Projetada (4 Sprints)

Sprint	Acao	Economia
1	Boot Tax	~35-40%
2	Sessoes/Cache	~20-25%
3	Subagents	~10-15%
Total	Todas as camadas	~50-60%

Economia real RTK + Boot Tax combinados

60-90%

RTK (63%) + Boot Tax (55%) + Compact + Skills

10 / 12

Aplicacao Pratica

Como voce pode aplicar isso

Quick Wins (Hoje)

⚡ Instalar RTK: cargo install rtk
⚡ Configurar hook de rewrite no settings.json
⚡ Auditar seu CLAUDE.md (meta: <80 linhas)
⚡ Usar /compact a cada 50 mensagens
⚡ Trocar Opus → Sonnet como default

Medio Prazo (Semana)

🛠 Criar suas primeiras 5-10 skills
🛠 Configurar hooks de protecao (deploy, edit)
🛠 Implementar sistema de memoria
🛠 Adotar agentes paralelos como padrao
🛠 Monitorar com rtk gain semanal

Avancado (Mes)

🚀 Criar skill /token-optimizer customizada
🚀 /memory-dreaming periodico (2-3 semanas)
🚀 GSD Framework para fases de projeto
🚀 Self-healing agents (monitoramento auto)
🚀 Multi-clauding com sessoes paralelas

Regra de Ouro

"Cada correcao bem-sucedida
vira uma skill reutilizavel."

Skills acumulam. Hooks protegem.
Memoria persiste. RTK filtra.
O resultado: operacao 10x mais eficiente.

11 / 12

Resultado

Antes vs Depois

Metrica	Antes	Depois	Economia
MEMORY.md	154 linhas	69 linhas	-55%
CLAUDE.md	117 linhas	69 linhas	-41%
Boot Tax / sessao	~16K tokens	~6K tokens	-62%
Output Bash (RTK)	18.5M tokens	6.8M tokens	-63%
Feedbacks na memoria	33 entradas	10 agrupados	-70%
Arquivos de memoria	dispersos	21 arquivados	Organizado
Economia Total Estimada	—	—	60-90%

Tokens Economizados (RTK)

11.7M

em 1.800 comandos

Ainda Otimizavel

1.8M

11.452 comandos

Skills Ativas

83

workflows reutilizaveis

12 / 12

Conclusao

Tokens sao dinheiro.
Otimize como tal.

O Claude Code e uma ferramenta poderosa, mas sem otimizacao voce esta pagando 2-3x mais do que precisa. Hooks, RTK, skills e memoria inteligente nao sao luxo — sao infraestrutura basica para quem opera IA profissionalmente.

⚡

RTK Filtra

63% de economia no output de comandos

🛡

Hooks Protegem

16 mecanismos previnem erros caros

📚

Skills Acumulam

83 workflows reutilizaveis

Programa Agencia IA 50K

Rafael Castro • ZX LAB

zxlab.com.br

Economia de Tokens no Claude Code

O Claude Code consome tokens em cada interacao

Como os tokens fluem no Claude Code

As 5 camadas de otimizacao

1. Boot Tax

2. RTK (Proxy CLI)

3. Hooks Inteligentes

4. Skills Reutilizaveis

5. Memoria + Compact

6. Agentes Paralelos

RTK — Rust Token Killer v0.34.2

Top Comandos por Economia

Como Funciona

16 Hooks que protegem e economizam

PreToolUse (Antes)

PostToolUse (Depois)

Session/Prompt

Reducao do Boot Tax

MEMORY.md

~/CLAUDE.md

Arquivos de Memoria

O que foi feito

Mapa Mental — Otimizacao de Tokens

1. Boot Tax Reduction

2. RTK (Rust Token Killer)

3. Hooks Inteligentes

4. Skills Reutilizaveis

5. Memoria Inteligente

6. Agentes Paralelos

Relatorio Claude Code Insights

Ferramentas Mais Usadas

Multi-Clauding (Paralelo)

Distribuicao Horaria

Relatorio Token Optimizer

Sprints de Otimizacao

Economia Projetada (4 Sprints)

Como voce pode aplicar isso

Quick Wins (Hoje)

Medio Prazo (Semana)

Avancado (Mes)

Regra de Ouro

Antes vs Depois

Tokens sao dinheiro.Otimize como tal.

Economia de Tokens
no Claude Code

Tokens sao dinheiro.
Otimize como tal.