Compactação de histórico em agentes

TL;DR

Em sessões longas, o histórico cresce até explodir o contexto e o custo. Compactação substitui turns antigos por resumos densos. Claude Code faz isso automaticamente via /compact. Para agentes custom, use rolling summarization ou anchored state documents. Mantém os últimos 5-10 turns completos e sumariza o resto.

Como funciona

Rolling summarization

Manter últimos N turns completos + sumarizar blocos anteriores em ~2k tokens cada.

Anchored state document

Manter um “session state” continuamente atualizado com: objetivo, decisões, artefatos, problemas pendentes.

Gerenciamento Proativo de Sessão

Embora a compactação automática seja útil, ela costuma disparar tarde (ex: acima de 150k tokens). O desenvolvedor consciente pode economizar significativamente com ações manuais:

1. O comando /clear

Use o /clear sempre que mudar drasticamente de tarefa. Se você terminou de corrigir um bug no CSS e vai começar a refatorar o banco de dados, o histórico do CSS só servirá para inflar o custo do próximo passo. Mudar de tarefa = /clear.

2. O comando /compact proativo

Não espere o contexto ficar pesado. Se você percebe que a conversa está longa e os detalhes dos primeiros turnos já foram resolvidos, dispare o /compact manualmente. Uma meta saudável é manter o contexto abaixo de 100k tokens para sessões fluidas e baratas.

3. Evitar sessões de “8 horas”

Sessões maratonas são os maiores ralos de tokens. Mesmo com cache, o custo de re-processar o contexto a cada turno cresce linearmente. Prefira sessões curtas, focadas e frequentes.

Impacto

Observation masking

Remover turns de baixo valor: retries falhados, leituras de arquivos já modificados, explicações redundantes.

Impacto

Sessão 50 turnsSem compactaçãoCom compactação
Input total~2M tokens~500k tokens
Custo (Sonnet)~$6.00~$1.50

Armadilhas

  • Sumarizar sem preservar decisões de design causa contradições futuras
  • Compactar turns recentes perde contexto útil — mantenha os últimos 5-10 completos

Veja também

Referências

  • Letta (MemGPT)Tiered Memory Architecture (2026).
  • AnthropicClaude Code Context Management (2026).