Compactação de histórico em agentes

TL;DR

Em sessões longas, o histórico cresce até explodir o contexto e o custo. Compactação substitui turns antigos por resumos densos. Claude Code faz isso automaticamente via /compact. Para agentes custom, use rolling summarization ou anchored state documents. Mantém os últimos 5-10 turns completos e sumariza o resto.

Como funciona

Rolling summarization

Manter últimos N turns completos + sumarizar blocos anteriores em ~2k tokens cada.

Anchored state document

Manter um “session state” continuamente atualizado com: objetivo, decisões, artefatos, problemas pendentes.

Gerenciamento Proativo de Sessão

Embora a compactação automática seja útil, ela costuma disparar tarde (ex: acima de 150k tokens). O desenvolvedor consciente pode economizar significativamente com ações manuais:

1. O comando `/clear`

Use o /clear sempre que mudar drasticamente de tarefa. Se você terminou de corrigir um bug no CSS e vai começar a refatorar o banco de dados, o histórico do CSS só servirá para inflar o custo do próximo passo. Mudar de tarefa = /clear.

2. O comando `/compact` proativo

Não espere o contexto ficar pesado. Se você percebe que a conversa está longa e os detalhes dos primeiros turnos já foram resolvidos, dispare o /compact manualmente. Uma meta saudável é manter o contexto abaixo de 100k tokens para sessões fluidas e baratas.

3. Evitar sessões de “8 horas”

Sessões maratonas são os maiores ralos de tokens. Mesmo com cache, o custo de re-processar o contexto a cada turno cresce linearmente. Prefira sessões curtas, focadas e frequentes.

Impacto

Observation masking

Remover turns de baixo valor: retries falhados, leituras de arquivos já modificados, explicações redundantes.

Impacto

Sessão 50 turns	Sem compactação	Com compactação
Input total	~2M tokens	~500k tokens
Custo (Sonnet)	~$6.00	~$1.50

Armadilhas

Sumarizar sem preservar decisões de design causa contradições futuras
Compactar turns recentes perde contexto útil — mantenha os últimos 5-10 completos

Veja também

Referências

Letta (MemGPT) — Tiered Memory Architecture (2026).
Anthropic — Claude Code Context Management (2026).

Codex Technomanticus

Explorador

Compactação de histórico em agentes

Compactação de histórico em agentes

Como funciona

Rolling summarization

Anchored state document

Gerenciamento Proativo de Sessão

1. O comando `/clear`

2. O comando `/compact` proativo

3. Evitar sessões de “8 horas”

Impacto

Observation masking

Impacto

Armadilhas

Veja também

Referências

Visão de gráfico

Sumário

Backlinks

Codex Technomanticus

Explorador

Compactação de histórico em agentes

Compactação de histórico em agentes

Como funciona

Rolling summarization

Anchored state document

Gerenciamento Proativo de Sessão

1. O comando /clear

2. O comando /compact proativo

3. Evitar sessões de “8 horas”

Impacto

Observation masking

Impacto

Armadilhas

Veja também

Referências

Visão de gráfico

Sumário

Backlinks

1. O comando `/clear`

2. O comando `/compact` proativo