De prompt engineering a context engineering

TL;DR

Prompt engineering é sobre a frase certa. Context engineering é sobre o ambiente informacional inteiro que cerca o agente: documentos retrieved, tool definitions, memória, histórico, system instructions, scratchpad. Karpathy resumiu em junho de 2025: “o LLM é a CPU, a janela de contexto é a RAM, e você é o sistema operacional responsável por carregar a informação certa para cada tarefa”. Em 2026, Anthropic chamou context engineering de “load-bearing skill” — a habilidade que sustenta tudo o que vem depois.

A evolução

graph LR
    A[2022-2023<br/>Prompt engineering<br/>'a frase certa'] --> B[2024<br/>RAG + system prompts<br/>'o documento certo']
    B --> C[2025<br/>Context engineering<br/>'o ambiente certo']
    C --> D[2026<br/>Context as architecture<br/>'a infraestrutura certa']
EraFocoMétrica de sucesso
Prompt engineeringWording, few-shot examples, técnicas de raciocínioResposta correta numa caixa de chat
RAGRecuperar documentos relevantesTop-k de qualidade
Context engineeringMontar dinamicamente o ambiente do modeloAgente robusto em sessões longas
Context as architectureTratar contexto como sistema versionado, governadoReprodutibilidade, auditoria

A definição operacional

Context engineering é a disciplina de decidir o que entra na janela de contexto, o que é comprimido, o que é recuperado on-demand, e o que é descartado.

Cinco fontes de contexto que coexistem:

  1. instructions — quem o agente é, regras
  2. Memória persistenteCLAUDE.md, AGENTS.md, fatos do usuário
  3. Histórico de conversa — o que foi dito até agora
  4. Tool definitions — schemas das ferramentas disponíveis
  5. Retrieval dinâmico — documentos, código, dados buscados durante a tarefa

Karpathy (junho de 2025)

“+1 for ‘context engineering’ over ‘prompt engineering’. People associate prompts with short task descriptions you’d give an LLM in your day-to-day use. When in every industrial-strength LLM app, context engineering is the delicate art and science of filling the context window with just the right information for the next step.”

Por que prompts não bastam

Em 2026, qualquer aplicação LLM séria precisa lidar com:

  • Sessões longas — agentes podem rodar por horas, milhões de tokens
  • Múltiplas fontes — código, docs, conversa, ferramentas, memória
  • Atenção finita — a janela cresce, mas a atenção do modelo dilui (03 - Context rot e atenção diluída)
  • Custo — cada token custa dinheiro e degrada qualidade (Economia de Tokens)
  • Estado — o que o agente já sabe, já tentou, já decidiu

Um prompt bem escrito não resolve nenhum desses problemas. Context engineering, sim.

A analogia do sistema operacional

Karpathy popularizou o framing em 2025:

Componente clássicoEquivalente em LLM agent
CPULLM (faz a “computação”)
RAMJanela de contexto
DiscoMemória persistente (arquivos, vector store)
Sistema operacionalVocê (decide o que carregar quando)
CachePrompt caching (Economia de Tokens)
Page faultsJust-in-time retrieval (06 - Dynamic retrieval beyond RAG)

A consequência: tratar contexto como recurso finito é começar a pensar como engenheiro de sistema, não como redator de prompts.

O que muda na prática

Antes (prompt engineering)Depois (context engineering)
“Preciso da frase mágica""Preciso da pipeline de montagem certa”
Trabalho one-shotTrabalho contínuo, evolutivo
Output: bom promptOutput: arquitetura de contexto + governança
Skill individualSkill de equipe (compartilhada via 11 - Skills e instructions como contexto)
Iteração: editar textoIteração: editar pipeline, tools, memória

Veja também

Referências

  • Andrej KarpathyTweet on context engineering (jun 2025).
  • AnthropicEffective context engineering for AI agents (2025).
  • BytebytegoA Guide to Context Engineering for LLMs (2026).
  • AtlanContext Engineering Framework for Enterprise AI (2026).