Técnicas de prompting — zero-shot, few-shot, CoT, ToT

TL;DR

Prompt engineering virou subset de context engineering em 2026, mas as técnicas básicas continuam fundamentais: zero-shot (instrução direta sem exemplos), few-shot (instrução + 2-5 exemplos), chain-of-thought (CoT — peça raciocínio passo-a-passo), self-consistency (gera N respostas, vota), tree of thoughts (ToT — explora múltiplos caminhos), role prompting (você é X). Cada técnica tem caso de uso específico. Default sensato em 2026: zero-shot estruturado para tarefas simples; few-shot quando formato importa; CoT quando precisa raciocínio complexo (em modelos sem extended thinking).

Zero-shot — direto ao ponto

Classifique este ticket como bug, feature ou question:
"App crashou ao abrir."

Default para tarefas simples
Modelos modernos (Sonnet 4.6, GPT-5) já são fortes em zero-shot
Funciona quando: tarefa comum + descrição clara

Few-shot — exemplos no prompt

Classifique tickets:

"App crashou ao abrir." → bug
"Pode adicionar dark mode?" → feature
"Como faço backup?" → question

Classifique:
"Não consigo logar com Google" →

Use quando: formato específico, tarefa nicho, modelo precisa “calibrar”
2-5 exemplos é sweet spot (mais não ajuda)
Diversidade > quantidade
Custo: tokens extras em todo prompt → caro em volume

Chain-of-Thought (CoT) — pense antes de responder

Pergunta: João tem 5 maçãs. Comeu 2 e comprou mais 3. Quantas tem agora?

Pense passo a passo antes de responder.

LLM gera raciocínio explícito antes da resposta. Resultados em problemas matemáticos/lógicos sobem 20-50%.

Variantes:

Zero-shot CoT: “Let’s think step by step” (Kojima et al., 2022 — descoberta acidental que CoT funciona sem exemplos)
Few-shot CoT: mostra exemplos com raciocínio explícito
Auto-CoT: modelo escolhe quando precisa de CoT

CoT em 2026

Modelos com extended thinking (Claude 4+, o1) fazem CoT internamente, sem você pedir. Output não inclui o reasoning. Mais barato e cleaner. CoT explícito ainda útil em modelos sem thinking.

Self-consistency — vote em N respostas

def self_consistent(prompt, n=5):
    responses = [llm.generate(prompt, temp=0.7) for _ in range(n)]
    return majority_vote(responses)

Gera N respostas com temperature alta, escolhe a mais comum. Útil quando:

Tarefa é factual/objetiva (uma resposta certa)
Custo ×N é aceitável

Não vale para tarefas criativas (não há “correta”).

Tree of Thoughts (ToT)

LLM explora múltiplos caminhos de raciocínio, voltando atrás se chegou em dead end.

Branch A: "Se eu tentar X..."     → avalia
Branch B: "Mas se eu tentar Y..." → avalia
Best so far: B
Continue B → "Sub-branch B1..." → ...

Resultados em problemas tipo “Game of 24”, planning. Custo alto (LLM × 10-20 calls). Em produção, raro — geralmente não vale.

Role prompting

Você é um senior backend engineer reviewing Java code.
Foque em: concurrency bugs, resource leaks, security issues.

Define persona + skills. Modelo “se comporta” como o role.

Padrões:

“You are an expert {domain} {role}”
“Act as a {role} for {audience}”
“You are a {role} reviewing {artifact}”

Funciona bem em todos os modelos. Combina com tudo.

Structured output — formato como contrato

Responda em JSON:
{
  "category": "bug" | "feature" | "question",
  "confidence": 0-1,
  "reasoning": "..."
}

Em 2026, prefira structured outputs nativos:

# OpenAI / Anthropic structured outputs
response = client.chat.completions.create(
    response_format={"type": "json_schema", "json_schema": {...}}
)

Garantia de formato válido sem retry parsing.

Comparação rápida

Técnica	Quando usar	Custo	Ganho típico
Zero-shot	Tarefa comum	$	Baseline
Few-shot	Formato/estilo nicho	$$	+5-15%
CoT	Raciocínio complexo	$$	+10-30% (em problemas hard)
Self-consistency	Resposta objetiva, custo permite	$$$$$	+5-15%
ToT	Planning/games	$$$$$$$$	Variável
Role prompting	Sempre (combina com tudo)	$	Modulação útil
Structured output	JSON, classificação	$	Garantia de formato

Heurística para escolher

graph TD
    A["Tarefa"] --> B{"Tipo?"}
    B -->|"Classificação simples"| C["Zero-shot estruturado<br/>+ structured output"]
    B -->|"Formato específico"| D["Few-shot"]
    B -->|"Raciocínio complexo"| E{"Modelo tem<br/>extended thinking?"}
    E -->|sim| F["Zero-shot<br/>(thinking automático)"]
    E -->|não| G["CoT explícito"]
    B -->|"Crítico, custo OK"| H["Self-consistency"]
    B -->|"Planning"| I["ToT (raro)"]

System prompt — onde a mágica acontece

System prompt é a alavanca mais poderosa. Persistente, peso desproporcional.

Estrutura típica

[Role + persona]
You are a senior backend engineer.

[Behavior rules]
- Focus on: concurrency bugs, security issues
- Be direct; skip pleasantries
- Cite line numbers in feedback

[Output format]
- Markdown with ## sections
- One issue per section
- Confidence rating

[Constraints]
- If code is good, say so briefly
- Don't suggest stylistic changes unless asked

Boas práticas

Específico sobre formato > vago
Listas > parágrafos
Diga o que fazer + o que NÃO fazer
Restrições críticas no início e no fim (attention favorece bordas)

Skills — empacotando técnicas de prompting

Toda técnica acima é, no fundo, uma instrução que você escreve no prompt. O problema aparece quando a mesma combinação — um role, três exemplos few-shot, um formato de output, duas restrições — se repete em toda sessão. Copiar-colar isso a cada vez é prompting ad-hoc: funciona, mas não escala e desvia (drift) entre usos.

Uma skill é essa combinação formalizada: instruções + exemplos + formato + (às vezes) ferramentas, empacotados numa unidade versionada que o agente carrega sob demanda. É prompting estruturado e reutilizável — um prompt template com discovery e versionamento por cima.

	Prompt ad-hoc	Skill formalizada
Onde vive	Digitado na hora / colado no system prompt	Arquivo `SKILL.md` versionado
Reúso	Copy-paste	Carregada por nome, cross-project
O que empacota	Uma técnica isolada	Role + few-shot + CoT + output format juntos
Quando entra no contexto	Sempre que você cola	Só quando a tarefa ativa (lazy)

A skill é o "como", as técnicas são as "peças"

Uma skill code-review-security não inventa nada novo: ela embala role prompting (“você é um auditor de segurança”), few-shot (exemplos de findings), e um structured output (formato do relatório) numa receita só. Dominar as técnicas desta nota é pré-requisito para escrever boas skills.

Quando formalizar — ad-hoc, system prompt ou skill

Ad-hoc — uso único ou exploratório. Não vale formalizar.
System prompt — a regra vale para toda interação daquela sessão/persona (tom, formato padrão). Persistente, mas preso ao projeto/app.
Skill — o padrão é uma tarefa específica e recorrente, reutilizável entre projetos, e você quer que ele carregue só quando relevante (sem inflar o contexto base).

A árvore completa de decisão (skill vs AGENTS.md vs prompt hardcoded) e a anatomia do SKILL.md estão em 16 - Agent skills marketplace e SKILL.md; a distinção skill vs instruction de projeto, em 11 - Skills e instructions como contexto.

Anti-patterns de prompting

“Be concise” sem dizer quão conciso
Few-shot com 1 exemplo — muito poucos
Few-shot com 20 exemplos — context rot
CoT em tarefa simples — desperdício
Self-consistency em tarefa criativa — não há “majority”
Role muito vago (“você é útil”)
System prompt de 2K linhas — atenção dilui

Métricas

Métrica	Alvo
Accuracy em golden set (zero-shot)	Baseline
Accuracy ganho com few-shot	+5-15%
% prompts com structured output	>80% em produção
Tokens médios por prompt (system + user)	<2K para tarefas simples
Eval coverage (% prompts com golden set)	>80%

Veja também

Referências

Wei et al. — Chain-of-Thought Prompting (paper, 2022)
Kojima et al. — Large Language Models are Zero-Shot Reasoners (CoT zero-shot, 2022)
Wang et al. — Self-Consistency Improves Chain of Thought Reasoning (2022)
Yao et al. — Tree of Thoughts (paper, 2023)
Anthropic — Prompt Engineering Guide (docs)
promptingguide.ai — community guide

Codex Technomanticus

Explorador

Técnicas de prompting — zero-shot, few-shot, CoT, ToT

Técnicas de prompting — zero-shot, few-shot, CoT, ToT

Zero-shot — direto ao ponto

Few-shot — exemplos no prompt

Chain-of-Thought (CoT) — pense antes de responder

Self-consistency — vote em N respostas

Tree of Thoughts (ToT)

Role prompting

Structured output — formato como contrato

Comparação rápida

Heurística para escolher

System prompt — onde a mágica acontece

Estrutura típica

Boas práticas

Skills — empacotando técnicas de prompting

Quando formalizar — ad-hoc, system prompt ou skill

Anti-patterns de prompting

Métricas

Veja também

Referências

Visão de gráfico

Sumário

Backlinks