IA — Formação Engenheiro de IA

Em 2026, IA deixou de ser especialização e virou literacia básica para qualquer senior dev. Coding agents fazem parte do dia a dia em times sérios; features de IA aparecem em praticamente todo projeto novo. Este domínio é a formação completa — programa estruturado de 17 trilhas atomizadas + 1 trilha tronco (AI Engineering Stack) + 4 sendas transversais que cobrem desde “o que é um LLM” até “como construir MCP server seguro e passar em auditoria de EU AI Act”. Cada trilha é independente e completa; juntas, formam a stack de competências que diferencia engenheiros que usam IA dos que dominam IA. O AI Engineering Stack é o tronco integrador — uma “tabela periódica” das camadas em sistemas de IA — que conecta as trilhas em uma vista de cima.

Como usar este portal

  • Sequencial se está começando do zero — segue ordem dos módulos
  • Por senda se já tem base — Praticante / Arquiteto / Líder Técnico / Open Source
  • Por tópico se busca solução concreta — pule para a trilha relevante
  • Por overview se quer panorâmica — leia este index inteiro (~30 min)

Pré-requisitos

Engenheiro de software atuante. Não exige expertise prévia em IA — Trilha 1 começa do zero. Já trabalha com IA? Pule para a senda que melhor encaixa no seu papel.

O que é IA — overview

Inteligência Artificial é o campo que desenvolve sistemas capazes de realizar tarefas que historicamente requeriam inteligência humana. Em 2026, quando alguém diz “IA”, normalmente está falando de Generative AI baseada em Large Language Models — mas isso é a ponta de um iceberg.

Para um senior fullstack, IA atua em três eixos:

  1. IA como ferramenta de produtividade — Usar ferramentas como Copilot, Claude Code, Cursor, ChatGPT e Gemini para desenvolver software mais rápido e com qualidade. Coding agents, autocomplete, code review, geração de testes — tudo isso é parte do kit básico.
  2. IA como feature de produto — integrar LLMs via API em aplicações: chatbots, classificadores, RAG, agents especializados. Quase todo projeto novo sério tem alguma feature de IA, e o engenheiro de IA é quem projeta a arquitetura dessa integração, escolhe modelos, define o pipeline de contexto, e garante que a feature seja robusta e escalável.
  3. IA como infraestrutura — escolher modelos, gerenciar custos, observabilidade, evaluation, segurança, governance. LLMs são dependências estocásticas com saídas não tipadas — sem disciplina operacional, o risco de falhas catastróficas é alto.

Você não precisa ser ML engineer. Precisa ser fluente o suficiente para conversar com data scientists, tomar decisões de arquitetura em features com IA, e não ser enganado por buzzwords.

Hierarquia dos conceitos

Inteligência Artificial (campo amplo, 1950+)

├── Rule-Based Systems (IA simbólica clássica)
│   └── Expert Systems, lógica formal

└── Machine Learning (aprender com dados, anos 80+)

    ├── Supervised Learning (entrada + label)
    │   ├── Classification: spam, imagem, sentimento
    │   └── Regression: prever preço, idade, demanda

    ├── Unsupervised Learning (sem labels)
    │   ├── Clustering: segmentação de usuários
    │   ├── Dimensionality reduction: PCA, t-SNE
    │   └── Anomaly detection: fraude

    ├── Reinforcement Learning (recompensa via ação)
    │   └── AlphaGo, robótica, RLHF em LLMs

    └── Deep Learning (redes neurais profundas, 2012+)

        ├── CNNs — visão computacional
        ├── RNNs/LSTMs — sequências (obsoletos p/ texto)
        ├── Transformers (2017) — revolução
        │   │
        │   └── Generative AI (2020+)
        │       ├── LLMs — GPT, Claude, Gemini, Llama
        │       ├── Diffusion — DALL-E, Stable Diffusion, Sora
        │       └── Multimodal — GPT-4o, Claude 4, Gemini 2.5

        └── Embeddings — representação vetorial

Conceitos fundamentais cobertos em deep dive

Tipos de aprendizado, training/validation/test, overfitting, métricas (precision, recall, F1), tokens e embeddings, context window, temperature/sampling, pretraining→SFT→RLHF, fine-tuning vs RAG vs prompting, transformer e attention — tudo coberto em Anatomia dos LLMs (Trilha 1).

Glossário

Você poderá usar op Dicionário de IA para adicionar items ao glossário e para referenciar esses items: Ex: LSTM

O que diferencia um senior em IA

As 10 marcas de senioridade

  1. Entende a hierarquia IA → ML → DL → GenAI → LLMs e sabe em qual nível um problema vive. Nem tudo que parece “IA” precisa de LLM.
  2. Pensa em economia de tokens e latência como pensa em queries SQL. Prompt eficiente, caching, modelo certo, batch vs streaming.
  3. Sabe quando NÃO usar LLM. Classificação simples com regex, regras de negócio determinísticas, validação — LLM é overkill.
  4. Distingue prompt engineering, context engineering, RAG e fine-tuning — escolhe a ferramenta certa antes de escrever código.
  5. Trata outputs de LLM como input não confiável — valida, testa, tem fallback, não confia em JSON “parece certo”.
  6. Entende limitações reaisalucinação, knowledge cutoff, context rot, não-determinismo — e desenha sistemas que sobrevivem a elas.
  7. Pratica evaluation sistemática. Golden sets, regression tests, métricas — não “rodei 5 testes manuais”.
  8. Pensa em segurança: prompt injection, data leakage, PII em logs, jailbreaks, supply chain (slopsquatting).
  9. Domina pelo menos uma stack a fundo (Claude Code + MCP + skills) em vez de ser “ok em tudo, expert em nada”.
  10. Sabe explicar em inglês claro para stakeholders: trade-offs de custo, risco, acurácia, latência.

Visão geral — 17 trilhas + tronco

graph TB
    M_STACK["🗺️ AI Engineering Stack<br/>(13 notas — tronco)"]

    M1["📐 1. Anatomia dos LLMs<br/>(19 notas)"]
    M2["🤖 2. Anatomia de Agents<br/>(10 notas)"]
    M3["💻 3. Agentes de Codificação<br/>(18 notas)"]
    M4["💰 4. Economia de Tokens<br/>(22 notas)"]
    M5["🌍 5. Context Engineering<br/>(16 notas)"]
    M6["📋 6. Spec-Driven Development<br/>(12 notas)"]
    M7["🛡️ 7. Segurança e Guardrails<br/>(12 notas)"]
    M8["🧠 8. Memória de Agentes<br/>(24 notas)"]
    M9["🔍 9. RAG e Vector Databases<br/>(13 notas)"]
    M10["🔌 10. MCP<br/>(10 notas)"]
    M11["🪄 11. Prompt Engineering<br/>(9 notas)"]
    M12["📐 12. Structured Outputs<br/>(8 notas)"]
    M13["✅ 13. Evaluation<br/>(8 notas)"]
    M14["🖼️ 14. Multimodal Prompting<br/>(7 notas)"]
    M15["🎨 15. Image Prompting<br/>(7 notas)"]
    M16["🔭 16. Observability<br/>(8 notas)"]
    M17["🔁 17. Improvement Loop<br/>(7 notas)"]

    M_STACK -.organiza.-> M1
    M_STACK -.organiza.-> M2
    M_STACK -.organiza.-> M5
    M_STACK -.organiza.-> M9
    M_STACK -.organiza.-> M10
    M_STACK -.organiza.-> M11
    M_STACK -.organiza.-> M12
    M_STACK -.organiza.-> M13
    M_STACK -.organiza.-> M16
    M_STACK -.organiza.-> M17

    M1 --> M11
    M11 --> M5
    M11 --> M12
    M1 --> M14
    M14 --> M15
    M1 --> M2
    M2 --> M3
    M3 --> M4
    M5 --> M8
    M9 -.complementa.-> M5
    M10 -.complementa.-> M2
    M13 -.cross-cutting.-> M2
    M13 -.cross-cutting.-> M9
    M16 --> M17
    M13 --> M17

Setas sólidas = pré-requisito recomendado. Tracejadas = relação complementar ou organização. AI Engineering Stack é o tronco integrador (camadas que organizam as 17 trilhas); as 17 trilhas formam o programa completo de aprendizado.

As 17 trilhas + tronco

Tronco integrador

AI Engineering Stack (13 notas — tronco)

“A tabela periódica das camadas em sistemas de IA — onde cada trilha do Codex encaixa.”

As 11 camadas que compõem um sistema com LLM em produção — Purpose, Prompt, Context, Output, Retrieval, Tool, Workflow vs Agent, Evaluation, Guardrail, Logging e Improvement. Cada camada é uma decisão arquitetural com responsabilidades próprias; cada trilha do Codex aprofunda uma ou mais delas. A nota 13 (Setup completo) costura tudo em um exemplo end-to-end.

Quando ler: após Trilhas 1-2, antes (ou durante) projeto novo do zero. Funciona como blueprint arquitetural e mapa de aprofundamento — não substitui as trilhas específicas, organiza-as.

Núcleo da formação (sequencial)

Trilha 1 — Anatomia dos LLMs (19 notas)

“Antes de orquestrar agentes, entenda os blocos.”

Tokens, atenção, modelos em produção (incluindo chineses), APIs, pricing, reasoning, treino (pretraining/SFT/RLHF), evaluation, fine-tuning (vs RAG e na prática — LoRA/QLoRA/DPO), compressão (quantização/destilação), futuro.

Quando ler: sempre. É o alicerce.

Trilha 2 — Anatomia de Agents (10 notas)

“Agents são LLM + tools + loop com autonomia.”

O que define agent (vs chat, RAG, workflow), loop ReAct, native tool use, design de tools, memory, planning, multi-agent, frameworks 2026, patterns canônicos, evaluation, e Workflow vs Agent — quando usar cada um.

Quando ler: após Trilha 1. Fundamentos genéricos antes de coding agents específicos.

Trilha 3 — Agentes de Codificação (18 notas)

“De autocomplete a agentes autônomos — o panorama das ferramentas.”

Filosofia (vibe vs disciplina, comprehension gate), os players (Cursor, Claude Code, Copilot, Windsurf, Devin, Gemini CLI), open source (OpenCode, Aider, modelos chineses), workflows (AGENTS.md, MCP, multi-agent, benchmarks).

Quando ler: após Trilhas 1-2. Onde a teoria vira prática diária.

Aprofundamento

Quer ir além do overview comparativo? Trilha Claude Code cobre em profundidade: mental model, configuração, hooks, skills/MCP, workflows e automação em 6 galhos (~50 notas).

Trilha 4 — Economia de Tokens (22 notas)

“Cada token custa dinheiro — entenda como gastar menos sem perder qualidade.”

Em 5 blocos: o problema, reduzir input (caching, pruning, compression, compaction), arquitetura econômica (routing, sub-agents, semantic cache, batch), output (concisas, thinking budget), governança (orçamento, auditoria, ROI, playbook, planos, futuro).

Quando ler: após Trilha 3 — para parar de queimar dinheiro.

Trilha 5 — Context Engineering (16 notas)

“A disciplina que substituiu prompt engineering.”

Em 5 blocos: fundamentos (context rot, 4 pilares), arquitetura (pipelines, camadas, JIT retrieval, compressão), memória e estado (self-editing, multi-agent, structured files, AGENTS.md), produção (guardrails, entropia, setup), prompting e skills (técnicas, SKILL.md marketplace).

Quando ler: após Trilha 1, paralelo a Trilhas 2-3. Karpathy: “the load-bearing skill of 2026”.

Trilha 6 — Spec-Driven Development (12 notas)

“Specs como contrato executável — resposta da indústria ao tech debt do vibe coding.”

O problema do vibe coding (Veracode 45%), pipeline (Specify → Plan → Tasks → Implement → Validate), ferramentas (Kiro, Spec Kit, OpenSpec, Tessl), prática (multi-agent CIV, integração, roadmap, debates).

Quando ler: após Trilha 5. Spec é a camada superior do contexto.

Trilha 7 — Segurança e Guardrails (12 notas)

“Código gerado por IA é untrusted por padrão. Defesa em profundidade não é opcional.”

O problema (45% Veracode, slopsquat, alucinações), defesa (pirâmide de validação, SAST/SCA, sandboxing, prompting), processo (review, testes imutáveis, métricas), compliance (EU AI Act 2 ago 2026, GDPR, roadmap).

Quando ler: antes de levar AI agents para produção. Não depois.

Trilhas especializadas (paralelas)

Trilha 8 — Memória de Agentes (24 notas)

“Como agentes lembram entre sessões — taxonomia, players, e guia de implementação.”

Fundamentos, taxonomia (episódica/semântica/procedural), RAG vs memória, panorama (Letta, Mem0, Zep, MemPalace, A-MEM), implementações (Karpathy gist, basic-memory MCP, Generative Agents Stanford), surveys 2026, críticas, guia.

Quando ler: complementa Trilha 5. Específico para agentes com estado persistente.

Trilha 9 — RAG e Vector Databases (13 notas)

“Quase toda aplicação séria com LLM em 2026 tem RAG no caminho.”

O que é RAG e quando usar, anatomia do pipeline, embeddings, chunking (50% da qualidade), vector databases (pgvector/Pinecone/Qdrant), retrieval (hybrid + BM25 + query rewriting), reranking, generation com citação, evaluation (Ragas), RAG vs long context vs fine-tuning, padrões avançados (Graph RAG, Agentic RAG), setup completo.

Quando ler: quando precisa que LLM use conhecimento específico que não cabe no prompt.

Trilha 10 — MCP (10 notas)

“USB-C para agents de IA.”

O que é MCP, primitivos (Tools/Resources/Prompts), arquitetura cliente-servidor, servers oficiais, construindo MCP server local, MCP remoto (HTTP+SSE), segurança, ecossistema 2026, casos comuns, setup + best practices.

Quando ler: depois da Trilha 2. Crucial para integrar agents com sistemas externos de forma padronizada.

Núcleo expandido — técnica de prompt e output

Trilha 11 — Prompt Engineering (9 notas)

“Não morreu — virou camada bem-definida dentro de um sistema maior.”

A tese “prompt engineering morreu” mal-lida, especificidade como primeira disciplina, roles e personas, o mega-prompt do Karpathy (anti-sycophancy), few-shot examples, constraints declarativas, iteration patterns, reasoning models e o catálogo de anti-patterns que denunciam IA.

Quando ler: após Trilhas 1 e 5. Aprofunda o Prompt Layer do AI Engineering Stack — onde Context Engineering é o superset, esta é a camada interna afiada.

Trilha 12 — Structured Outputs (8 notas)

“LLMs são funções estocásticas com saída não tipada — structured outputs recria contrato de tipo na borda.”

O problema do output não estruturado, JSON Schema como contrato, function calling como mecanismo de output, OpenAI Structured Outputs (strict mode), Anthropic tool use para forçar formato, Gemini structured output, validação semântica + retry (Pydantic, Zod), streaming de structured outputs.

Quando ler: após Trilha 1, em paralelo a Trilha 11. Indispensável quando o output do LLM alimenta código a jusante.

Núcleo expandido — visão e geração visual

Trilha 14 — Multimodal Prompting (7 notas)

“Modelos de fronteira já são multimodais — o gargalo é o engenheiro ainda dar só texto.”

O salto multimodal e por que importa, imagens como input (screenshots, charts, mockups), PDFs e documentos, áudio e vídeo (Whisper, Gemini Live), tabelas e spreadsheets, como dizer ao modelo o tipo de leitura desejado, limites e armadilhas multimodais.

Quando ler: após Trilha 1 (nota 05 — panorama 2026). Quando o input não cabe em texto puro — PDF longo, screenshot de UI, áudio, vídeo.

Trilha 15 — Image Prompting (7 notas)

“Deliverable-first, não scene-first.”

Image prompting como engenharia (entregável > arte), modelos de imagem 2026 (DALL-E, Imagen, Midjourney, FLUX, SD), anatomia do prompt visual (canvas, composição, estilo, texto), templates por entregável (poster, infográfico, mockup, thumbnail), iteração visual com controlled changes, geração de diagramas técnicos.

Quando ler: quando precisa de assets visuais reprodutíveis — hero do README, thumbnail, mockup, infográfico. Auto-contida.

Núcleo expandido — qualidade, ops e melhoria contínua

Trilha 13 — Evaluation (8 notas)

“Sem evals, você tem demo — não produto.”

Eval-driven development como disciplina, construção (golden datasets, scoring rubrics, LLM-as-judge), operação (regression testing, frameworks 2026 — Promptfoo/Braintrust/Langfuse/Patronus/Phoenix, eval em CI/CD), e especialização por contexto (LLM, RAG, agent, prompt). Tronco mestre de evaluation; complementa as notas contextuais em Anatomia dos LLMs/17, Anatomia de Agents/09, RAG/09.

Quando ler: quando começar a iterar LLM em produção. Tarde demais é depois do primeiro incidente de regressão silenciosa.

Trilha 16 — Observability (8 notas)

“APM tradicional foi desenhado pra HTTP — não pra chamadas com 12k tokens, 3 tools e raciocínio invisível.”

Por que LLMs precisam de stack separada, anatomia de um trace LLM (sessão/trace/span, OpenTelemetry GenAI semantic conventions), Langfuse como referência OSS, alternativas (Helicone, Phoenix, OpenLLMetry), versionamento de prompts, session replay e debugging, métricas que importam (P50/P95/P99, TTFT, cost per user), e privacy/PII em logs.

Quando ler: antes do primeiro deploy em produção, junto com Trilha 13. Complementa 04 (ângulo de custo).

Trilha 17 — Improvement Loop (7 notas)

“One-shot prompt é tabu — sistema melhora em loop fechado.”

O ciclo eval → diff → ship, A/B testing de prompts, prompt versioning (semver pra prompts), champion-challenger em produção, auto-prompt optimization (DSPy, APE, OPRO), capturando feedback do usuário como sinal, eval gates em CI. Senta em cima de Evaluation (sinal) e Observability (detalhe), traduzindo ambos em mudanças versionadas, testadas e promovidas.

Quando ler: depois de Trilhas 13 e 16 — sem eval e observability no lugar, não há loop a fechar.

Sendas transversais

Caminhos especializados pelos módulos, calibrados por papel/objetivo. Cada senda é uma fração da formação completa, suficiente para o foco específico.

🛠️ Senda do Praticante (15-20h)

“Sou IC, programo todo dia, quero usar IA com qualidade hoje.”

Trilha 1: 01-03 (LLM, tokens, janela)
Trilha 2: 01-02 (agent, loop ReAct)
Trilha 3: 04-05 (Cursor, Claude Code), 16 (loop agentic)
Trilha 4: 01, 05 (problema, caching), 13 (respostas concisas), 18 (playbook)
Trilha 5: 11 (skills/AGENTS.md), 14 (setup completo), 15-16 (prompting + skills)
Trilha 11: 02 (especificidade), 07 (iteration patterns)
Trilha 12: 03 (function calling como mecanismo de output)

Saída: Cursor/Claude Code com disciplina, AGENTS.md configurado, custo controlado, output do LLM validado por contrato.

🏛️ Senda do Arquiteto (30-40h)

“Sou tech lead / staff. Preciso desenhar sistemas com IA.”

Trilha 1: 03-04, 07, 09 (janela, atenção, MoE, APIs)
Trilha 2: 04-06, 10 (memory, planning, multi-agent, workflow vs agent)
Trilha 5: 04-06, 13 (pipelines, camadas, JIT, entropia)
Trilha 4: 09-11 (routing, sub-agents, semantic cache)
Trilha 9: 02, 06-07, 11 (anatomia, retrieval, rerank, padrões avançados)
Trilha 10: 03, 06 (arquitetura, HTTP+SSE)
Trilha 6: 02, 04-07 (SDD pipeline)
Trilha 7: 04-06 (pirâmide, SAST, sandbox)
Trilha 8: 06, 08, 22 (LLM Wiki, arquitetura, guia)
Trilha 11: 04, 08 (mega-prompt Karpathy, reasoning audit-trail)
Trilha 12: 02-04 (JSON Schema + OpenAI strict + Anthropic tool use)
Trilha 13: 01, 03, 06 (EDD, rubrics, frameworks 2026)
Trilha 16: 02, 03, 05 (trace, Langfuse, versioning)
Trilha 17: 01, 04 (ciclo, champion-challenger)
AI Engineering Stack: 01, 13 (visão geral das 11 camadas + setup completo)

Saída: capaz de projetar pipeline de contexto, escolher arquitetura de memória, especificar guardrails, decompor sistemas complexos com agentes, e operar evals + observability + loop de melhoria contínua em produção.

👔 Senda do Líder Técnico (20-25h)

“Sou eng manager. Preciso decidir adoção, métricas e governança.”

Trilha 1: 05, 10, 15 (panorama, pricing, futuro)
Trilha 2: 01, 08-09 (definição, patterns, evaluation)
Trilha 3: 01-03, 18 (autocomplete→agentes, vibe vs disciplina, comprehension gate, benchmarks)
Trilha 4: 04, 17-19 (monitoramento, ROI, playbook, planos)
Trilha 7: 08, 10-12 (code review, métricas, compliance, roadmap)
Trilha 6: 03, 12 (níveis de rigor, debates honestos)
Trilha 13: 06, 07 (frameworks de eval, eval gates em CI)
Trilha 16: 07 (métricas que importam — SLI/SLO de LLM)
Trilha 17: 04 (champion-challenger em produção)

Saída: capaz de avaliar custo/benefício, definir métricas de qualidade e SLOs de LLM, decidir nível de rigor SDD, planejar adoção de 12 semanas, defender investimento para stakeholders.

🌐 Senda Open Source / Soberania (18-25h)

“Quero independência de provider, modelos abertos, stack auto-hospedado.”

Trilha 1: 06, 08 (modelos chineses, modelos locais)
Trilha 2: 07 (frameworks 2026)
Trilha 3: 09-13, 15 (Aider, OpenCode, modelos chineses, MCP)
Trilha 4: 09, 11 (model routing, semantic caching)
Trilha 9: 05 (pgvector, Qdrant self-hosted)
Trilha 10: 04-06 (servers oficiais, construir local, HTTP+SSE)
Trilha 8: 09-12 (panorama, Wendel gist, graphify, basic-memory MCP)
Trilha 13: 06 (frameworks 2026 — Promptfoo, Phoenix open-source)
Trilha 16: 03, 04 (Langfuse self-host, Phoenix, OpenLLMetry)

Saída: stack 100% open source, DeepSeek/Qwen/GLM, MCP integrations, memória local, evals e observability self-hosted.

Como começar — heurística rápida

graph TD
    A["Sou novo em IA"] --> B["Comece com<br/>Anatomia dos LLMs"]
    C["Já uso ChatGPT/Claude"] --> D["Vá para<br/>Agentes de Codificação"]
    E["Estou queimando dinheiro<br/>em LLMs"] --> F["Economia de Tokens"]
    G["Time virou<br/>vibe-coding"] --> H["Spec-Driven Development"]
    I["Preciso de auditoria<br/>de segurança"] --> J["Segurança e Guardrails"]
    K["Vou construir RAG"] --> L["RAG e Vector Databases"]
    M["Vou expor API como tool"] --> N["MCP"]
    Q["Preciso de output confiável<br/>em JSON"] --> R["Structured Outputs"]
    S["Vou processar<br/>PDF/imagem/áudio"] --> T["Multimodal Prompting"]
    U["LLM em produção<br/>precisa de monitoramento"] --> V["Observability + Evaluation"]
    W["Vou desenhar sistema<br/>novo do zero"] --> X["AI Engineering Stack"]
    O["Quero programa estruturado"] --> P["Senda do Praticante<br/>(acima)"]

Como medir progresso

MarcoSinal
InicianteAcabou Trilha 1
PraticanteAcabou Senda do Praticante completa
Engenheiro de IAAcabou Trilhas 1-5 + AI Engineering Stack
Arquiteto de IAAcabou Senda do Arquiteto
Líder TécnicoAcabou Senda do Líder Técnico
MestreAcabou as 17 trilhas + AI Engineering Stack

Marcos são pessoais, não diplomas. Aplicar > acumular leitura.

Áreas de aplicação em software

ÁreaO que IA resolveTrilha relevante
Code assistantsCompletions, refactor, code review, gerar testesAgentes de Codificação
Chatbots e suporteAtender cliente, responder FAQ, triar ticketsRAG e Vector Databases + Anatomia de Agents
Search e knowledgeBusca semântica, QA sobre documentosRAG e Vector Databases
Content generationTexto, tradução, sumarização, emailsAnatomia dos LLMs
ClassificationTriar tickets, detectar sentimento, moderar17 - Evaluation de LLMs em produção
ExtractionParsear PDF, faturas em JSONMultimodal Prompting + Structured Outputs
Saídas estruturadasOutput do LLM alimenta código a jusanteStructured Outputs
Agents automationWorkflows multi-step, integrações, pesquisaAnatomia de Agents + MCP
PersonalizationRecomendações, ranking, feed03 - Embeddings — representação semântica
Voice e multimodalTranscrição, TTS, análise de imagem05 - Panorama de modelos 2026
Visão / análise de UILer screenshot, comparar mockup, debug visualMultimodal Prompting
Geração visualHero do README, thumbnail, mockup, infográficoImage Prompting
Produção robustaOperar LLM em produção sem regressão silenciosaEvaluation + Observability + Improvement Loop

Armadilhas comuns

Os 8 erros recorrentes

  1. Tratar LLM como função determinística — temperature 0 + structured outputs + validação são obrigatórios
  2. Context window infinito resolve tudo — context rot real, custo + latência crescem; RAG-filtered 8K bate dump de 1M
  3. Confiar em output sem validar — sandbox em código gerado, citar fonte em fatos
  4. Prompt que funciona em 3 testes — golden set de 30-100 ou superstição
  5. Fine-tuning como primeira solução — ordem é prompting → few-shot → RAG → structured outputs → fine-tune (último recurso)
  6. Ignorar custo — tiering de modelos, prompt caching, observability, max_steps
  7. Prompt injection ignorado — separar system de user, sanitize externo, OWASP Top 10 LLMs
  8. Esquecer determinismo onde importa — testes com fixtures + evaluation semântica

Detalhes em 01 - O problema do vibe coding em produção e Segurança e Guardrails.

Glossário cross-trilha

Termos que aparecem em múltiplas trilhas — onde estão os “dives” definitivos:

TermoOnde está o diveAparece em
Token / tokenization02 - Tokens e tokenizaçãoTodas
Context window03 - A janela de contextoTrilhas 4, 5, 7
Prompt caching05 - Prompt caching na práticaTrilhas 5, 6, 8
Context rot03 - Context rot e atenção diluídaTrilhas 4, 6, 8, 9
AGENTS.md / CLAUDE.md11 - Skills e instructions como contextoTrilhas 3, 6, 7
MCP01 - O que é MCP e por que importaTrilhas 2, 5, 8, 9
Multi-agent / CIV09 - SDD com agentes — coordinator, implementor, validatorTrilhas 2, 3, 5
Sandbox / least privilege06 - Permissões e sandboxingTrilhas 2, 3, 5, 7
Spec-as-source03 - Níveis de rigor — spec-first, spec-anchored, spec-as-sourceTrilhas 5, 7
Vibe coding01 - O problema do vibe coding em produçãoTrilhas 3, 7
Letta / MemGPT14 - Letta (ex-MemGPT)Trilhas 2, 5, 8
Self-editing memory08 - Memória agentica — self-editing memoryTrilha 8
Embeddings03 - Embeddings — representação semânticaTrilhas 5, 8, 9
Chunking04 - Chunking — onde 50% da qualidade viveTrilha 9
Hybrid search06 - Retrieval — hybrid search, BM25, query rewritingTrilha 9
Vectorless RAG / PageIndex13 - PageIndex — RAG vectorless por árvore de documentosTrilhas 8, 9
MCP primitivos02 - Os três primitivos — Tools, Resources, PromptsTrilha 10
SKILL.md16 - Agent skills marketplace e SKILL.mdTrilhas 3, 5
Slopsquatting02 - Slopsquatting — o ataque via alucinaçãoTrilhas 7, 10
RLHF / Constitutional AI16 - Como LLMs são treinados — pretraining, SFT, RLHFTrilha 1
Structured Outputs02 - JSON Schema como contratoTrilhas 1, 5, 12
JSON Schema02 - JSON Schema como contratoTrilha 12
Function calling03 - Function calling como mecanismo de outputTrilhas 2, 10, 12
LLM-as-judge04 - LLM-as-judge — quando e comoTrilhas 5, 13
Eval-driven development01 - Eval-driven development — a disciplinaTrilha 13
Trace LLM / spans02 - Anatomia de um trace LLMTrilhas 13, 16, 17
Prompt versioning05 - Versionamento de promptsTrilhas 13, 16, 17
Champion-challenger04 - Champion-challenger em produçãoTrilhas 13, 17
AI Engineering Stack01 - As 11 camadas — visão geralTodas (tronco)
Mega-prompt Karpathy04 - O mega-prompt do Karpathy — anatomia da anti-sycophancyTrilha 11
Workflow vs Agent10 - Workflow vs Agent — quando usar cada umTrilhas 2, 5, 6

Bibliografia mestra

Fontes que aparecem em ≥2 trilhas — biblioteca essencial:

  • Anthropic — Effective context engineering for AI agents (Trilhas 2, 3, 5, 6, 9, AI Engineering Stack)
  • Anthropic — Best Practices for Claude Code (Trilhas 3, 5, 7)
  • Anthropic — Building Effective Agents (Trilhas 2, 3, 4, 17, AI Engineering Stack)
  • Anthropic — Contextual Retrieval (Trilhas 5, 9)
  • Anthropic — MCP announcement + spec (Trilha 10)
  • Karpathy — Vibe coding (Trilhas 3, 6)
  • Karpathy — Context engineering tweet (Trilha 5)
  • Karpathy — anti-sycophancy system prompt (2025) (Trilha 11)
  • @hooeem — Become an AI Engineer (X thread, mai 2026) (Trilhas 11, 12, 14, 15, 16, 17, AI Engineering Stack)
  • Veracode — 2025 GenAI Code Security Report (Trilhas 6, 7)
  • Chroma Research — Context Rot (Trilhas 4, 5)
  • Liu et al. — Lost in the Middle (TACL 2024) (Trilhas 5, 9)
  • GitHub Spec Kit (github/spec-kit) (Trilha 6)
  • AGENTS.md spec (Linux Foundation) (Trilhas 3, 5, 6, 7)
  • Letta — Memory Blocks (Trilhas 5, 8)
  • Lewis et al. — RAG paper original (2020) (Trilha 9)
  • Wei et al. — Chain-of-Thought (Trilha 5)
  • Yao et al. — ReAct (Trilha 2)
  • Schick et al. — Toolformer (Trilha 2)
  • Packer et al. — MemGPT (arxiv:2310.08560) (Trilhas 5, 8)
  • Schulhoff et al. — The Prompt Report (arxiv:2406.06608) (Trilha 11)
  • DeepLearning.AI / Andrew Ng — SDD course (Trilha 6)
  • Awesome MCP Servers (Trilha 10)
  • OWASP Top 10 for LLMs (Trilhas 7, 10)
  • Eugene Yan — Patterns for LLM Systems (Trilhas 1, 5, 9, 12, 13)
  • Hamel Husain — Your AI Product Needs Evals (Trilhas 13, 16, 17)
  • Khattab et al. — DSPy (arxiv:2310.03714) (Trilha 17)
  • Zheng et al. — Judging LLM-as-a-Judge (arxiv:2306.05685) (Trilha 13)
  • OpenTelemetry GenAI semantic conventions (Trilha 16)
  • Langfuse docs + Tracing (Trilhas 13, 16)
  • Chip Huyen — AI Engineering (Trilhas 1, 9, 13)
  • Salesforce Ben — 2026 Year of Tech Debt (Trilhas 6, 7)
  • EU AI Act regulatory framework (Trilhas 7, 16)

Ferramentas

Ferramentas de IA — catálogo de ferramentas com comparativos detalhados:

O Lado Sombrio da IA

O Lado Sombrio da IA — galho crítico, fora das 17 trilhas, que cataloga os custos humanos, cognitivos e sociais da IA: o que ela cobra além do que aparece nas métricas de velocidade. Complementa a formação (que ensina a usar IA) e se distingue de Segurança e Guardrails (risco técnico) por focar no impacto humano e sistêmico.

How to explain in English

Short pitch (30s)

“For a senior fullstack role in 2026, AI is core toolkit, not specialty. Three layers: coding agents like Claude Code, Copilot, Codex for productivity; LLM APIs (Claude, OpenAI, Gemini) integrated into product features; and operational discipline — cost, latency, evaluation, safety — needed to run AI in production. The bar for senior is treating LLMs as stochastic dependencies with untyped outputs: structured outputs, validation, retries, fallbacks, and golden sets are not optional.”

Phrases to use in interviews

  • “LLMs are stochastic functions with untyped outputs — treat them accordingly.”
  • “Prompting is necessary but not sufficient; evaluation is what makes LLM features production-ready.”
  • “RAG before fine-tuning, almost always.”
  • “The bottleneck isn’t the model anymore — it’s context engineering.”
  • “Non-determinism is the new concurrency: a cross-cutting concern you have to design for.”
  • “Workflows when you can, agents when you must.”
  • “A tool without a clear description is worse than no tool at all.”
  • “Code generated by AI is untrusted by default. Defense in depth is non-negotiable.”

Vocabulário-chave

PT-BREN
inteligência artificialartificial intelligence (AI)
aprendizado de máquinamachine learning (ML)
aprendizado profundodeep learning (DL)
IA generativagenerative AI (GenAI)
modelo de linguagem grandelarge language model (LLM)
janela de contextocontext window
ajuste finofine-tuning
geração aumentada por recuperaçãoretrieval-augmented generation (RAG)
engenharia de contextocontext engineering
alucinaçãohallucination
representação vetorialembedding
chamada de ferramentatool use / function calling
saída estruturadastructured output
tiering de modelosmodel tiering
injeção de promptprompt injection
conjunto douradogolden set
rastreamentotracing
observabilidadeobservability

Deep dives — papers e marcos históricos

Não precisa ler todos em profundidade. Precisa saber o que são, por que importam, e o que destravaram.

Os fundamentais

  • Attention is All You Need (Vaswani et al., 2017) — Transformer. arxiv · Illustrated
  • Language Models are Few-Shot Learners (Brown et al., 2020) — GPT-3, in-context learning. arxiv
  • Training LMs to Follow Instructions (Ouyang et al., 2022) — InstructGPT, RLHF. arxiv
  • Chain-of-Thought Prompting (Wei et al., 2022). arxiv
  • Scaling Laws / Chinchilla (Hoffmann et al., 2022). arxiv
  • Constitutional AI (Bai et al., 2022, Anthropic). arxiv

Agents e Tool Use

  • Toolformer (Schick et al., 2023). arxiv
  • ReAct (Yao et al., 2022). arxiv
  • Building Effective Agents (Anthropic, 2024). Blog

RAG e Memory

  • RAG paper original (Lewis et al., 2020). arxiv
  • MemGPT (Packer et al., 2023). arxiv
  • Lost in the Middle (Liu et al., 2023). arxiv

Práticos recentes (2024-2026)

  • Contextual Retrieval (Anthropic, 2024). Blog
  • The Prompt Report (Schulhoff et al., 2024) — survey de 58 técnicas. arxiv
  • Context Rot (Chroma Research, 2025).
  • GraphRAG (Edge et al., Microsoft, 2024).
  • VeriMAP (EACL 2026) — multi-agent SDD peer-reviewed.

Recursos curados

Livros

  • AI Engineering — Chip Huyen (2025)
  • Hands-On Large Language Models — Jay Alammar, Maarten Grootendorst
  • Designing Machine Learning Systems — Chip Huyen
  • Building LLMs for Production — Bouchard, Peters

Cursos

Blogs e newsletters

Práticas

Manutenção desta formação

Esta formação reflete o estado de maio de 2026. Áreas que mudam mais rápido:

ÁreaCadência de revisão
Pricing de modelosTrimestral
Ferramentas SAST/SCATrimestral
Compliance (EU AI Act)Anual
Modelos de fronteiraTrimestral
Pesquisa em context rot / memóriaSemestral
Padrões SDDSemestral
MCP ecosystemTrimestral

Notas com mais “shelf life” — fundamentos teóricos, princípios de defesa em profundidade, taxonomia de memória — duram anos.

Veja também

Estatísticas

TABLE
  length(rows.file.path) AS "Notas"
FROM "03-Dominios/IA"
WHERE type != "moc"
GROUP BY file.folder
SORT file.folder

Encerramento

“Engenheiros que dominam essas 17 trilhas + o tronco do AI Engineering Stack não usam IA — eles engenheiram com IA. A diferença entre os dois define quem tem tech debt em 18 meses e quem tem produto em produção.”