RAG e Vector Databases

Em 2026, quase toda aplicação séria com LLM tem RAG no meio do caminho. LLMs conhecem muita coisa, mas não conhecem seus dados — docs internas, políticas, base de clientes, histórico do paciente. RAG resolve isso injetando dados específicos no contexto em runtime, com citação de fonte como capacidade-chave. Esta trilha cobre o ciclo completo: do conceito ao setup de produção, passando por embeddings, chunking, vector DBs, retrieval, reranking, evaluation e padrões avançados (Graph RAG, Agentic RAG, PageIndex/vectorless RAG).

Pré-requisitos

Recomendado ter lido Anatomia dos LLMs (Trilha 1) — especialmente sobre context window e API. Context Engineering complementa fortemente (Bloco 2 de retrieval). Para RAG agentic avançado, ver Anatomia de Agents.

A regra de ouro

RAG não é sobre vector database — é sobre retrieval quality. Vector DB é commodity. Onde a qualidade vive: chunking, hybrid search, reranking. Pure vector em produção perde para hybrid+rerank em ~95% dos casos.

Comece por aqui

Trilha sequencial recomendada — fundamentos → pipeline → componentes → evaluation → produção.

Bloco 1 — Fundamentos (2 notas)

O que é, anatomia do pipeline.

Bloco 2 — Componentes Essenciais (5 notas)

Os pilares que sustentam qualidade.

Bloco 3 — Generation e Avaliação (2 notas)

Como passar contexto e como medir qualidade.

Bloco 4 — Decisão e Avançado (4 notas)

Quando RAG é a escolha certa, padrões avançados, setup completo e alternativas vectorless.

Rotas alternativas

Rota prática (vou construir um RAG agora)

“Tenho corpus, preciso de RAG funcional rapidamente”

01 - O que é RAG e quando usar02 - Anatomia do pipeline RAG04 - Chunking — onde 50% da qualidade vive06 - Retrieval — hybrid search, BM25, query rewriting12 - Setup completo — checklist de produção

Rota qualidade (já tenho RAG mas funciona mal)

“RAG existe mas top-k traz lixo / faithfulness baixa”

09 - Evaluation de RAG04 - Chunking — onde 50% da qualidade vive06 - Retrieval — hybrid search, BM25, query rewriting07 - Reranking — Cohere, Voyage, cross-encoders

Rota arquiteto (qual approach escolher)

“Devo usar RAG, long context ou fine-tuning?”

01 - O que é RAG e quando usar10 - RAG vs long context vs fine-tuning14 - Fine-tuning vs prompting vs RAG

Rota produção (RAG em escala)

“Time pequeno mas precisamos rodar RAG confiável”

12 - Setup completo — checklist de produção09 - Evaluation de RAG18 - Playbook de economia — checklist completo07 - Security-focused prompting

Rota avançada (multi-hop, knowledge graphs)

“RAG vanilla não resolve, preciso patterns mais sofisticados”

11 - Padrões avançados — Graph RAG, Agentic RAG, multi-hopAnatomia de Agents16 - Zep e Graphiti — knowledge graph temporal

Rota documentos longos (PDFs, contratos, relatórios)

“Meu problema é navegar documentos grandes sem chunking ruim”

10 - RAG vs long context vs fine-tuning11 - Padrões avançados — Graph RAG, Agentic RAG, multi-hop13 - PageIndex — RAG vectorless por árvore de documentos11 - OpenKB — wiki compilada com PageIndex

Como esta trilha se conecta

graph TB
    R["RAG e Vector DBs<br/>(esta trilha)"] --> A["Anatomia dos LLMs<br/>fundamentos de embedding"]
    R --> C["Context Engineering<br/>JIT retrieval, beyond RAG"]
    R --> M["Memória de Agentes<br/>vector storage + memory"]
    R --> AG["Anatomia de Agents<br/>RAG agentic"]
    R --> E["Economia de Tokens<br/>caching de embeddings"]
    R --> S["Segurança e Guardrails<br/>citação, sandbox de retrieval"]

Leituras recomendadas

FonteTipoCobertura
Anthropic — Contextual RetrievalArtigo (2024)Notas 02, 04, 06, 07
Pinecone — Learn RAGCursoTrilha inteira
Lewis et al. — RAG paper originalPaper (2020)Nota 01
Karpukhin et al. — Dense Passage RetrievalPaper DPR (2020)Nota 03
Gao et al. — HyDEPaper (2022)Nota 06
Es et al. — RAGAS paperPaper (2023)Nota 09
Edge et al. — GraphRAG paperPaper Microsoft (2024)Nota 11
VectifyAI — PageIndexRepositório + docsNota 13
Chip Huyen — AI EngineeringLivro (2025)Notas 09, 10, 12
Eugene Yan — Patterns for LLM systemsArtigoTrilha inteira
Lost in the Middle (Liu et al.)PaperNota 02

Veja também

Todas as notas

TABLE
  title AS "Título",
  status AS "Status",
  join(tags, ", ") AS "Tags"
FROM "03-Dominios/IA/RAG e Vector Databases"
WHERE type != "moc"
SORT file.name ASC