Codex Technomanticus

Tag: evaluation

13 items com esta tag.

28 de mai. de 2026
Evaluation
29 de mai. de 2026
Evaluation de agents
29 de mai. de 2026
Evaluation de LLMs em produção
29 de mai. de 2026
Evaluation de RAG
28 de mai. de 2026
Evaluation Layer
28 de mai. de 2026
01 - Eval-driven development — a disciplina
28 de mai. de 2026
02 - Golden datasets — como construir
28 de mai. de 2026
03 - Scoring rubrics e critérios
28 de mai. de 2026
04 - LLM-as-judge — quando e como
28 de mai. de 2026
05 - Regression testing em LLMs
28 de mai. de 2026
06 - Frameworks 2026 — Promptfoo, Braintrust, Langfuse, Patronus, Phoenix
28 de mai. de 2026
07 - Eval em CI-CD
28 de mai. de 2026
08 - Eval por contexto — LLM, RAG, agent, prompt

Criado com Quartz v4.5.2 © 2026

GitHub
Discord Community