Codex Technomanticus
Search
Pesquisar
Tema escuro
Tema claro
Explorador
Tag: evaluation
13 items com esta tag.
28 de mai. de 2026
Evaluation
evaluation
ia
moc
29 de mai. de 2026
Evaluation de agents
anatomia-agents
ia
agents
evaluation
29 de mai. de 2026
Evaluation de LLMs em produção
anatomia-llm
ia
evaluation
producao
golden-set
29 de mai. de 2026
Evaluation de RAG
rag
ia
evaluation
28 de mai. de 2026
Evaluation Layer
ai-engineering-stack
ia
evaluation
28 de mai. de 2026
01 - Eval-driven development — a disciplina
evaluation
ia
edd
disciplina
28 de mai. de 2026
02 - Golden datasets — como construir
evaluation
ia
golden-set
dataset
28 de mai. de 2026
03 - Scoring rubrics e critérios
evaluation
ia
rubrica
scoring
28 de mai. de 2026
04 - LLM-as-judge — quando e como
evaluation
ia
llm-as-judge
vieses
28 de mai. de 2026
05 - Regression testing em LLMs
evaluation
ia
regression
snapshot
28 de mai. de 2026
06 - Frameworks 2026 — Promptfoo, Braintrust, Langfuse, Patronus, Phoenix
evaluation
ia
frameworks
tooling
28 de mai. de 2026
07 - Eval em CI-CD
evaluation
ia
ci-cd
automacao
llm-evals
28 de mai. de 2026
08 - Eval por contexto — LLM, RAG, agent, prompt
evaluation
ia
rag
agents
prompt