Image Prompting

Quando engenheiro gera imagem, o objetivo raramente é arte — é entregável: hero do README, thumbnail do post, mockup pra design review, infográfico pra deck, ilustração conceitual de arquitetura, asset de social media. Image Prompting é a disciplina de produzir esses entregáveis de forma reprodutível, com modelos como DALL-E, Imagen, Midjourney, FLUX, Stable Diffusion e Ideogram. A tese central da trilha: deliverable-first, não scene-first — descreva o entregável (formato, hierarquia, audiência, texto), não a cena. Image Prompting tem seu próprio ofício, separado de Prompt Engineering pra modelos de texto: canvas, composição, estilo e texto são as quatro alavancas, e cada entregável tem um template estável que vale a pena reaproveitar.

Pré-requisitos

Nenhum — esta trilha é auto-contida. Familiaridade com Prompt Engineering ajuda como mentalidade (“iteração disciplinada”, “constraints declarativas”), mas todas as primitivas visuais são introduzidas aqui.

Modelos de imagem mudam mais rápido que LLMs

Versões e capacidades de modelos de imagem (DALL-E 3, Imagen 3, Midjourney v6.1, FLUX.1, SD 3.5, Ideogram 2) refletem o estado de 2025-2026. Releases novos saem a cada poucos meses, com ganhos especialmente em renderização de texto e fidelidade. Doc oficial do provider é a fonte de verdade pra deploy.

Comece por aqui

Trilha sequencial recomendada — mentalidade primeiro, depois ferramentas, depois técnica, depois casos técnicos.

Bloco 1 — Mentalidade (2 notas)

A virada conceitual que faz a diferença entre “vê o que sai” e “entregável previsível”.

  • 01 - Image prompting como engenharia — por que geração de imagem é engenharia quando o objetivo é entregável, não arte; casos de uso reais do dia do engenheiro
  • 02 - Deliverable-first, não scene-first — o erro mais comum (descrever cena) vs o padrão que funciona (descrever entregável); template canônico Goal / Deliverable / Canvas / Audience / Subject / Composition / Style / Text / Constraints / Iteration

Bloco 2 — Ferramentas (1 nota)

O landscape de modelos em 2026 e quando escolher cada um.

Bloco 3 — Técnica (3 notas)

As quatro camadas do prompt visual, os templates por entregável e como iterar sem perder o controle.

Bloco 4 — Casos técnicos (1 nota)

Onde geração de imagem funciona e onde ainda não — honesto sobre o estado de 2026.

Leituras recomendadas

FonteTipoCobertura
@hooeemBecome an AI Engineer, cap #16Thread / artigoEspinha dorsal da trilha — todas as notas
OpenAIImage generation guide (docs)Doc oficialNotas 03, 04 — DALL-E 3, edit mode
MidjourneyDocumentation (docs)Doc oficialNotas 03, 04 — parâmetros, estilos, aspect ratio
Black Forest LabsFLUX.1 docs (docs)Doc oficialNotas 03, 06 — FLUX pro/dev/schnell, fill/inpaint
Stability AIStable Diffusion 3.5 (docs)Doc oficialNota 03 — SD self-hosted, LoRAs, ControlNet
GoogleImagen on Vertex AI (docs)Doc oficialNotas 03, 04 — Imagen 3, text rendering
IdeogramDocs (docs)Doc oficialNota 04 — texto em imagem como especialidade

Veja também

Todas as notas

LIST
FROM "03-Dominios/IA/Image Prompting"
WHERE type != "moc"
SORT file.name ASC