Image Prompting

Quando engenheiro gera imagem, o objetivo raramente é arte — é entregável: hero do README, thumbnail do post, mockup pra design review, infográfico pra deck, ilustração conceitual de arquitetura, asset de social media. Image Prompting é a disciplina de produzir esses entregáveis de forma reprodutível, com modelos como DALL-E, Imagen, Midjourney, FLUX, Stable Diffusion e Ideogram. A tese central da trilha: deliverable-first, não scene-first — descreva o entregável (formato, hierarquia, audiência, texto), não a cena. Image Prompting tem seu próprio ofício, separado de Prompt Engineering pra modelos de texto: canvas, composição, estilo e texto são as quatro alavancas, e cada entregável tem um template estável que vale a pena reaproveitar.

Pré-requisitos

Nenhum — esta trilha é auto-contida. Familiaridade com Prompt Engineering ajuda como mentalidade (“iteração disciplinada”, “constraints declarativas”), mas todas as primitivas visuais são introduzidas aqui.

Modelos de imagem mudam mais rápido que LLMs

Versões e capacidades de modelos de imagem (DALL-E 3, Imagen 3, Midjourney v6.1, FLUX.1, SD 3.5, Ideogram 2) refletem o estado de 2025-2026. Releases novos saem a cada poucos meses, com ganhos especialmente em renderização de texto e fidelidade. Doc oficial do provider é a fonte de verdade pra deploy.

Comece por aqui

Trilha sequencial recomendada — mentalidade primeiro, depois ferramentas, depois técnica, depois casos técnicos.

Bloco 1 — Mentalidade (2 notas)

A virada conceitual que faz a diferença entre “vê o que sai” e “entregável previsível”.

01 - Image prompting como engenharia — por que geração de imagem é engenharia quando o objetivo é entregável, não arte; casos de uso reais do dia do engenheiro
02 - Deliverable-first, não scene-first — o erro mais comum (descrever cena) vs o padrão que funciona (descrever entregável); template canônico Goal / Deliverable / Canvas / Audience / Subject / Composition / Style / Text / Constraints / Iteration

Bloco 2 — Ferramentas (1 nota)

O landscape de modelos em 2026 e quando escolher cada um.

03 - Modelos de imagem 2026 — DALL-E, Imagen, Midjourney, FLUX, SD — tabela comparativa, decision tree por entregável, modos de edição

Bloco 3 — Técnica (3 notas)

As quatro camadas do prompt visual, os templates por entregável e como iterar sem perder o controle.

04 - Anatomia de um prompt visual — canvas, composição, estilo — canvas (formato), composição (hierarquia), estilo (linguagem visual), texto (e seus limites)
05 - Templates por entregável — poster, infográfico, mockup, thumbnail — seis templates prontos com prompt completo e modelo recomendado
06 - Iteração visual — controlled changes — Keep/Change/Do-not adaptado pra imagem, inpainting, image-to-image, ControlNet

Bloco 4 — Casos técnicos (1 nota)

Onde geração de imagem funciona e onde ainda não — honesto sobre o estado de 2026.

07 - Geração de diagramas e ilustrações técnicas — onde modelos de imagem ajudam em conteúdo técnico, onde Mermaid/Excalidraw/PlantUML ainda ganham, padrão híbrido

Leituras recomendadas

Fonte	Tipo	Cobertura
@hooeem — Become an AI Engineer, cap #16	Thread / artigo	Espinha dorsal da trilha — todas as notas
OpenAI — Image generation guide (docs)	Doc oficial	Notas 03, 04 — DALL-E 3, edit mode
Midjourney — Documentation (docs)	Doc oficial	Notas 03, 04 — parâmetros, estilos, aspect ratio
Black Forest Labs — FLUX.1 docs (docs)	Doc oficial	Notas 03, 06 — FLUX pro/dev/schnell, fill/inpaint
Stability AI — Stable Diffusion 3.5 (docs)	Doc oficial	Nota 03 — SD self-hosted, LoRAs, ControlNet
Google — Imagen on Vertex AI (docs)	Doc oficial	Notas 03, 04 — Imagen 3, text rendering
Ideogram — Docs (docs)	Doc oficial	Nota 04 — texto em imagem como especialidade

Veja também

Prompt Engineering — mentalidade comum: iteração disciplinada, constraints, especificidade
Multimodal Prompting — input visual no LLM; complementa esta trilha (que cobre output visual)
AI Engineering Stack — image generation é uma decisão de Output Layer
05 - Output Layer — onde image generation se encaixa no stack

Todas as notas

LIST
FROM "03-Dominios/IA/Image Prompting"
WHERE type != "moc"
SORT file.name ASC

Codex Technomanticus

Explorador

Image Prompting

Image Prompting

Comece por aqui

Bloco 1 — Mentalidade (2 notas)

Bloco 2 — Ferramentas (1 nota)

Bloco 3 — Técnica (3 notas)

Bloco 4 — Casos técnicos (1 nota)

Leituras recomendadas

Veja também

Todas as notas

01 - Image prompting como engenharia

02 - Deliverable-first, não scene-first

03 - Modelos de imagem 2026 — DALL-E, Imagen, Midjourney, FLUX, SD

04 - Anatomia de um prompt visual — canvas, composição, estilo

05 - Templates por entregável — poster, infográfico, mockup, thumbnail

06 - Iteração visual — controlled changes

07 - Geração de diagramas e ilustrações técnicas