Esta página foi traduzida pela API Cloud Translation.

Guia de atributos de comandos e imagens

Para usar o Imagen no Vertex AI, tem de fornecer uma descrição de texto do que quer gerar ou editar. Estas descrições chamam-se comandos e são a principal forma de comunicar com a IA generativa no Vertex AI.

Este guia mostra como a modificação de partes de um comando de texto para imagem pode produzir resultados diferentes e dá-lhe exemplos de imagens que pode criar. Este guia também fornece orientações sobre como pode editar imagens através de comandos de texto e iteração.

Utilização do produto

Para ver as normas de utilização e as restrições de conteúdo associadas ao Imagen no Vertex AI, consulte as diretrizes de utilização.

Filtragem de conteúdo: texto introduzido, imagens carregadas e imagens geradas

As imagens geradas são filtradas quanto a conteúdo indesejável ou prejudicial. Da mesma forma, qualquer entrada do Imagen no Vertex AI é verificada quanto a conteúdo ofensivo. Isto inclui o comando de texto introduzido e as fotos carregadas no caso da edição de imagens. Para mais informações, consulte o artigo IA responsável e diretrizes de utilização do Imagen.

Também pode denunciar suspeitas de abuso do Imagen no Vertex AI ou qualquer resultado gerado que contenha material impróprio ou informações incorretas através do formulário Denunciar suspeitas de abuso noGoogle Cloud.

Noções básicas de escrita de comandos (assunto, contexto e estilo)

Embora não exista uma única forma de escrever bons comandos, a adição de algumas palavras-chave e modificadores ajuda a aproximar-se do seu objetivo final. Os comandos não têm de ser longos nem complexos, mas a maioria dos bons comandos é descritiva e clara.

Um bom ponto de partida pode ser pensar no assunto, no contexto e no estilo.

Comando com o assunto, o contexto e o estilo realçados — Texto da imagem: um *esboço* (**estilo**) de um *prédio de apartamentos moderno* (**assunto**) rodeado de *arranha-céus* (**contexto e fundo**).

Sujeito: a primeira coisa a ter em conta em qualquer comando é o sujeito: o objeto, a pessoa, o animal ou o cenário de que quer uma imagem.
Contexto e fundo: o fundo ou o contexto em que o objeto vai ser colocado é igualmente importante. Experimente colocar o objeto em vários fundos. Por exemplo, um estúdio com um fundo branco, ao ar livre ou em ambientes interiores.
Estilo: por último, adicione o estilo de imagem que quer. Os estilos podem ser gerais (pintura, fotografia, esboços) ou muito específicos (pintura a pastel, desenho a carvão, 3D isométrico).

Depois de escrever uma primeira versão do comando, refine-o adicionando mais detalhes até obter a imagem pretendida. A iteração é importante. Comece por estabelecer a sua ideia principal e, em seguida, refine e expanda essa ideia principal até que a imagem gerada se aproxime da sua visão.

imagem de exemplo fotorrealista 1 — Comando: um parque na primavera junto a um lago

imagem de exemplo fotorrealista 2 — Comando: um parque na primavera junto a um lago, **o sol põe-se do outro lado do lago, hora dourada**

imagem de exemplo fotorrealista 3 — Comando: um parque na primavera junto a um lago, **o sol põe-se sobre o lago, hora dourada, flores silvestres vermelhas**

Escrita de comandos do Imagen 3

Veja o cartão do modelo Imagen for Generation

O Imagen 3 pode transformar as suas ideias em imagens detalhadas, quer os comandos sejam curtos ou longos e detalhados. Refine a sua visão através de comandos iterativos, adicionando detalhes até alcançar o resultado perfeito.

Os comandos curtos permitem-lhe gerar uma imagem rapidamente.

Exemplo de comando curto do Imagen 3 — Comando: foto em close-up de uma mulher na casa dos 20 anos, fotografia de rua, fotograma de filme, tons quentes laranja esbatidos

Os comandos mais longos permitem-lhe adicionar detalhes específicos e criar a sua imagem.

Exemplo de comando longo do Imagen 3 — Comando: foto cativante de uma mulher na casa dos 20 anos a usar um estilo de fotografia de rua. A imagem deve parecer uma cena de um filme com tons quentes de laranja esbatidos.

Conselhos adicionais para escrever comandos do Imagen 3:

Use linguagem descritiva: use adjetivos e advérbios detalhados para criar uma imagem clara para o Imagen 3.
Forneça contexto: se necessário, inclua informações gerais para ajudar a IA a compreender.
Referencie artistas ou estilos específicos: se tiver uma estética específica em mente, referenciar artistas ou movimentos artísticos específicos pode ser útil.
Use ferramentas de engenharia de comandos: considere explorar ferramentas ou recursos de engenharia de comandos para ajudar a refinar os seus comandos e alcançar resultados ótimos.
Melhorar os detalhes faciais nas suas imagens pessoais e de grupo:
- Especifique detalhes faciais como foco da foto (por exemplo, use a palavra "retrato" no comando).
- Considere usar um modelo maior, como o Imagen 3, em vez do Imagen 3 Fast para melhorar os detalhes.

Gere texto em imagens

A capacidade do Imagen 3 de adicionar texto às suas imagens abre possibilidades criativas de geração de imagens. Use as seguintes orientações para tirar o máximo partido desta funcionalidade:

Itere com confiança: pode ter de regenerar imagens até conseguir o aspeto desejado. A integração de texto do Imagen ainda está em evolução e, por vezes, várias tentativas geram os melhores resultados.
Mantenha o texto curto: limite o texto a 25 carateres ou menos para uma geração ideal.
Várias expressões: experimente usar duas ou três expressões distintas para fornecer informações adicionais. Evite exceder as três expressões para composições mais claras.

Comando: um cartaz com o texto "Summerland" em negrito como título. Abaixo deste texto, encontra-se o slogan "O verão nunca foi tão bom"
Posicionamento de texto: embora o Imagen possa tentar posicionar o texto conforme indicado, deve esperar variações ocasionais. Esta funcionalidade está em melhoria contínua.
Estilo do tipo de letra Inspire: especifique um estilo de tipo de letra geral para influenciar subtilmente as escolhas do Imagen. Não dependa da replicação precisa do tipo de letra, mas espere interpretações criativas.
Tamanho do tipo de letra: especifique um tamanho do tipo de letra ou uma indicação geral do tamanho (por exemplo, pequeno, médio, grande) para influenciar a geração do tamanho do tipo de letra.

Parametrização de comandos

Para controlar melhor os resultados de saída, pode ser útil parametrizar as entradas no Imagen quando trabalhar com a API Imagen ou o SDK Vertex AI para Python. Por exemplo, suponhamos que quer que os seus clientes possam gerar logótipos para a respetiva empresa e quer certificar-se de que os logótipos são sempre gerados num fundo de cor sólida. Também quer limitar as opções que o cliente pode selecionar num menu.

Neste exemplo, pode criar um comando parametrizado semelhante ao seguinte:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

Na interface do utilizador personalizada, o cliente pode introduzir os parâmetros através de um menu, e o valor escolhido preenche o comando que o Imagen recebe.

Por exemplo:

Comando: A minimalist logo for a health care company on a solid color background. Include the text Journey.
Comando: A modern logo for a software company on a solid color background. Include the text Silo.
Comando: A traditional logo for a baking company on a solid color background. Include the text Seed.

Estilo: fotografia

O comando inclui: "Uma foto de…"

Para usar este estilo, comece por usar palavras-chave que indiquem claramente ao Imagen no Vertex AI que está à procura de uma fotografia. Comece os comandos com "Uma foto de. . .". Por exemplo:

^{Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 3.}

Estilo: ilustração e arte

O comando inclui: "Um painting de…", "Um sketch de…"

Os estilos artísticos variam desde estilos monocromáticos, como esboços a lápis, até arte digital hiper-realista. Por exemplo, as seguintes imagens usam o mesmo comando com estilos diferentes:

"Uma [art style or creation technique] de um sedan elétrico desportivo angular com arranha-céus no fundo"

art sample images — Comando: um **desenho técnico a lápis** de um...

^{Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 2.}

Técnicas avançadas de escrita de comandos

Use os exemplos seguintes para criar comandos mais específicos com base nos atributos: descritores de fotografia, formas e materiais, movimentos artísticos históricos e modificadores de qualidade de imagem.

Modificadores de fotografia

Nos exemplos seguintes, pode ver vários modificadores e parâmetros específicos da fotografia.

Proximidade da câmara: close-up tirado de longe

Imagem de amostra da câmara em grande plano — Comando: uma foto em **primeiro plano** de grãos de café

Imagem de amostra da câmara com zoom diminuído — Comando: uma foto **com zoom afastado** de um pequeno saco de
grãos de café numa cozinha desarrumada

Posição da câmara: aérea, de baixo

Comando: foto aérea de uma cidade urbana com arranha-céus

Comando: uma foto de um dossel florestal com céu azul visto de baixo

Iluminação: natural, dramática, quente, fria

Imagem de exemplo de iluminação natural — Comando: foto de estúdio de uma poltrona moderna, **iluminação natural**

imagem de exemplo de iluminação dramática — Comando: foto de estúdio de uma poltrona moderna, **iluminação dramática**

Definições da câmara – efeito esbatido de movimento, foco suave, bokeh, retrato

Imagem de exemplo com efeito esbatido de movimento — Comando: foto de uma cidade com arranha-céus vista do interior de um carro com **efeito esbatido de movimento**

Imagem de exemplo com filtro difusor — Comando: **fotografia com filtro difusor de uma ponte numa cidade urbana à noite**

Tipos de lentes: 35 mm, 50 mm, olho de peixe, grande angular e macro

Comando: foto de uma folha, lente macro

Comando: fotografia de rua, cidade de Nova Iorque, lente olho de peixe
Tipos de filmes: preto e branco, polaroid

Comando: um retrato polaroid de um cão com óculos de sol

Comando: foto a preto e branco de um cão com óculos de sol

^{Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 3.}

Formas e materiais

O comando inclui: "...feito de...", "...em forma de..."

Um dos pontos fortes desta tecnologia é que pode criar imagens que, de outra forma, seriam difíceis ou impossíveis. Por exemplo, pode recriar o logótipo da sua empresa em diferentes materiais e texturas.

Imagem de exemplo de formas e materiais 1 — Comando: um saco de desporto **feito de** queijo

Imagem de exemplo de formas e materiais 2 — Comando: tubos de néon **em forma** de pássaro

Imagem de exemplo de formas e materiais 3 — Comando: uma poltrona **feita de papel**, foto de estúdio, estilo origami

^{Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 3.}

Referências artísticas históricas

O comando inclui: "…no estilo de…"

Determinados estilos tornaram-se icónicos ao longo dos anos. Seguem-se algumas ideias de estilos de pintura ou arte históricos que pode experimentar.

"gera uma imagem no estilo de [art period or movement]: um parque eólico"

imagem de exemplo de impressionismo — Comando: gera uma imagem no estilo de *uma pintura impressionista*: um parque eólico

imagem de exemplo do Renascimento — Comando: gera uma imagem no estilo de *uma pintura renascentista*: um parque eólico

imagem de exemplo de pop art — Comando: gera uma imagem no estilo de *pop art*: um parque eólico

^{Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 3.}

Modificadores de qualidade da imagem

Determinadas palavras-chave podem indicar ao modelo que está à procura de um recurso de alta qualidade. Alguns exemplos de modificadores de qualidade:

Modificadores gerais: alta qualidade, bonito, estilizado
Fotos: 4K, HDR, Foto de estúdio
Arte, ilustração: por um profissional, detalhada

Seguem-se alguns exemplos de comandos sem modificadores de qualidade e o mesmo comando com modificadores de qualidade.

Imagem de exemplo de milho sem modificadores — Comando (sem modificadores de qualidade): uma foto de um caule de milho

Imagem de exemplo de milho com modificadores — Comando (com modificadores de qualidade): **4k HDR beautiful**
photo of a corn stalk taken by a
professional photographer

^{Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 3.}

Formatos

A geração de imagens do Imagen 3 permite-lhe definir cinco formatos de imagem distintos.

Quadrado (1:1, predefinição): uma foto quadrada padrão. As utilizações comuns deste formato incluem publicações nas redes sociais.

Ecrã inteiro (4:3): este formato é usado frequentemente em suportes multimédia ou filmes. Também são as dimensões da maioria das TVs antigas (não panorâmicas) e das câmaras de formato médio. Captura mais da cena na horizontal (em comparação com 1:1), o que a torna um formato preferencial para fotografia.

exemplo de formato — Comando: close-up dos dedos de um músico a tocar piano, filme a preto e branco, vintage (formato 4:3)

Ecrã inteiro vertical (3:4): este é o formato de ecrã inteiro rodado 90 graus. Isto permite capturar mais do ambiente na vertical em comparação com o formato 1:1.

Panorâmico (16:9): este formato substituiu o 4:3 e é agora o formato mais comum para TVs, monitores e ecrãs de telemóveis (horizontal). Use este formato quando quiser capturar mais do fundo (por exemplo, paisagens panorâmicas).

Comando: um homem com roupa totalmente branca sentado na praia, em close-up, com iluminação da hora dourada (formato 16:9)
Vertical (9:16): esta proporção é panorâmica, mas rodada. Este formato é relativamente novo e foi popularizado por apps de vídeo de formato curto (por exemplo, o YouTube Shorts). Use esta opção para objetos altos com fortes orientações verticais, como edifícios, árvores, cascatas ou outros objetos semelhantes.

Comando: uma renderização digital de um arranha-céus enorme, moderno, grandioso, épico com um belo pôr do sol no fundo (formato 9:16)

Comandos negativos

Os exemplos anteriores focam-se na escrita de comandos para o que quer que o Imagen crie, mas também pode fornecer um comando negativo juntamente com o comando original para ajudar o produto a gerar ou editar imagens. Estes comandos negativos podem ser uma ferramenta poderosa que ajuda a especificar os elementos a omitir da imagem. Basta descrever o que não quer.

Recomendado: descreva claramente o que não quer ver. Por exemplo, "parede, moldura".

Não recomendado: evite linguagem instrucional ou palavras como "não". Por exemplo, evite expressões como "sem paredes" ou "não mostrar paredes".

Imagem de exemplo de pintura sem comando negativo — Comando (sem comando negativo): arte conceptual de videojogos em 4K, selva urbana, cidade cyberpunk, renderização detalhada

Imagem de exemplo de pintura com comando negativo — Comando: arte conceptual de videojogos em 4K, selva urbana, cidade cyberpunk, renderização detalhada
Comando negativo: **vegetação, plantas, floresta, árvores**

Imagens fotorrealistas

As diferentes versões do modelo de geração de imagens podem oferecer uma combinação de resultados artísticos e fotorrealistas. Use a seguinte redação nos comandos para gerar resultados mais fotorrealistas, com base no assunto que quer gerar.

Exemplo de utilização	Tipo de lente	Distâncias focais	Detalhes adicionais
Pessoas (retratos)	Prime, zoom	24-35mm	Filme a preto e branco, filme noir, profundidade de campo, duotono (mencionar duas cores)
Comida, insetos, plantas (objetos, natureza morta)	Macro	60-105mm	Detalhes elevados, focagem precisa e iluminação controlada
Desporto, vida selvagem (movimento)	Zoom com teleobjetiva	100-400mm	Velocidade do obturador rápida, ação ou acompanhamento de movimentos
Astronómico, paisagem (grande angular)	Grande angular	10-24mm	Tempos de exposição prolongados, foco nítido, exposição prolongada, água ou nuvens suaves

Retratos

Exemplo de utilização	Tipo de lente	Distâncias focais	Detalhes adicionais
Pessoas (retratos)	Prime, zoom	24-35mm	Filme a preto e branco, filme noir, profundidade de campo, duotono (mencionar duas cores)

Usando várias palavras-chave da tabela, o Imagen pode gerar os seguintes retratos.

Comando: Uma mulher, retrato de 35 mm, tons duplos de azul e cinzento
Modelo: Imagen 3 (imagen-3.0-generate-002)

Comando: Uma mulher, retrato de 35 mm, filme noir
Modelo: Imagen 3 (imagen-3.0-generate-002)

Objetos

Exemplo de utilização	Tipo de lente	Distâncias focais	Detalhes adicionais
Comida, insetos, plantas (objetos, natureza morta)	Macro	60-105mm	Detalhes elevados, focagem precisa e iluminação controlada

Usando várias palavras-chave da tabela, o Imagen pode gerar as seguintes imagens de objetos.

Comando: folha de uma planta-rezadeira, lente macro, 60 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

Comando: um prato de massa, lente macro de 100 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

Movimento

Exemplo de utilização	Tipo de lente	Distâncias focais	Detalhes adicionais
Desporto, vida selvagem (movimento)	Zoom com teleobjetiva	100-400mm	Velocidade do obturador rápida, ação ou acompanhamento de movimentos

Usando várias palavras-chave da tabela, o Imagen pode gerar as seguintes imagens em movimento.

Comando: um touchdown vitorioso, velocidade do obturador rápida, acompanhamento de movimentos
Modelo: Imagen 3 (imagen-3.0-generate-002)

Comando: um veado a correr na floresta, velocidade do obturador rápida, seguimento de movimento
Modelo: Imagen 3 (imagen-3.0-generate-002)

Grande angular

Exemplo de utilização	Tipo de lente	Distâncias focais	Detalhes adicionais
Astronómico, paisagem (grande angular)	Grande angular	10-24mm	Tempos de exposição prolongados, foco nítido, exposição prolongada, água ou nuvens suaves

Usando várias palavras-chave da tabela, o Imagen pode gerar as seguintes imagens de grande angular.

Exemplo de fotografia com grande-angular

Comando: uma cordilheira extensa, paisagem grande angular de 10 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

Comando: uma foto da lua, astrofotografia, grande angular de 10 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

O que se segue?

Leia artigos sobre o Imagen e outros produtos de IA generativa no Vertex AI: