Com a personalização de assunto do Imagen 3, você gera novas imagens com base em um comando de texto e uma imagem de referência. A imagem de referência que você fornece ajuda a orientar a geração de novas imagens.
Casos de uso
A personalização do Imagen 3 oferece comandos de estilo livre, o que pode dar a impressão de que ele pode fazer mais do que foi treinado para fazer. As seções a seguir descrevem os casos de uso pretendidos para a personalização do Imagen 3 e exemplos não exaustivos de casos de uso não pretendidos.
Recomendamos usar a personalização do Imagen 3 para os casos de uso pretendidos, já que treinamos o modelo nesses casos e esperamos bons resultados. Por outro lado, embora seja possível forçar o modelo a fazer coisas fora dos casos de uso pretendidos, não esperamos bons resultados.
Casos de uso pretendidos
Confira a seguir casos de uso destinados à personalização do assunto da personalização do Imagen 3:
- Estilizar a foto de uma pessoa
- Estilizar uma foto de uma pessoa e preservar as expressões faciais dela
- (Baixa taxa de sucesso) Coloque um produto, como um sofá ou um cookie, em diferentes cenas com ângulos diferentes.
- Gerar variações de um produto que não preservam detalhes exatos
- Estilizar uma foto de uma pessoa, preservando a expressão facial
Exemplos de casos de uso não intencionais
Confira uma lista não exaustiva de casos de uso para os quais a personalização do Imagen 3 não foi treinada e que geram resultados ruins:
- Colocar duas ou mais pessoas em cenas diferentes, preservando a identidade delas
- Coloque duas ou mais pessoas em cenas diferentes, preservando as identidades delas e especificando o estilo da imagem de saída usando uma imagem de exemplo como entrada.
- Estilizar uma foto de duas ou mais pessoas preservando as identidades delas
- Colocar um pet em cenas diferentes, preservando a identidade dele
- Estilizar uma foto de um animal de estimação e transformá-la em um desenho
- Estilizar uma foto de um animal de estimação e transformá-la em um desenho, preservando ou especificando o estilo da imagem (como aquarela)
- Coloque um animal de estimação e uma pessoa em uma cena diferente, preservando as identidades de ambos.
- Estilizar uma foto de um animal de estimação e uma ou mais pessoas e transformar em um desenho
- Coloque dois produtos em cenas diferentes com ângulos diferentes
- Colocar um produto, como um biscoito ou um sofá, em diferentes cenas com ângulos diferentes e seguindo um estilo de imagem específico (como fotorrealista com cores, estilos de iluminação ou animação específicos)
- Colocar um produto em uma cena diferente, preservando a composição específica da cena, conforme especificado por uma imagem de controle
- Coloque dois produtos em cenas diferentes com ângulos diferentes, usando uma imagem específica como entrada (como fotorrealista com cores, estilos de iluminação ou animação específicos).
- Coloque dois produtos em cenas diferentes, preservando a composição específica da cena, conforme especificado por uma imagem de controle.
Exemplos de personalização de assunto
As seções a seguir mostram casos compatíveis com a personalização de assunto do Imagen 3:
Personalização de pessoas
Exemplo de entrada | Exemplo de saída |
---|---|
|
![]() |
1 Imagem de entrada de referência gerada usando a geração de imagens do Imagen 3 com base no comando: retrato de uma mulher em paris. ela está usando calças pretas e uma camisa branca.
Personalização de produtos
Exemplo de entrada | Exemplo de saída |
---|---|
|
![]() |
Ver o card do modelo do Imagen para edição e personalização
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
Configure a autenticação do ambiente.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
REST
Para usar as amostras da API REST nesta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para a CLI gcloud.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Para mais informações, consulte Autenticar para usar REST na documentação de autenticação do Google Cloud .
Personalização do assunto
É possível fornecer imagens de referência de tipos de assunto ao usar a personalização do Imagen 3. Especificamente, o comando de poucos exemplos com a personalização do Imagen 3 é compatível com os seguintes temas: produto, pessoa e animal de estimação. O assunto escolhido afeta a forma como você cria o pedido de geração.
O comando usado com a personalização do Imagen 3 pode afetar a qualidade das imagens geradas. As seções a seguir descrevem modelos de comandos e exemplos recomendados para enviar solicitações de personalização.
Personalização de pessoas
A tabela a seguir descreve os modelos de comandos que recomendamos como ponto de partida ao escrever comandos de personalização de pessoa:
Caso de uso Imagens de referência Modelo de comando Exemplo Estilização de imagem de pessoa com entrada de malha facial Imagem do personagem (1)
Imagem de controle de malha facial (1)Gere uma imagem de SUBJECT_DESCRIPTION [1] com o facemesh from the control image [2]. ${PROMPT} Gere uma imagem de the person [1] com o facemesh from the control image [2]. A pessoa precisa estar olhando para frente com uma expressão neutra. O plano de fundo precisa ser um ... Estilização de imagem de pessoa sem entrada de malha facial Imagem do personagem (1 a 4) Crie uma imagem sobre SUBJECT_DESCRIPTION [1] para corresponder à descrição: um retrato de SUBJECT_DESCRIPTION [1] ${PROMPT} Crie uma imagem sobre a woman with short hair[1] para corresponder à descrição: um retrato de a woman with short hair[1] em estilo de desenho animado 3D com fundo desfocado. Um personagem fofo e adorável, com um rosto sorridente, olhando para a câmera, em tons pastel, de alta qualidade, 4k, uma obra-prima, com super detalhes, textura da pele, mapeamento de textura, sombras suaves, iluminação realista suave, cores vibrantes Estilização de imagem de pessoa sem entrada de malha facial Imagem do personagem (1 a 4) Crie uma imagem de STYLE_DESCRIPTION [2] sobre SUBJECT_DESCRIPTION [1] que corresponda à descrição: um retrato de SUBJECT_DESCRIPTION [1] STYLE_PROMPT Crie uma imagem de 3d-cartoon style [2] sobre a woman with short hair [1] que corresponda à descrição: um retrato de a woman with short hair [1] em estilo de desenho animado 3D com plano de fundo desfocado. Um personagem fofo e adorável, com um rosto sorridente. Olhe para a câmera, tom de cor pastel, alta qualidade, 4k, obra-prima, super detalhes, textura da pele, mapeamento de textura, sombras suaves, iluminação suave e realista, cores vibrantes Estilização de imagem de pessoa com entrada de malha facial Imagem do assunto (1 a 3)
Imagem de controle de facemesh (1)Crie uma imagem sobre SUBJECT_DESCRIPTION [1] na pose de CONTROL_IMAGE [2] para corresponder à descrição: um retrato de SUBJECT_DESCRIPTION [1] ${PROMPT} Crie uma imagem sobre a woman with short hair [1] na pose de control image [2] para corresponder à descrição: um retrato de a woman with short hair [1] em estilo de desenho animado 3D com fundo desfocado. Um personagem fofo e adorável com um rosto sorridente. Veja a câmera, tom pastel, alta qualidade, 4k, obra-prima, superdetalhes, textura da pele, mapeamento de textura, sombras suaves, iluminação suave e realista, cores vibrantes Estilização de imagem de pessoa com entrada de malha facial Imagem do assunto (1 a 3)
Imagem de controle de facemesh (1)Crie uma imagem de STYLE_DESCRIPTION [3] sobre SUBJECT_DESCRIPTION [1] na pose de CONTROL_IMAGE [2] para corresponder à descrição: um retrato de SUBJECT_DESCRIPTION [1] ${PROMPT} Crie uma imagem de 3d-cartoon style [3] sobre a woman with short hair [1] na pose de control image [2] para corresponder à descrição: um retrato de a woman with short hair [1] em estilo de desenho animado 3D com plano de fundo desfocado. Um personagem fofo e adorável com um rosto sorridente. Veja a câmera, tom de cor pastel, alta qualidade, 4k, obra-prima, super detalhes, textura da pele, mapeamento de textura, sombras suaves, iluminação suave e realista, cores vibrantes Recomendamos que o rosto na imagem de referência tenha as seguintes propriedades:
- está centralizado e ocupa pelo menos metade da imagem inteira;
- É girado na visualização frontal em todas as direções (rotação, inclinação e guinada)
- Não está encoberto por objetos, como óculos de sol ou máscaras
Use os exemplos a seguir para enviar uma solicitação de personalização com imagens de referência de pessoas usadas para orientar a geração de imagens. Você pode enviar esse tipo de solicitação com ou sem uma imagem de controle de malha facial para orientar ainda mais a geração de imagens.
REST
Para mais informações sobre solicitações de modelo
imagen-3.0-capability-001
, consulte a referência da API do modeloimagen-3.0-capability-001
.Este exemplo mostra como especificar uma área de controle de malha facial para orientar a geração, mas também é possível omitir o objeto de referência de controle (
"referenceType": "REFERENCE_TYPE_CONTROL"
), e o Imagen vai detectar automaticamente uma área de controle de malha facial.Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o ID do projeto do Google Cloud .
- LOCATION: a região do seu projeto. Por exemplo,
us-central1
,europe-west2
ouasia-northeast3
. Para uma lista de regiões disponíveis, consulte IA generativa em locais da Vertex AI. - TEXT_PROMPT: o prompt de texto fornece orientações sobre quais imagens o modelo gera. Para usar a personalização do Imagen 3, inclua o
referenceId
da imagem ou imagens de referência que você fornecer no formato [$referenceId]. Por exemplo:- O comando de texto a seguir é para uma solicitação com duas imagens de referência com
"referenceId": 1
. As duas imagens têm uma descrição opcional de"subjectDescription": "man with short hair"
. Além disso, há uma imagem de malha facial de controle especificada com"referenceId": 2
: Crie uma imagem sobre um man with short hair [1] na pose da imagem de controle [2] para corresponder à descrição: um esboço a lápis de um retrato de corpo inteiro de um man with short hair [1] com desenho de hachura cruzada, desenho de hachura de retrato com lápis 6B e grafite, fundo branco, desenho a lápis, alta qualidade, traço de lápis, olhando para a câmera, olhos humanos naturais
- O comando de texto a seguir é para uma solicitação com duas imagens de referência com
"referenceId"
: o ID da imagem de referência ou de uma série de imagens de referência que correspondem ao mesmo assunto ou estilo. Neste exemplo, as duas imagens de referência são da mesma pessoa. Portanto, elas compartilham o mesmoreferenceId
(1
), e a imagem de malha facial de controle tem umreferenceId
diferente (2
). A imagem gerada segue a estrutura facial da malha extraída da imagem de referência e melhora a aparência do rosto. Apenas um controle de malha facial é compatível.- BASE64_REFERENCE_IMAGE: uma imagem de referência para orientar a geração de imagens. A imagem precisa ser especificada como uma string de bytes codificada em base64.
- SUBJECT_DESCRIPTION: opcional. Uma descrição textual da imagem de referência que você pode usar no campo
prompt
. Exemplo:"prompt": "a full-body portrait of a man with short hair [1] with hatch-cross drawing", [...], "subjectDescription": "man with short hair"
- IMAGE_COUNT: o número de imagens geradas. Valores inteiros aceitos: 1 a 4. Valor padrão: 4.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Corpo JSON da solicitação:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectDescription": "SUBJECT_DESCRIPTION", "subjectType": "SUBJECT_TYPE_PERSON" } }, { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectDescription": "SUBJECT_DESCRIPTION", "subjectType": "SUBJECT_TYPE_PERSON" } }, { "referenceType": "REFERENCE_TYPE_CONTROL", "referenceId": 2, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "controlImageConfig": { "controlType": "CONTROL_TYPE_FACE_MESH", "enableControlImageComputation": true } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content"sampleCount": 2
. A resposta retorna dois objetos de previsão, com os bytes de imagem gerados codificados em base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Python
Personalização de produtos
A tabela a seguir descreve modelos de comandos que recomendamos como ponto de partida ao escrever comandos de personalização de produtos:
Imagens de referência Modelo de comando Exemplo Imagem do personagem (1 a 4) Crie uma imagem sobre SUBJECT_DESCRIPTION [1] que corresponda à descrição: ${PROMPT} Crie uma imagem sobre Luxe Elixir hair oil, golden liquid in glass bottle [1] que corresponda à descrição: Um close de uma mão de mulher segurando Luxe Elixir hair oil, golden liquid in glass bottle [1] em um fundo branco. A mão da mulher está bem iluminada, e o foco está nítido na garrafa, com uma profundidade de campo rasa que desfoca o plano de fundo e enfatiza o produto. A iluminação é suave e difusa, criando um brilho sutil ao redor da garrafa e da mão. A composição geral é simples e elegante, destacando o apelo luxuoso do produto.
Imagem do personagem (1 a 4) Gere uma imagem de um SUBJECT_DESCRIPTION, mas ${PROMPT} Gere uma imagem de um Seiko watch [1], mas em azul.
Use os exemplos a seguir para enviar uma solicitação de personalização com imagens de referência de produtos usadas para orientar a geração de imagens.
Console
-
No Google Cloud console, acesse a página Vertex AI > Media Studio .
Acessar o Media Studio - Na seção Modelo do painel Parâmetros, selecione Imagen 3, caso ainda não esteja selecionado.
- Opcional. Escolha uma proporção diferente de 1:1 (padrão).
- Opcional. Mude o Número de resultados.
- Opcional. Forneça um comando negativo para orientar o modelo sobre o que evitar gerar.
- Opcional. Mude as Opções avançadas.
- No campo comando de texto (Escreva seu comando…), clique em
Adicionar referência.
- No painel Adicionar referência, escolha o Tipo de referência: Subject - product.
- Na seção Imagens de referência, clique em Fazer upload.
- Escolha uma imagem armazenada localmente e clique em Abrir.
- Opcional. Forneça uma Descrição para a imagem de referência.
- Clique em Concluído.
- Opcional. Para adicionar mais imagens de referência, clique em Adicionar uma imagem e faça upload de outra imagem.
- Depois de adicionar todas as imagens de referência, clique em Adicionar referência.
Todas as imagens de referência adicionadas nesse painel têm o mesmo número de referência. Use esse número de referência ao adicionar o comando de texto.
- No campo comando de texto (Escreva seu comando...), adicione um comando
de texto que inclua o número ou os números de referência das imagens
de referência. Por exemplo:
- sala branca e iluminada, o product [1] em uma mesa de vidro
- o animal [1] em um campo aberto com uma floresta ao longe
- um retrato em preto e branco do person [1] em uma rua da cidade em film noir style [2]
REST
Para mais informações sobre solicitações de modelo
imagen-3.0-capability-001
, consulte a referência da API do modeloimagen-3.0-capability-001
.Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o ID do projeto do Google Cloud .
- LOCATION: a região do seu projeto. Por exemplo,
us-central1
,europe-west2
ouasia-northeast3
. Para uma lista de regiões disponíveis, consulte IA generativa em locais da Vertex AI. - TEXT_PROMPT: o prompt de texto fornece orientações sobre quais imagens o modelo gera. Para usar a personalização do Imagen 3, inclua o
referenceId
da imagem ou imagens de referência que você fornecer no formato [$referenceId]. Por exemplo:- Crie uma imagem sobre Luxe Elixir hair oil, golden liquid in glass bottle [1] que corresponda à descrição: um close de uma mão de mulher segurando Luxe Elixir hair oil, golden liquid in glass bottle [1] em um fundo branco. A mão da mulher está bem iluminada, e o foco está nítido na garrafa, com uma profundidade de campo rasa que desfoca o plano de fundo e enfatiza o produto.
"referenceId"
: o ID da imagem de referência ou de uma série de imagens de referência que correspondem ao mesmo assunto ou estilo. Neste exemplo, as duas imagens de referência são do mesmo produto, então elas compartilham o mesmoreferenceId
(1
).- BASE64_REFERENCE_IMAGE: uma imagem de referência para orientar a geração de imagens. A imagem precisa ser especificada como uma string de bytes codificada em base64.
- SUBJECT_DESCRIPTION: opcional. Uma descrição textual da imagem de referência que você pode usar no campo
prompt
. Exemplo:"prompt": "Luxe Elixir hair oil, golden liquid in glass bottle [1] against a pure white background.", [...], "subjectDescription": "Luxe Elixir hair oil, golden liquid in glass bottle"
- IMAGE_COUNT: o número de imagens geradas. Valores inteiros aceitos: 1 a 4. Valor padrão: 4.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Corpo JSON da solicitação:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectType": "SUBJECT_TYPE_PRODUCT", "subjectDescription": "SUBJECT_DESCRIPTION" } }, { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectType": "SUBJECT_TYPE_PRODUCT", "subjectDescription": "SUBJECT_DESCRIPTION" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content"sampleCount": 2
. A resposta retorna dois objetos de previsão, com os bytes de imagem gerados codificados em base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Uso do produto
Para ver os padrões de uso e as restrições de conteúdo associados ao Imagen na Vertex AI, consulte as diretrizes de uso.
Versões do modelo
Há vários modelos de geração de imagens que podem ser usados. Para mais informações, consulte Modelos do Imagen.
A seguir
Confira artigos sobre o Imagen e outras IAs generativas nos produtos da Vertex AI:
- Guia para desenvolvedores sobre como começar a usar o Imagen 3 na Vertex AI
- Novos modelos e ferramentas de mídia generativa criados com criadores para criadores
- Novidades no Gemini: Gems personalizados e geração de imagens aprimorada com o Imagen 3
- Google DeepMind: Imagen 3 — Nosso modelo de qualidade mais alta para conversão de texto em imagem
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-07-15 UTC.