Esta página se ha traducido con Cloud Translation API.

Personalización del asunto

Atención: A partir del 24 de junio del 2025, las versiones 1 y 2 de Imagen estarán obsoletas. Los modelos de Imagen imagegeneration@002, imagegeneration@005 y imagegeneration@006 se retirarán el 24 de septiembre del 2025 . Para obtener más información sobre cómo migrar a Imagen 3, consulta el artículo Migrar a Imagen 3.

La personalización de temas de Imagen 3 te ayuda a generar imágenes nuevas a partir de una petición de texto y una imagen de referencia que proporciones. La imagen de referencia que proporciones ayudará a guiar la generación de la nueva imagen.

Casos prácticos

La personalización de Imagen 3 ofrece peticiones de estilo libre, lo que puede dar la impresión de que puede hacer más de lo que está entrenada para hacer. En las siguientes secciones se describen los casos prácticos previstos para la personalización de Imagen 3 y ejemplos no exhaustivos de casos prácticos no previstos.

Te recomendamos que uses la personalización de Imagen 3 en los casos prácticos previstos, ya que hemos entrenado el modelo para esos casos y esperamos obtener buenos resultados. Por el contrario, aunque puedes pedirle al modelo que haga cosas que no se corresponden con los casos de uso previstos, no esperamos que obtengas buenos resultados.

Casos prácticos previstos

A continuación, se muestran casos prácticos para la personalización de Imagen 3:

Estilizar una foto de una persona
Estilizar una foto de una persona y conservar sus expresiones faciales
(Baja probabilidad de éxito) Coloca un producto, como un sofá o una galleta, en diferentes escenas con distintos ángulos.
Generar variaciones de un producto que no conserve los detalles exactos
Estilizar una foto de una persona sin cambiar su expresión facial

Ejemplos de casos prácticos no previstos

A continuación, se incluye una lista no exhaustiva de casos prácticos para los que no se ha entrenado la personalización de Imagen 3 y que producen resultados de baja calidad:

Coloca a dos o más personas en escenas diferentes y conserva su identidad
Coloca a dos o más personas en escenas diferentes, conservando su identidad y especificando el estilo de la imagen de salida mediante una imagen de ejemplo como entrada para el estilo.
Estilizar una foto de dos o más personas conservando su identidad
Colocar una mascota en diferentes escenas conservando su identidad
Aplicar un estilo a una foto de una mascota y convertirla en un dibujo
Estilizar una foto de una mascota y convertirla en un dibujo, conservando o especificando el estilo de la imagen (por ejemplo, acuarela)
Coloca a una mascota y a una persona en escenas diferentes, pero conservando la identidad de ambos.
Estilizar una foto de una mascota y una o varias personas para convertirla en un dibujo
Colocar dos productos en escenas diferentes con ángulos distintos
Coloca un producto, como una galleta o un sofá, en diferentes escenas con distintos ángulos y siguiendo un estilo de imagen específico (por ejemplo, fotorrealista con colores, estilos de iluminación o animación concretos).
Colocar un producto en una escena diferente, manteniendo la composición específica de la escena tal como se indica en una imagen de control
Colocar dos productos en escenas diferentes con ángulos distintos, usando una imagen específica como entrada (por ejemplo, fotorrealista con colores, estilos de iluminación o animación específicos)
Coloca dos productos en escenas diferentes y conserva la composición específica de la escena tal como se indica en una imagen de control.

Ejemplos de personalización del asunto

En las siguientes secciones se describen los casos admitidos para la personalización de temas de Imagen 3:

Personalización de personas

Entrada de ejemplo	Resultado de ejemplo
Imagen de referencia ¹: Petición de texto: Genera una imagen sobre `woman with long hair[1]` para que coincida con esta descripción: un retrato de `woman with long hair[1]` con un estilo de dibujo animado en 3D y un fondo desenfocado. Un personaje bonito y adorable, con una cara sonriente, mirando a la cámara, con tonos pastel, de alta calidad, 4K, una obra maestra, con muchos detalles, textura de la piel, mapeado de texturas, sombras suaves, iluminación suave y realista, y colores vivos.

Entrada de ejemplo

Resultado de ejemplo

Imagen de referencia ¹:
Petición de texto:
Genera una imagen sobre woman with long hair[1] para que coincida con esta descripción: un retrato de woman with long hair[1] con un estilo de dibujo animado en 3D y un fondo desenfocado. Un personaje bonito y adorable, con una cara sonriente, mirando a la cámara, con tonos pastel, de alta calidad, 4K, una obra maestra, con muchos detalles, textura de la piel, mapeado de texturas, sombras suaves, iluminación suave y realista, y colores vivos.

Ejemplo de salida de personalización de producto

¹ Imagen de entrada de referencia generada con Imagen 3 Generación de imagen a partir de la petición: retrato de una mujer en París. Lleva pantalones negros y una camisa blanca.

Personalización de productos

Entrada de ejemplo	Resultado de ejemplo
Imagen de referencia ²: Petición de texto: Genera una imagen de `perfume bottle [1]`, pero en cian

² Imagen de referencia generada con Imagen 3 a partir de la petición: imagen de un frasco de perfume con estilo de producto delante de un fondo negro.

Ver la tarjeta de modelo de Imagen para edición y personalización

Antes de empezar

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Configura la autenticación de tu entorno.

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

REST

Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.

Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:

gcloud init

Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.

Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre autenticación de Google Cloud .

Personalización del asunto

Puedes proporcionar imágenes de referencia de tipos de temas cuando uses la personalización de Imagen 3. En concreto, la personalización de imágenes con few-shot prompting admite los siguientes temas: producto, persona y animal de compañía. El tema que elijas afectará a la forma en que formules tu solicitud de generación.

La petición que uses con la personalización de Imagen 3 puede afectar a la calidad de las imágenes generadas. En las siguientes secciones se describen plantillas de peticiones recomendadas y ejemplos para enviar solicitudes de personalización.

Personalización de personas

En la siguiente tabla se describen las plantillas de peticiones que recomendamos como punto de partida para escribir peticiones de personalización de personajes:

Caso práctico	Imágenes de referencia	Plantilla de petición	Ejemplo
Estilización de la imagen de una persona con una malla facial	Imagen de sujeto (1) Imagen de control de malla facial (1)	Genera una imagen de `SUBJECT_DESCRIPTION [1]` con el `facemesh from the control image [2]`. ${PROMPT}	Genera una imagen de `the person [1]` con el `facemesh from the control image [2]`. La persona debe mirar directamente hacia delante con una expresión neutra. El fondo debe ser ...
Estilización de la imagen de una persona sin entrada de malla facial	Imagen del sujeto (de 1 a 4)	Crea una imagen sobre `SUBJECT_DESCRIPTION [1]` que coincida con la descripción: un retrato de `SUBJECT_DESCRIPTION [1]` ${PROMPT}	Crea una imagen sobre `a woman with short hair[1]` que coincida con la descripción: un retrato de `a woman with short hair[1]` en estilo de dibujo animado en 3D con el fondo desenfocado. Un personaje bonito y adorable, con una cara sonriente, mirando a la cámara, tonos pastel, alta calidad, 4K, obra maestra, superdetalles, textura de la piel, mapeado de texturas, sombras suaves, iluminación suave y realista, colores vivos
Estilización de la imagen de una persona sin entrada de malla facial	Imagen del sujeto (de 1 a 4)	Crea una imagen `STYLE_DESCRIPTION [2]` sobre `SUBJECT_DESCRIPTION [1]` que coincida con la descripción: un retrato de `SUBJECT_DESCRIPTION [1]` STYLE_PROMPT.	Crea una imagen sobre `3d-cartoon style [2]` `a woman with short hair [1]` que se ajuste a la descripción: un retrato de `a woman with short hair [1]` con estilo de dibujo animado en 3D y fondo desenfocado. Un personaje bonito y adorable, con una cara sonriente. Mira a la cámara, tono de color pastel, alta calidad, 4k, obra maestra, detalles increíbles, piel textura, mapeado de texturas, sombras suaves, iluminación suave y realista, colores vibrantes
Estilización de la imagen de una persona con una malla facial	Imagen del sujeto (1-3) Imagen de control de la malla facial (1)	Crea una imagen sobre `SUBJECT_DESCRIPTION [1]` en la postura de `CONTROL_IMAGE [2]` para que coincida con la descripción: un retrato de `SUBJECT_DESCRIPTION [1]` ${PROMPT}	Crea una imagen de `a woman with short hair [1]` en la postura de `control image [2]` que coincida con la descripción: un retrato de `a woman with short hair [1]` con un estilo de dibujos animados en 3D y un fondo desenfocado. Un personaje bonito y adorable con una cara sonriente. Ver la cámara, tono de color pastel, alta calidad, 4k, obra maestra, superdetalles, textura de la piel, mapeado de texturas, sombras suaves, iluminación suave y realista, colores vivos
Estilización de la imagen de una persona con una malla facial	Imagen del sujeto (1-3) Imagen de control de la malla facial (1)	Crea una imagen `STYLE_DESCRIPTION [3]` sobre `SUBJECT_DESCRIPTION [1]` en la postura de `CONTROL_IMAGE [2]` que coincida con la descripción: un retrato de `SUBJECT_DESCRIPTION [1]` ${PROMPT}	Crea una imagen de `3d-cartoon style [3]` sobre `a woman with short hair [1]` en la postura de `control image [2]` para que coincida con la descripción: un retrato de `a woman with short hair [1]` con un estilo de dibujos animados en 3D y un fondo desenfocado. Un personaje bonito y adorable con una cara sonriente. Ver la cámara, tono de color pastel, alta calidad, 4k, obra maestra, superdetalles, textura de la piel, mapeado de texturas, sombras suaves, iluminación suave y realista, colores vivos

Te recomendamos que la cara de la imagen de referencia tenga las siguientes propiedades:

Estar centrada y ocupar al menos la mitad de la imagen
Gira en la vista frontal en todas las direcciones (rotación, inclinación y guiñada)
No está oculta por objetos, como gafas de sol o mascarillas

Usa los siguientes ejemplos para enviar una solicitud de personalización con imágenes de referencia de personas que se utilizan para guiar la generación de imágenes. Puedes enviar este tipo de solicitudes con o sin una imagen de control de malla facial para guiar aún más la generación de imágenes.

REST

Para obtener más información sobre las solicitudes de modelos de imagen-3.0-capability-001, consulta la referencia de la API de modelos de imagen-3.0-capability-001.

En este ejemplo se muestra cómo especificar un área de control de malla facial para guiar la generación, pero también puedes omitir el objeto de referencia de control ("referenceType": "REFERENCE_TYPE_CONTROL") e Imagen detectará automáticamente un área de control de malla facial.

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

PROJECT_ID: tu Google Cloud ID de proyecto.
LOCATION: la región de tu proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para ver una lista de las regiones disponibles, consulta Ubicaciones de la IA generativa en Vertex AI.
TEXT_PROMPT: La petición de texto indica qué imágenes genera el modelo. Para usar la personalización de Imagen 3, incluye el referenceId de la imagen o las imágenes de referencia que proporciones en el formato [$referenceId]. Por ejemplo:
- La siguiente petición de texto incluye dos imágenes de referencia con "referenceId": 1. Ambas imágenes tienen una descripción opcional de "subjectDescription": "man with short hair". Además, se especifica una imagen de malla facial de control con "referenceId": 2: Crea una imagen sobre un man with short hair [1] en la postura de la imagen de control [2] para que coincida con la descripción: un boceto a lápiz de un retrato de cuerpo entero de un man with short hair [1] con un dibujo de sombreado cruzado, un dibujo de sombreado de un retrato con lápices 6B y de grafito, fondo blanco, dibujo a lápiz, alta calidad, trazo de lápiz, mirando a la cámara, natural ojos humanos
"referenceId": ID de la imagen de referencia o de una serie de imágenes de referencia que corresponden al mismo tema o estilo. En este ejemplo, las dos imágenes de referencia son de la misma persona, por lo que comparten el mismo referenceId (1), y la imagen de la malla facial de control tiene un referenceId (2) distinto. La imagen generada seguirá la estructura facial de la malla facial extraída de la imagen de referencia y mejorará el aspecto de la cara. Solo se admite un control de malla facial.
BASE64_REFERENCE_IMAGE: una imagen de referencia para guiar la generación de imágenes. La imagen debe especificarse como una cadena de bytes codificada en Base64.

SUBJECT_DESCRIPTION: opcional. Una descripción de texto de la imagen de referencia que puedes usar en el campo prompt. Por ejemplo:

      "prompt": "a full-body portrait of a man with short hair [1] with hatch-cross
      drawing",
      [...],
      "subjectDescription": "man with short hair"

IMAGE_COUNT: número de imágenes generadas. Valores enteros aceptados: del 1 al 4. Valor predeterminado: 4.

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [

        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectDescription": "SUBJECT_DESCRIPTION",
            "subjectType": "SUBJECT_TYPE_PERSON"
          }
        },
        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectDescription": "SUBJECT_DESCRIPTION",
            "subjectType": "SUBJECT_TYPE_PERSON"
          }
        },
        {
          "referenceType": "REFERENCE_TYPE_CONTROL",
          "referenceId": 2,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "controlImageConfig": {
            "controlType": "CONTROL_TYPE_FACE_MESH",
            "enableControlImageComputation": true
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Nota: En el siguiente comando se presupone que has iniciado sesión en la CLI de gcloud con tu cuenta de usuario ejecutando gcloud init o gcloud auth login , o bien usando Cloud Shell, que inicia sesión automáticamente en la CLI de gcloud . Para comprobar la cuenta activa, ejecuta el comando gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Nota: El siguiente comando presupone que has iniciado sesión en la CLI de gcloud con tu cuenta de usuario ejecutando gcloud init o gcloud auth login . Para comprobar la cuenta activa, ejecuta el comando gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

La siguiente respuesta de ejemplo corresponde a una solicitud con "sampleCount": 2. La respuesta devuelve dos objetos de predicción con los bytes de la imagen generada codificados en Base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Python

from google import genai
from google.genai.types import (
    ControlReferenceConfig,
    ControlReferenceImage,
    EditImageConfig,
    Image,
    SubjectReferenceConfig,
    SubjectReferenceImage,
)

client = genai.Client()

# TODO(developer): Update and un-comment below line
# output_gcs_uri = "gs://your-bucket/your-prefix"

# Create subject and control reference images of a photograph stored in Google Cloud Storage
# using https://storage.googleapis.com/cloud-samples-data/generative-ai/image/person.png
subject_reference_image = SubjectReferenceImage(
    reference_id=1,
    reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/person.png"),
    config=SubjectReferenceConfig(
        subject_description="a headshot of a woman",
        subject_type="SUBJECT_TYPE_PERSON",
    ),
)
control_reference_image = ControlReferenceImage(
    reference_id=2,
    reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/person.png"),
    config=ControlReferenceConfig(control_type="CONTROL_TYPE_FACE_MESH"),
)

image = client.models.edit_image(
    model="imagen-3.0-capability-001",
    prompt="""
    a portrait of a woman[1] in the pose of the control image[2]in a watercolor style by a professional artist,
    light and low-contrast stokes, bright pastel colors, a warm atmosphere, clean background, grainy paper,
    bold visible brushstrokes, patchy details
    """,
    reference_images=[subject_reference_image, control_reference_image],
    config=EditImageConfig(
        edit_mode="EDIT_MODE_DEFAULT",
        number_of_images=1,
        safety_filter_level="BLOCK_MEDIUM_AND_ABOVE",
        person_generation="ALLOW_ADULT",
        output_gcs_uri=output_gcs_uri,
    ),
)

# Example response:
# gs://your-bucket/your-prefix
print(image.generated_images[0].image.gcs_uri)

Personalización de productos

En la siguiente tabla se describen las plantillas de peticiones que recomendamos como punto de partida para escribir peticiones de personalización de productos:

Imágenes de referencia	Plantilla de petición	Ejemplo
Imagen del sujeto (de 1 a 4)	Crea una imagen sobre `SUBJECT_DESCRIPTION [1]` que se ajuste a la descripción: ${PROMPT}	Crea una imagen sobre `Luxe Elixir hair oil, golden liquid in glass bottle [1]` que se ajuste a la siguiente descripción: una imagen en primer plano y de alto contraste de la mano de una mujer sosteniendo `Luxe Elixir hair oil, golden liquid in glass bottle [1]` sobre un fondo blanco. La mano de la mujer está bien iluminada y el enfoque es nítido en la botella, con una profundidad de campo reducida que difumina el fondo y enfatiza el producto. La iluminación es suave y difusa, lo que crea un brillo sutil alrededor de la botella y la mano. La composición general es sencilla y elegante, y destaca el aspecto lujoso del producto.
Imagen del sujeto (de 1 a 4)	Genera una imagen de `SUBJECT_DESCRIPTION` pero ${PROMPT}	Genera una imagen de un `Seiko watch [1]`, pero en azul.

Usa los siguientes ejemplos para enviar una solicitud de personalización con imágenes de referencia del producto que se utilicen para guiar la generación de imágenes.

Consola

En la Google Cloud consola, ve a la página Vertex AI > Media Studio .
Ir a Media Studio
En la sección Modelo del panel Parámetros, seleccione Imagen 3 si aún no lo ha hecho.
Opcional. Elige una relación de aspecto que no sea 1:1 (predeterminada).
Opcional. Cambia el Número de resultados.
Opcional. Proporciona una petición negativa para indicar al modelo qué debe evitar generar.
Opcional. Cambia las opciones avanzadas que quieras.
En el campo de petición de texto (Escribe tu petición...), haz clic en Añadir referencia.
1. En el panel Añadir referencia, elige el Tipo de referencia: Subject - product.
2. En la sección Imágenes de referencia, haz clic en Subir.
3. Elige una imagen almacenada localmente y haz clic en Abrir.
4. Opcional. Proporciona una descripción de la imagen de referencia.
5. Haz clic en Listo.
6. Opcional. Para añadir más imágenes de referencia, haz clic en Añadir una imagen y sube otra imagen.
7. Cuando hayas añadido todas las imágenes de referencia, haz clic en Añadir referencia.
  Todas las imágenes de referencia que añadas en ese panel tendrán el mismo número de referencia. Usa este número de referencia cuando añadas la petición de texto.
En el campo Petición de texto (Escribe tu petición...), añade una petición de texto que incluya el número o los números de referencia de las imágenes de referencia. Por ejemplo:
1. Habitación de color blanco brillante, el product [1] sobre una mesa de cristal
2. la animal [1] está de pie en un campo abierto con un bosque a lo lejos
3. Retrato en blanco y negro de person [1] en una calle de film noir style [2]

REST

Para obtener más información sobre las solicitudes de modelos de imagen-3.0-capability-001, consulta la referencia de la API de modelos de imagen-3.0-capability-001.

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

PROJECT_ID: tu Google Cloud ID de proyecto.
LOCATION: la región de tu proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para ver una lista de las regiones disponibles, consulta Ubicaciones de la IA generativa en Vertex AI.
TEXT_PROMPT: La petición de texto indica qué imágenes genera el modelo. Para usar la personalización de Imagen 3, incluye el referenceId de la imagen o las imágenes de referencia que proporciones en el formato [$referenceId]. Por ejemplo:
- Crea una imagen sobre Luxe Elixir hair oil, golden liquid in glass bottle [1] que se ajuste a la siguiente descripción: primer plano de una mano de mujer con iluminación intensa que sostiene Luxe Elixir hair oil, golden liquid in glass bottle [1] sobre un fondo blanco. La mano de la mujer está bien iluminada y el enfoque es nítido en la botella, con una profundidad de campo reducida que difumina el fondo y enfatiza el producto.
"referenceId": ID de la imagen de referencia o de una serie de imágenes de referencia que corresponden al mismo tema o estilo. En este ejemplo, las dos imágenes de referencia son del mismo producto, por lo que comparten el mismo referenceId (1).
BASE64_REFERENCE_IMAGE: una imagen de referencia para guiar la generación de imágenes. La imagen debe especificarse como una cadena de bytes codificada en Base64.

SUBJECT_DESCRIPTION: opcional. Una descripción de texto de la imagen de referencia que puedes usar en el campo prompt. Por ejemplo:

      "prompt": "Luxe Elixir hair oil, golden liquid in glass bottle [1]
       against a pure white background.",
      [...],
      "subjectDescription": "Luxe Elixir hair oil, golden liquid in glass bottle"

IMAGE_COUNT: número de imágenes generadas. Valores enteros aceptados: del 1 al 4. Valor predeterminado: 4.

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectType": "SUBJECT_TYPE_PRODUCT",
            "subjectDescription": "SUBJECT_DESCRIPTION"
          }
        },
        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectType": "SUBJECT_TYPE_PRODUCT",
            "subjectDescription": "SUBJECT_DESCRIPTION"
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

La siguiente respuesta de ejemplo corresponde a una solicitud con "sampleCount": 2. La respuesta devuelve dos objetos de predicción con los bytes de la imagen generada codificados en Base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Uso del producto

Para ver los estándares de uso y las restricciones de contenido asociados a Imagen en Vertex AI, consulta las directrices de uso.

Versiones del modelo

Puedes usar varios modelos de generación de imágenes. Para obtener más información, consulta Modelos de imagen.

Siguientes pasos

Consulta artículos sobre Imagen y otros productos de IA generativa en Vertex AI: