Personalización del asunto

La personalización de sujetos de Imagen 3 te ayuda a generar imágenes nuevas a partir de una instrucción de texto y una imagen de referencia que proporciones. La imagen de referencia que proporcionas ayuda a guiar la generación de imágenes nuevas.

Casos de uso

La personalización de Imagen 3 ofrece instrucciones de formato libre, lo que puede dar la impresión de que puede hacer más de lo que está entrenada para hacer. En las siguientes secciones, se describen los casos de uso previstos para la personalización de Imagen 3 y se proporcionan ejemplos no exhaustivos de casos de uso no previstos.

Te recomendamos que uses la personalización de Imagen 3 para los casos de uso previstos, ya que entrenamos el modelo en esos casos de uso y esperamos obtener buenos resultados. Por el contrario, si bien puedes exigirle al modelo que haga cosas fuera de los casos de uso previstos, no esperamos buenos resultados.

Casos de uso previstos

A continuación, se indican los casos de uso previstos para la personalización de temas de Imagen 3:

  • Cómo estilizar la foto de una persona
  • Cómo estilizar la foto de una persona y conservar sus expresiones faciales
  • (Bajo éxito) Coloca un producto, como un sofá o una galleta, en diferentes escenas con diferentes ángulos del producto.
  • Genera variaciones de un producto que no conserva los detalles exactos
  • Cómo estilizar una foto de una persona y conservar su expresión facial

Ejemplos de casos de uso no previstos

A continuación, se incluye una lista no exhaustiva de casos de uso para los que no se entrenó la personalización de Imagen 3 y para los que produce resultados deficientes:

  • Coloca a dos o más personas en diferentes escenas y conserva sus identidades.
  • Coloca a dos o más personas en diferentes escenas y conserva sus identidades, y especifica el estilo de la imagen de salida con una imagen de ejemplo como entrada para el estilo.
  • Cómo estilizar una foto de dos o más personas y conservar sus identidades
  • Coloca una mascota en diferentes escenas y conserva su identidad
  • Cómo estilizar la foto de una mascota y convertirla en un dibujo
  • Estilizar una foto de una mascota y convertirla en un dibujo, a la vez que se conserva o especifica el estilo de la imagen (como acuarela)
  • Coloca a una mascota y a una persona en una escena diferente, conservando la identidad de ambos.
  • Estilizar una foto de una mascota y una o más personas y convertirla en un dibujo
  • Coloca dos productos en diferentes escenas con diferentes ángulos de los productos.
  • Coloca un producto, como una galleta o un sofá, en diferentes escenas con ángulos distintos y siguiendo un estilo de imagen específico (como fotorrealista con colores, estilos de iluminación o animación específicos).
  • Colocar un producto en una escena diferente y, al mismo tiempo, conservar la composición específica de la escena según lo especificado por una imagen de control
  • Coloca dos productos en diferentes escenas con distintos ángulos de los productos, usando una imagen específica como entrada (por ejemplo, fotorrealista con colores, estilos de iluminación o animación específicos).
  • Coloca dos productos en diferentes escenas y conserva la composición específica de la escena según lo especifica una imagen de control.

Ejemplos de personalización del asunto

En las siguientes secciones, se describen los casos admitidos para la personalización de sujetos de Imagen 3:

Personalización de personas

Entrada de ejemplo Resultado de muestra
  1. Imagen de referencia1:
    Ejemplo de entrada para la personalización del producto
  2. Instrucción de texto:
    Genera una imagen sobre woman with long hair[1] para que coincida con esta descripción: un retrato de woman with long hair[1] en estilo de dibujo animado 3D con fondo desenfocado. Un personaje lindo y encantador, con rostro sonriente, mirando a la cámara, tono de color pastel, alta calidad, 4k, obra maestra, súper detalles, textura de la piel, mapeo de texturas, sombras suaves, iluminación suave y realista, colores vibrantes.

Ejemplo de resultado para la personalización del producto

1 Imagen de entrada de referencia generada con la generación de imágenes de Imagen 3 a partir de la instrucción: Retrato de una mujer en París. Lleva pantalones negros y una camisa blanca.

Personalización de productos

Entrada de ejemplo Resultado de muestra
  1. Imagen de referencia2:
    Ejemplo de entrada para la personalización del producto
  2. Instrucción de texto:
    Genera una imagen del perfume bottle [1], pero en cian.

Ejemplo de resultado para la personalización del producto
2 Imagen de entrada de referencia generada con la generación de imágenes de Imagen 3 a partir de la instrucción: Imagen de estilo de producto de una botella de perfume frente a un fondo negro.

Consulta la tarjeta del modelo de Imagen para edición y personalización

Antes de comenzar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Enable the API

  8. Configura la autenticación para tu entorno.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporcionas a la CLI de gcloud.

      After installing the Google Cloud CLI, initialize it by running the following command:

      gcloud init

      If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

    Si deseas obtener más información, consulta Autentica para usar REST en la Google Cloud documentación de autenticación.

    Personalización del asunto

    Puedes proporcionar imágenes de referencia de tipos de sujetos cuando usas la personalización de Imagen 3. Específicamente, la instrucción con pocos ejemplos de Imagen 3 Customization admite los siguientes temas: productos, personas y animales de compañía. El tema que elijas afectará la forma en que formules tu solicitud de generación.

    La instrucción que uses con la personalización de Imagen 3 podría afectar la calidad de las imágenes generadas. En las siguientes secciones, se describen las plantillas de instrucciones y las muestras recomendadas para enviar solicitudes de personalización.

    Personalización de personas

    En la siguiente tabla, se describen las plantillas de instrucciones que recomendamos como punto de partida cuando escribas instrucciones para personalizar personas:

    Caso de uso Imágenes de referencia Plantilla de instrucciones Ejemplo
    Estilización de imágenes de personas con entrada de malla facial Imagen del sujeto (1)

    Imagen de control de Facemesh (1)
    Genera una imagen de SUBJECT_DESCRIPTION [1] con facemesh from the control image [2]. ${PROMPT} Genera una imagen de the person [1] con el facemesh from the control image [2]. La persona debe mirar hacia adelante con una expresión neutra. El fondo debe ser un ...
    Estilización de imágenes de personas sin entrada de malla facial Imagen del sujeto (1 a 4) Crea una imagen sobre SUBJECT_DESCRIPTION [1] que coincida con la descripción: un retrato de SUBJECT_DESCRIPTION [1]. ${PROMPT} Crea una imagen sobre a woman with short hair[1] que coincida con la descripción: un retrato de a woman with short hair[1] en estilo de dibujo animado en 3D con fondo desenfocado. Un personaje lindo y encantador, con rostro sonriente, mirando a la cámara, tonos de color pastel, alta calidad, 4K, obra maestra, detalles increíbles, textura de la piel, asignación de texturas, sombras suaves, iluminación suave y realista, colores vibrantes
    Estilización de imágenes de personas sin entrada de malla facial Imagen del sujeto (1 a 4) Crea una imagen de STYLE_DESCRIPTION [2] sobre SUBJECT_DESCRIPTION [1] que coincida con la descripción: un retrato de SUBJECT_DESCRIPTION [1] STYLE_PROMPT Crea una imagen de 3d-cartoon style [2] sobre a woman with short hair [1] para que coincida con la descripción: Un retrato de a woman with short hair [1] en estilo de dibujos animados en 3D con fondo desenfocado. Un personaje lindo y encantador, con cara sonriente, mirando a la cámara, tono de color pastel, alta calidad, 4k, obra maestra, súper detalles, textura de la piel , mapeado de texturas, sombras suaves, iluminación realista suave, colores vibrantes
    Estilización de imágenes de personas con entrada de malla facial Imagen del sujeto (1 a 3)

    Imagen de control de Facemesh (1)
    Crea una imagen sobre SUBJECT_DESCRIPTION [1] en la pose de CONTROL_IMAGE [2] para que coincida con la descripción: un retrato de SUBJECT_DESCRIPTION [1] ${PROMPT} Crea una imagen sobre a woman with short hair [1] en la pose de control image [2] para que coincida con la descripción: un retrato de a woman with short hair [1] en estilo de dibujos animados en 3D con fondo desenfocado. Un personaje lindo y encantador con cara sonriente. Ver la cámara, tono de color pastel, alta calidad, 4k, obra maestra, súper detalles, textura de la piel, asignación de texturas, sombras suaves, iluminación suave y realista, colores vibrantes
    Estilización de imágenes de personas con entrada de malla facial Imagen del sujeto (1 a 3)

    Imagen de control de Facemesh (1)
    Crea una imagen de STYLE_DESCRIPTION [3] sobre SUBJECT_DESCRIPTION [1] en la pose de CONTROL_IMAGE [2] para que coincida con la descripción: un retrato de SUBJECT_DESCRIPTION [1] ${PROMPT} Crea una imagen de 3d-cartoon style [3] sobre a woman with short hair [1] en la pose de control image [2] para que coincida con la descripción: un retrato de a woman with short hair [1] en estilo de dibujos animados en 3D con fondo desenfocado. Un personaje lindo y encantador con cara sonriente. Se ve la cámara, tono de color pastel, alta calidad, 4k, obra maestra, súper detalles, textura de la piel, asignación de texturas, sombras suaves, iluminación realista suave, colores vibrantes

    Te recomendamos que el rostro de la imagen de referencia tenga las siguientes propiedades:

    • Está centrada y ocupa al menos la mitad de la imagen completa.
    • Se rota en la vista frontal en todas las direcciones (alabeo, cabeceo y guiñada)
    • No está obstruido por objetos, como anteojos de sol o mascarillas

    Usa las siguientes muestras para enviar una solicitud de personalización con imágenes de referencia de personas que se usan para guiar la generación de imágenes. Puedes enviar este tipo de solicitud con o sin una imagen de control de malla facial para guiar aún más la generación de imágenes.

    REST

    Para obtener más información sobre las solicitudes del modelo imagen-3.0-capability-001, consulta la referencia de la API del modelo imagen-3.0-capability-001.

    En este ejemplo, se muestra cómo especificar un área de control de la malla facial para guiar la generación, pero también puedes omitir el objeto de referencia de control ("referenceType": "REFERENCE_TYPE_CONTROL") y, de forma automática, Imagen detectará un área de control de la malla facial.

    Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

    • PROJECT_ID: El Google Cloud ID del proyecto.
    • LOCATION: La región del proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para obtener una lista de las regiones disponibles, consulta IA generativa en ubicaciones de Vertex AI.
    • TEXT_PROMPT: El mensaje de texto guía qué imágenes genera el modelo. Para usar la personalización de Imagen 3, incluye el referenceId de la imagen o las imágenes de referencia que proporciones en el formato [$referenceId]. Por ejemplo:
      • El siguiente mensaje de texto es para una solicitud que tiene dos imágenes de referencia con "referenceId": 1. Ambas imágenes tienen una descripción opcional de "subjectDescription": "man with short hair". Además, se especifica una imagen de malla facial de control con "referenceId": 2: Crea una imagen sobre un man with short hair [1] en la pose de la imagen de control [2] para que coincida con la descripción: Un boceto de estilo lápiz de un retrato de cuerpo completo de un man with short hair [1] con dibujo de sombreado cruzado, dibujo de sombreado de retrato con lápices 6B y de grafito, fondo blanco, dibujo a lápiz, alta calidad, trazo de lápiz, mirando a la cámara, ojos humanos naturales
    • "referenceId": Es el ID de la imagen de referencia o el ID de una serie de imágenes de referencia que corresponden al mismo tema o estilo. En este ejemplo, las dos imágenes de referencia son de la misma persona, por lo que comparten el mismo referenceId (1), y la imagen de la malla facial de control tiene un referenceId distinto (2). La imagen generada seguirá la estructura facial de la malla facial extraída de la imagen de referencia y mejorará la apariencia facial. Solo se admite un control de malla facial.
    • BASE64_REFERENCE_IMAGE: Es una imagen de referencia para guiar la generación de imágenes. La imagen debe especificarse como una cadena de bytes codificada en base64.
    • SUBJECT_DESCRIPTION: Opcional Una descripción de texto de la imagen de referencia que puedes usar en el campo prompt. Por ejemplo:
            "prompt": "a full-body portrait of a man with short hair [1] with hatch-cross
            drawing",
            [...],
            "subjectDescription": "man with short hair"
          
    • IMAGE_COUNT: La cantidad de imágenes generadas. Valores de números enteros aceptados: de 1 a 4. Valor predeterminado: 4.

    Método HTTP y URL:

    POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

    Cuerpo JSON de la solicitud:

    {
      "instances": [
        {
          "prompt": "TEXT_PROMPT",
          "referenceImages": [
    
            {
              "referenceType": "REFERENCE_TYPE_SUBJECT",
              "referenceId": 1,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "subjectImageConfig": {
                "subjectDescription": "SUBJECT_DESCRIPTION",
                "subjectType": "SUBJECT_TYPE_PERSON"
              }
            },
            {
              "referenceType": "REFERENCE_TYPE_SUBJECT",
              "referenceId": 1,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "subjectImageConfig": {
                "subjectDescription": "SUBJECT_DESCRIPTION",
                "subjectType": "SUBJECT_TYPE_PERSON"
              }
            },
            {
              "referenceType": "REFERENCE_TYPE_CONTROL",
              "referenceId": 2,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "controlImageConfig": {
                "controlType": "CONTROL_TYPE_FACE_MESH",
                "enableControlImageComputation": true
              }
            }
          ]
        }
      ],
      "parameters": {
        "sampleCount": IMAGE_COUNT
      }
    }
    

    Para enviar tu solicitud, elige una de estas opciones:

    curl

    Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

    PowerShell

    Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
    La siguiente respuesta de muestra es para una solicitud con "sampleCount": 2. La respuesta muestra dos objetos de predicción, con los bytes de imagen generados codificados en base64.
    {
      "predictions": [
        {
          "bytesBase64Encoded": "BASE64_IMG_BYTES",
          "mimeType": "image/png"
        },
        {
          "mimeType": "image/png",
          "bytesBase64Encoded": "BASE64_IMG_BYTES"
        }
      ]
    }
    

    Python

    from google import genai
    from google.genai.types import (
        ControlReferenceConfig,
        ControlReferenceImage,
        EditImageConfig,
        Image,
        SubjectReferenceConfig,
        SubjectReferenceImage
    )
    
    client = genai.Client()
    
    # TODO(developer): Update and un-comment below line
    # output_gcs_uri = "gs://your-bucket/your-prefix"
    
    # Create subject and control reference images of a photograph stored in Google Cloud Storage
    # using https://storage.googleapis.com/cloud-samples-data/generative-ai/image/person.png
    subject_reference_image = SubjectReferenceImage(
        reference_id=1,
        reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/person.png"),
        config=SubjectReferenceConfig(
            subject_description="a headshot of a woman", subject_type="SUBJECT_TYPE_PERSON"
        ),
    )
    control_reference_image = ControlReferenceImage(
        reference_id=2,
        reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/person.png"),
        config=ControlReferenceConfig(control_type="CONTROL_TYPE_FACE_MESH"),
    )
    
    image = client.models.edit_image(
        model="imagen-3.0-capability-001",
        prompt="""
        a portrait of a woman[1] in the pose of the control image[2]in a watercolor style by a professional artist,
        light and low-contrast stokes, bright pastel colors, a warm atmosphere, clean background, grainy paper,
        bold visible brushstrokes, patchy details
        """,
        reference_images=[subject_reference_image, control_reference_image],
        config=EditImageConfig(
            edit_mode="EDIT_MODE_DEFAULT",
            number_of_images=1,
            seed=1,
            safety_filter_level="BLOCK_MEDIUM_AND_ABOVE",
            person_generation="ALLOW_ADULT",
            output_gcs_uri=output_gcs_uri,
        ),
    )
    
    # Example response:
    # gs://your-bucket/your-prefix
    print(image.generated_images[0].image.gcs_uri)

    Personalización de productos

    En la siguiente tabla, se describen las plantillas de instrucciones que recomendamos como punto de partida cuando escribas instrucciones de personalización de productos:

    Imágenes de referencia Plantilla de instrucciones Ejemplo
    Imagen del sujeto (1 a 4) Crea una imagen sobre SUBJECT_DESCRIPTION [1] que coincida con la descripción: ${PROMPT}

    Crea una imagen sobre Luxe Elixir hair oil, golden liquid in glass bottle [1] que coincida con la descripción: Una imagen en primer plano y de clave alta de la mano de una mujer sosteniendo Luxe Elixir hair oil, golden liquid in glass bottle [1] sobre un fondo blanco puro. La mano de la mujer está bien iluminada y el enfoque es nítido en la botella, con una profundidad de campo superficial que desenfoca el fondo y enfatiza el producto. La iluminación es suave y difusa, lo que crea un brillo sutil alrededor de la botella y la mano. La composición general es simple y elegante, y destaca el atractivo lujoso del producto.

    Imagen del sujeto (1 a 4) Genera una imagen de un SUBJECT_DESCRIPTION, pero ${PROMPT}

    Genera una imagen de un Seiko watch [1], pero en azul.

    Usa los siguientes ejemplos para enviar una solicitud de personalización con imágenes de referencia del producto que se usan para guiar la generación de imágenes.

    Console

    1. En la Google Cloud consola, ve a la página Vertex AI > Media Studio .
      Ir a Media Studio
    2. En la sección Modelo del panel Parámetros, selecciona Imagen 3 si aún no está seleccionado.
    3. Opcional. Elige una relación de aspecto que no sea 1:1 (predeterminada).
    4. Opcional. Cambia la Cantidad de resultados.
    5. Opcional. Proporciona una instrucción negativa para guiar al modelo sobre lo que debe evitar generar.
    6. Opcional. Cambia las Opciones avanzadas que desees.
    7. En el campo de instrucción de texto (Escribe tu instrucción…), haz clic en Agregar referencia.
      1. En el panel Agregar referencia, elige el Tipo de referencia: Subject - product.
      2. En la sección Imágenes de referencia, haz clic en Subir.
      3. Elige una imagen almacenada de forma local y haz clic en Abrir.
      4. Opcional. Proporciona una Descripción para la imagen de referencia.
      5. Haz clic en Listo.
      6. Opcional. Para agregar más imágenes de referencia, haz clic en Agregar una imagen y sube otra imagen.
      7. Después de agregar todas las imágenes de referencia, haz clic en Agregar referencia.

        Todas las imágenes de referencia que agregues en ese panel tienen el mismo número de referencia. Usa este número de referencia cuando agregues la instrucción de texto.

    8. En el campo de instrucción de texto (Escribe tu instrucción…), agrega una instrucción de texto que incluya el número o los números de referencia de las imágenes de referencia. Por ejemplo:
      1. Habitación blanca y luminosa, el product [1] sobre una mesa de vidrio
      2. el animal [1] parado en un campo abierto con un bosque a la distancia
      3. un retrato en blanco y negro del person [1] en una calle de la ciudad en film noir style [2]

    REST

    Para obtener más información sobre las solicitudes del modelo imagen-3.0-capability-001, consulta la referencia de la API del modelo imagen-3.0-capability-001.

    Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

    • PROJECT_ID: El Google Cloud ID del proyecto.
    • LOCATION: La región del proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para obtener una lista de las regiones disponibles, consulta IA generativa en ubicaciones de Vertex AI.
    • TEXT_PROMPT: El mensaje de texto guía qué imágenes genera el modelo. Para usar la personalización de Imagen 3, incluye el referenceId de la imagen o las imágenes de referencia que proporciones en el formato [$referenceId]. Por ejemplo:
      • Crea una imagen sobre Luxe Elixir hair oil, golden liquid in glass bottle [1] que coincida con la siguiente descripción: Una imagen en primer plano y con iluminación intensa de la mano de una mujer sosteniendo Luxe Elixir hair oil, golden liquid in glass bottle [1] contra un fondo blanco puro. La mano de la mujer está bien iluminada y el enfoque es nítido en la botella, con una profundidad de campo superficial que desenfoca el fondo y enfatiza el producto.
    • "referenceId": Es el ID de la imagen de referencia o el ID de una serie de imágenes de referencia que corresponden al mismo tema o estilo. En este ejemplo, las dos imágenes de referencia son del mismo producto, por lo que comparten el mismo referenceId (1).
    • BASE64_REFERENCE_IMAGE: Es una imagen de referencia para guiar la generación de imágenes. La imagen debe especificarse como una cadena de bytes codificada en base64.
    • SUBJECT_DESCRIPTION: Opcional Una descripción de texto de la imagen de referencia que puedes usar en el campo prompt. Por ejemplo:
            "prompt": "Luxe Elixir hair oil, golden liquid in glass bottle [1]
             against a pure white background.",
            [...],
            "subjectDescription": "Luxe Elixir hair oil, golden liquid in glass bottle"
          
    • IMAGE_COUNT: La cantidad de imágenes generadas. Valores de números enteros aceptados: de 1 a 4. Valor predeterminado: 4.

    Método HTTP y URL:

    POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

    Cuerpo JSON de la solicitud:

    {
      "instances": [
        {
          "prompt": "TEXT_PROMPT",
          "referenceImages": [
            {
              "referenceType": "REFERENCE_TYPE_SUBJECT",
              "referenceId": 1,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "subjectImageConfig": {
                "subjectType": "SUBJECT_TYPE_PRODUCT",
                "subjectDescription": "SUBJECT_DESCRIPTION"
              }
            },
            {
              "referenceType": "REFERENCE_TYPE_SUBJECT",
              "referenceId": 1,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "subjectImageConfig": {
                "subjectType": "SUBJECT_TYPE_PRODUCT",
                "subjectDescription": "SUBJECT_DESCRIPTION"
              }
            }
          ]
        }
      ],
      "parameters": {
        "sampleCount": IMAGE_COUNT
      }
    }
    

    Para enviar tu solicitud, elige una de estas opciones:

    curl

    Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

    PowerShell

    Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
    La siguiente respuesta de muestra es para una solicitud con "sampleCount": 2. La respuesta muestra dos objetos de predicción, con los bytes de imagen generados codificados en base64.
    {
      "predictions": [
        {
          "bytesBase64Encoded": "BASE64_IMG_BYTES",
          "mimeType": "image/png"
        },
        {
          "mimeType": "image/png",
          "bytesBase64Encoded": "BASE64_IMG_BYTES"
        }
      ]
    }
    

    Uso de productos

    Para ver los estándares de uso y las restricciones de contenido asociadas con Imagen en Vertex AI, consulta los lineamientos de uso.

    Versiones del modelo

    Existen varios modelos de generación de imágenes que puedes usar. Para obtener más información, consulta Modelos de Imagen.

    ¿Qué sigue?

    Lee artículos sobre Imagen y otros productos de IA generativa en Vertex AI: