Personalización de instrucciones

Puedes usar Imagen en Vertex AI para indicarle al modelo cómo personalizar y transformar los sujetos de una imagen en un estilo que especifiques en una instrucción de texto.

Consulta la tarjeta del modelo de Imagen para edición y personalización

Cómo escribir instrucciones de personalización

La instrucción que uses con la personalización de Imagen 3 podría afectar la calidad de las imágenes generadas. Usa las siguientes plantillas de instrucciones como punto de partida para escribir instrucciones de personalización. Es posible que debas enviar varias solicitudes para obtener el resultado deseado.

Caso de uso Imágenes de referencia Plantilla de instrucciones Ejemplo
Instrucción de personalización: Transferencia de estilo Imagen (1) Transforma el subject in image [1] para que tenga un estilo de ${STYLE_DESCRIPTION}. La imagen muestra ${IMAGE_DESCRIPTION}. Transforma la subject in image [1] para que tenga el estilo de una pintura en acuarela de la imagen con técnicas de acuarela sueltas, tono suave, colores pastel, pinceladas, fondo delicado y limpio, espontaneidad, dibujo de estilo analógico y pintura intrincada muy detallada. La imagen muestra el retrato de una mujer orgullosa.

Personaliza con la instrucción de personalización para la transferencia de estilo

Usa las siguientes muestras de código para especificar el estilo de las imágenes de salida según el estilo que se describe en la instrucción de texto.

REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

  • PROJECT_ID: El Google Cloud ID del proyecto.
  • LOCATION: La región del proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para obtener una lista de las regiones disponibles, consulta IA generativa en ubicaciones de Vertex AI.
  • TEXT_PROMPT: El mensaje de texto guía qué imágenes genera el modelo. Para usar la personalización de Imagen 3, incluye el referenceId de la imagen o las imágenes de referencia que proporciones en el formato [$referenceId]. Por ejemplo:
    • Transforma el sujeto de la imagen [1] para que tenga un estilo de imagen de vitrales digitales.
    • Agrega un sombrero de vaquero rojo al gato de la imagen [1].
    • Quita el perro corgi de la imagen [1].
    • Cambia la pelota roja de la imagen [1] por una caja azul.
  • "referenceId": Es el ID de la imagen de referencia o el ID de una serie de imágenes de referencia que corresponden al mismo tema o estilo.
  • BASE64_REFERENCE_IMAGE: Es una imagen de referencia para guiar la generación de imágenes. La imagen debe especificarse como una cadena de bytes codificada en base64.
  • IMAGE_COUNT: La cantidad de imágenes generadas. Valores de números enteros aceptados: de 1 a 4. Valor predeterminado: 4.

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_RAW",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
La siguiente respuesta de muestra es para una solicitud con "sampleCount": 2. La respuesta muestra dos objetos de predicción, con los bytes de imagen generados codificados en base64.
{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Uso de productos

Para ver los estándares de uso y las restricciones de contenido asociadas con Imagen en Vertex AI, consulta los lineamientos de uso.

Versiones del modelo

Existen varios modelos de generación de imágenes que puedes usar. Para obtener más información, consulta Modelos de Imagen.

¿Qué sigue?

Lee artículos sobre Imagen y otros productos de IA generativa en Vertex AI: