Se usó la API de Cloud Translation para traducir esta página.

API de generación de imágenes

La API de Imagen te permite generar imágenes de alta calidad en segundos, con instrucciones de texto para guiar la generación. También puedes mejorar la resolución de las imágenes con la API de Imagen.

Consulta la tarjeta del modelo de Imagen for Generation

Modelos compatibles

Precaución: A partir del 24 de junio de 2025, las versiones 1 y 2 de Imagen dejarán de estar disponibles. Los modelos de Imagen imagegeneration@002, imagegeneration@005 y imagegeneration@006 se quitarán el 24 de septiembre de 2025 . Para obtener más información sobre la migración a Imagen 3, consulta Migra a Imagen 3.

Precaución: Los siguientes modelos de vista previa de Imagen 4 se quitarán el 30 de noviembre de 2025: imagen-4.0-generate-preview-06-06, imagen-4.0-ultra-generate-preview-06-06 y imagen-4.0-fast-generate-preview-06-06. Para evitar interrupciones del servicio, migra todos los flujos de trabajo que usen modelos de vista previa de Imagen 4 antes del 30 de noviembre de 2025 a los siguientes modelos de Imagen 4 disponibles de forma general: imagen-4.0-generate-001, imagen-4.0-ultra-generate-001 y imagen-4.0-fast-generate-001.

La API de Imagen admite los siguientes modelos:

imagen-4.0-generate-001
imagen-4.0-fast-generate-001
imagen-4.0-ultra-generate-001
imagen-3.0-generate-002
imagen-3.0-generate-001
imagen-3.0-fast-generate-001
imagen-3.0-capability-001
imagegeneration@006
imagegeneration@005
imagegeneration@002

Para obtener más información sobre las funciones que admite cada modelo, consulta Modelos de Imagen.

Ejemplo de sintaxis

Sintaxis para crear una imagen a partir de una instrucción de texto.

Sintaxis

Sintaxis para generar una imagen.

REST

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \

https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/google/models/${MODEL_VERSION}:predict \
-d '{
  "instances": [
    {
      "prompt": "..."
    }
  ],
  "parameters": {
    "sampleCount": ...
  }
}'

Python

generation_model = ImageGenerationModel.from_pretrained("MODEL_VERSION")

response = generation_model.generate_images(
    prompt="...",
    negative_prompt="...",
    aspect_ratio=...,
)
response.images[0].show()

Generar imágenes

REST

Parámetros
`prompt`	`string` Obligatorio. Es la instrucción de texto para la imagen.
`addWatermark`	`bool` Opcional. Agrega una marca de agua invisible a las imágenes generadas. El valor predeterminado es `true`, excepto para los siguientes modelos: `imagegeneration@002` `imagegeneration@005`
`aspectRatio`	`string` Opcional. Es la relación de aspecto de la imagen de salida generada. El valor predeterminado es "1:1". Este parámetro no se aplica a la salida ampliada.
`enhancePrompt`	`boolean` Opcional. Es un parámetro opcional para usar una función de reformulación de instrucciones basada en LLM para generar imágenes de mayor calidad que reflejen mejor la intención de la instrucción original. Inhabilitar esta función puede afectar la calidad de la imagen y el cumplimiento de las instrucciones.
`language`	`string` Opcional. Es el código de idioma que corresponde al idioma de tu instrucción de texto. Se admiten los siguientes valores: `auto`: Detección automática Si Imagen detecta un idioma admitido, la instrucción y una instrucción negativa opcional se traducen al inglés. Si el idioma detectado no es compatible, Imagen usa el texto de entrada tal cual, lo que podría generar un resultado inesperado. No se devuelve ningún código de error. `en`: Inglés (si se omite, se usa el valor predeterminado) `zh` o `zh-CN`: Chino (simplificado) `zh-TW`: Chino (tradicional) `hi`: Hindi `ja`: Japonés `ko`: Coreano `pt`: Portugués `es`: Español
`negativePrompt`	`string` Opcional. Una descripción de lo que se debe evitar en las imágenes generadas. `negativePrompt` no es compatible con `imagen-3.0-generate-002` ni con modelos más recientes.
`outputOptions`	`outputOptions` Opcional. Describe el formato de imagen de salida en un objeto `outputOptions`.
`personGeneration`	`string` Opcional. Permite que el modelo genere personas. Se admiten los siguientes valores: `"dont_allow"`: No permite la inclusión de personas ni rostros en las imágenes. `"allow_adult"`: Permite la generación de adultos solamente. `"allow_all"`: permite la generación de personas de todas las edades. El valor predeterminado es `"allow_adult"`.
`safetySetting`	`string` Opcional. Agrega un nivel de filtro al filtrado de seguridad. Se admiten los siguientes valores: `"block_low_and_above"`: Es el nivel de filtrado más estricto y el bloqueo más estricto. Valor obsoleto: `"block_most"`. `"block_medium_and_above"`: Bloquea algunas instrucciones y respuestas problemáticas. Valor obsoleto: `"block_some"`. `"block_only_high"`: Reduce la cantidad de solicitudes bloqueadas debido a los filtros de seguridad. Puede aumentar el contenido censurable que genera Imagen. Valor obsoleto: `"block_few"`. `"block_none"`: Bloquea muy pocas instrucciones y respuestas problemáticas. El acceso a esta función está restringido. Valor anterior del campo: `"block_fewest"`. El valor predeterminado es `"block_medium_and_above"`.
`sampleCount`	`int` Obligatorio. Es la cantidad de imágenes que se generarán. El valor predeterminado es 4.
`sampleImageSize`	`string` Opcional. Especifica la resolución de salida de la imagen generada. Los valores aceptados son `"1K"` o `"2K"`. El valor predeterminado es `"1K"`.
`seed`	`Uint32` Opcional. La semilla aleatoria para la generación de imágenes. No está disponible cuando `addWatermark` se configura como `true`. Si `enhancePrompt` se establece en `true`, el parámetro `seed` no funcionará, ya que `enhancePrompt` genera una nueva instrucción, lo que da como resultado una imagen nueva o diferente.
`storageUri`	Opcional: `string` Es el URI de Cloud Storage para almacenar las imágenes generadas.

Objeto de opciones de salida

El objeto outputOptions describe el resultado de la imagen.

Parámetros

Parámetros
`outputOptions.mimeType`	Opcional: `string` Es el formato de imagen en el que se debe guardar el resultado. Se admiten los siguientes valores: `"image/png"`: Guardar como imagen PNG `"image/jpeg"`: Guardar como imagen JPEG El valor predeterminado es `"image/png"`.
`outputOptions.compressionQuality`	Opcional: `int` El nivel de compresión si el tipo de salida es `"image/jpeg"`. Los valores aceptados son del 0 al 100. El valor predeterminado es 75.

outputOptions.mimeType

Opcional: string

Es el formato de imagen en el que se debe guardar el resultado. Se admiten los siguientes valores:

"image/png": Guardar como imagen PNG
"image/jpeg": Guardar como imagen JPEG

El valor predeterminado es "image/png".

outputOptions.compressionQuality

Opcional: int

El nivel de compresión si el tipo de salida es "image/jpeg". Los valores aceptados son del 0 al 100. El valor predeterminado es 75.

Respuesta

El cuerpo de la respuesta de la solicitud de REST.

Parámetro
`predictions`	Un array de objetos `VisionGenerativeModelResult`, uno para cada `sampleCount` solicitado. Si la IA responsable filtra alguna imagen, no se incluyen, a menos que `includeRaiReason` se establezca en `true`.

Objeto del resultado del modelo generativo de visión

Parámetro
`bytesBase64Encoded`	La imagen generada codificada en base64. No está presente si la imagen de salida no pasó los filtros de IA responsable.
`mimeType`	Es el tipo de la imagen generada. No está presente si la imagen de salida no pasó los filtros de IA responsable.
`raiFilteredReason`	El motivo del filtro de IA responsable. Solo se muestra si `includeRaiReason` está habilitado y esta imagen se filtró.
`safetyAttributes.categories`	Es el nombre del atributo de seguridad. Solo se muestra si `includeSafetyAttributes` está habilitado y la imagen de salida pasó los filtros de IA responsable.
`safetyAttributes.scores`	La puntuación del atributo de seguridad. Solo se muestra si `includeSafetyAttributes` está habilitado y la imagen de salida pasó los filtros de IA responsable.

Python

Parámetros
`prompt`	`string` Obligatorio. Es la instrucción de texto para la imagen.
`add_watermark`	`bool` Opcional. Agrega una marca de agua a la imagen generada. El valor predeterminado es `true`, excepto para los siguientes modelos: `imagegeneration@002` `imagegeneration@005`
`aspect_ratio`	`string` Opcional. Es la relación de aspecto de la imagen de salida generada. El valor predeterminado es "1:1". Este parámetro no se aplica a la salida ampliada.
`compression_quality`	`int` Opcional. El nivel de compresión si el tipo de MIME de salida es `"image/jpeg"`. El valor predeterminado es 75.
`language`	`string` Opcional. Es el idioma de la instrucción de texto de la imagen. Se admiten los siguientes valores: `auto`: Detección automática Si Imagen detecta un idioma admitido, la instrucción y una instrucción negativa opcional se traducen al inglés. Si el idioma detectado no es compatible, Imagen usa el texto de entrada tal cual, lo que podría generar un resultado inesperado. No se devuelve ningún código de error. `en`: Inglés (si se omite, se usa el valor predeterminado) `zh` o `zh-CN`: Chino (simplificado) `zh-TW`: Chino (tradicional) `hi`: Hindi `ja`: Japonés `ko`: Coreano `pt`: Portugués `es`: Español El valor predeterminado es `"auto"`.
`negative_prompt`	`string` Opcional. Una descripción de lo que se debe evitar en las imágenes generadas. `negative_prompt` no es compatible con `imagen-3.0-generate-002` ni con modelos más recientes.
`number_of_images`	`int` Obligatorio. Es la cantidad de imágenes que se generarán. El valor predeterminado es 1.
`output_gcs_uri`	`string` Opcional. Es el URI de Cloud Storage para almacenar las imágenes generadas.
`output_mime_type`	`string` Opcional. Es el formato de imagen en el que se debe guardar el resultado. Se admiten los siguientes valores: `"image/png"`: Guardar como imagen PNG `"image/jpeg"`: Guardar como imagen JPEG El valor predeterminado es `"image/png"`.
`person_generation`	`string` Opcional. Permite que el modelo genere personas. Se admiten los siguientes valores: `"dont_allow"`: Bloquea la generación de personas `"allow_adult"`: Genera adultos, pero no niños `"allow_all"`: Genera adultos y niños El valor predeterminado es `"allow_adult"`.
`safety_filter_level`	`string` Opcional. Agrega un nivel de filtro al filtrado de seguridad. Se admiten los siguientes valores: `"block_low_and_above"`: Es el nivel de filtrado más estricto, que da como resultado el bloqueo más estricto. Valor obsoleto: `"block_most"`. `"block_medium_and_above"`: Bloquea algunas instrucciones y respuestas problemáticas. Valor obsoleto: `"block_some"`. `"block_only_high"`: Bloquea menos instrucciones y respuestas problemáticas. Valor obsoleto: `"block_few"`. `"block_none"`: Bloquea muy pocas instrucciones y respuestas problemáticas. Valor obsoleto: `"block_fewest"`. El valor predeterminado es `"block_medium_and_above"`.
`sample_image_size`	`string` Opcional. Especifica la resolución de salida de la imagen generada. Los valores aceptados son `"1K"` o `"2K"`. El valor predeterminado es `"1K"`.
`seed`	`int` Opcional. La semilla aleatoria para la generación de imágenes. No está disponible cuando `addWatermark` se configura como `true`. Si `enhancePrompt` se establece en `true`, `seed` no funcionará, ya que `enhancePrompt` genera una nueva instrucción, lo que da como resultado una imagen nueva o diferente.

Mejorar las imágenes

REST

Parámetro
`mode`	`string` Obligatorio. Debe establecerse en `"upscale"` para las solicitudes de escalamiento.
`upscaleConfig`	`UpscaleConfig` Obligatorio. Un objeto `UpscaleConfig`.
`outputOptions`	`OutputOptions` Opcional. Describe el formato de imagen de salida en un objeto `outputOptions`.
`storageUri`	`string` Opcional. Es el URI de Cloud Storage donde se almacenarán las imágenes generadas.

Objeto de configuración de mejora

Parámetro

Parámetro
`upscaleConfig.upscaleFactor`	`string` Obligatorio. El factor de mejora. Los valores admitidos son `"x2"` y `"x4"`.

upscaleConfig.upscaleFactor

string

Obligatorio. El factor de mejora. Los valores admitidos son "x2" y "x4".

Respuesta

El cuerpo de la respuesta de la solicitud de REST.

Parámetro
`predictions`	Un array de objetos `VisionGenerativeModelResult`, uno para cada `sampleCount` solicitado. Si la IA responsable filtra alguna imagen, no se incluyen, a menos que `includeRaiReason` se establezca en `true`.

Ejemplos

En los siguientes ejemplos, se muestra cómo usar los modelos de Imagen para generar imágenes.

Generar imágenes

REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

PROJECT_ID: El Google Cloud ID del proyecto.
MODEL_VERSION: Es la versión del modelo Imagen que se usará. Para obtener más información sobre los modelos disponibles, consulta Modelos de Imagen.
LOCATION: La región del proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para obtener una lista de las regiones disponibles, consulta IA generativa en ubicaciones de Vertex AI.
TEXT_PROMPT: Es la instrucción de texto que guía qué imágenes genera el modelo. Este campo es obligatorio para la generación y la edición.
IMAGE_COUNT: La cantidad de imágenes generadas. Valores de números enteros aceptados: 1-8 (imagegeneration@002), 1-4 (todas las demás versiones del modelo). Valor predeterminado: 4.

Parámetros opcionales adicionales

Usa las siguientes variables opcionales según tu caso de uso. Agrega algunos o todos los siguientes parámetros en el objeto "parameters": {}. Esta lista muestra parámetros opcionales comunes y no pretende ser exhaustiva. Para obtener más información sobre los parámetros opcionales, consulta la referencia de la API de Imagen: Genera imágenes.

"parameters": {
  "sampleCount": IMAGE_COUNT,
  "addWatermark": ADD_WATERMARK,
  "aspectRatio": "ASPECT_RATIO",
  "enhancePrompt": ENABLE_PROMPT_REWRITING,
  "includeRaiReason": INCLUDE_RAI_REASON,
  "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES,
  "outputOptions": {
    "mimeType": "MIME_TYPE",
    "compressionQuality": COMPRESSION_QUALITY
  },
  "personGeneration": "PERSON_SETTING",
  "safetySetting": "SAFETY_SETTING",
  "seed": SEED_NUMBER,
  "storageUri": "OUTPUT_STORAGE_URI"
}

ADD_WATERMARK: booleano. Opcional. Indica si se debe habilitar una marca de agua para las imágenes generadas. Cualquier imagen generada cuando el campo se configura como true contiene un SynthID digital que puedes usar para verificar una imagen con marca de agua. Si omites este campo, se usa el valor predeterminado de true. Debes establecer el valor en false para inhabilitar esta función. Puedes usar el campo seed para obtener una salida determinista solo cuando este campo se establece en false.
ASPECT_RATIO: cadena. Opcional. Es un parámetro del modo de generación que controla la relación de aspecto. Valores de proporción admitidos y su uso previsto:
- 1:1 (predeterminado, cuadrado)
- 3:4 (anuncios y redes sociales)
- 4:3 (TV, fotografía)
- 16:9 (horizontal)
- 9:16 (vertical)
ENABLE_PROMPT_REWRITING: booleano. Opcional. Es un parámetro para usar una función de reformulación de instrucciones basada en LLM para generar imágenes de mayor calidad que reflejen mejor la intención de la instrucción original. Inhabilitar esta función puede afectar la calidad de la imagen y el cumplimiento de las instrucciones. Valor predeterminado true.
INCLUDE_RAI_REASON: booleano. Opcional. Indica si se debe habilitar el código de motivo filtrado de IA responsable en respuestas con entrada o salida bloqueadas. Valor predeterminado: true.
INCLUDE_SAFETY_ATTRIBUTES: booleano. Opcional. Indica si se deben habilitar las puntuaciones redondeadas de IA responsable para obtener una lista de atributos de seguridad en las respuestas de entrada y salida sin filtrar. Categorías de atributos de seguridad: "Death, Harm & Tragedy", "Firearms & Weapons", "Hate", "Health", "Illicit Drugs", "Politics", "Porn", "Religion & Belief", "Toxic", "Violence", "Vulgarity", "War & Conflict". Valor predeterminado: false.
MIME_TYPE: cadena. Opcional. El tipo de MIME del contenido de la imagen. Valores disponibles:
- image/jpeg
- image/gif
- image/png
- image/webp
- image/bmp
- image/tiff
- image/vnd.microsoft.icon
COMPRESSION_QUALITY: número entero. Opcional. Solo se aplica a los archivos de salida JPEG. Es el nivel de detalle que conserva el modelo para las imágenes generadas en formato de archivo JPEG. Valores: 0 a 100, donde un número más alto significa más compresión. Valor predeterminado: 75.
PERSON_SETTING: cadena. Opcional. Es el parámetro de configuración de seguridad que controla el tipo de generación de personas o rostros que permite el modelo. Valores disponibles:
- allow_adult (configuración predeterminada): permite la generación de adultos solamente, excepto la generación de celebridades. No se permite la generación de celebridades para ningún parámetro de configuración.
- dont_allow: Inhabilita la inclusión de personas o rostros en las imágenes generadas.
SAFETY_SETTING: cadena. Opcional. Es un parámetro de configuración que controla los umbrales del filtro de seguridad para las imágenes generadas. Valores disponibles:
- block_low_and_above: El umbral de seguridad más alto, que da como resultado la mayor cantidad de imágenes generadas que se filtran. Valor anterior: block_most.
- block_medium_and_above (configuración predeterminada): Un umbral de seguridad medio que equilibra el filtrado del contenido potencialmente dañino y seguro. Valor anterior: block_some.
- block_only_high: Es un umbral de seguridad que reduce la cantidad de solicitudes bloqueadas debido a los filtros de seguridad. Esta configuración puede aumentar el contenido censurable que genera Imagen. Valor anterior: block_few.
SEED_NUMBER: número entero. Opcional. Cualquier número entero no negativo que proporciones para que las imágenes de salida sean determinísticas. Proporcionar el mismo número de origen siempre da como resultado las mismas imágenes de salida. Si el modelo que usas admite marcas de agua digitales, debes establecer "addWatermark": false para usar este campo. Valores de números enteros aceptados: 1 a 2147483647.
OUTPUT_STORAGE_URI: cadena. Opcional. Es el bucket de Cloud Storage para almacenar las imágenes de salida. Si no se proporciona, se devuelven los bytes de imagen codificados en base64 en la respuesta. Valor de ejemplo: gs://image-bucket/output/.

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Nota: Con el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login, o a través del uso de Cloud Shell, que accede de forma automática a la CLI de gcloud. Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Nota: En el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login . Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content

La siguiente respuesta de muestra es para una solicitud con

"sampleCount":
  2

. La respuesta muestra dos objetos de predicción, con los bytes de imagen generados codificados en base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Si usas un modelo que admite la mejora de instrucciones, la respuesta incluye un campo prompt adicional con la instrucción mejorada que se usó para la generación:

{
  "predictions": [
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_1",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
    },
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_2",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
    }
  ]
}

Python

Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Python.

Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

En este ejemplo, se llama al método generate_images en la ImageGenerationModel (versión @006) y se guardan las imágenes generadas de forma local. Luego, de forma opcional, puedes usar el método show() en un notebook para mostrar las imágenes generadas. Para obtener más información sobre las versiones y las características de los modelos, consulta las versiones del modelo.


import vertexai
from vertexai.preview.vision_models import ImageGenerationModel

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# output_file = "input-image.png"
# prompt = "" # The text prompt describing what you want to see.

vertexai.init(project=PROJECT_ID, location="us-central1")

model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002")

images = model.generate_images(
    prompt=prompt,
    # Optional parameters
    number_of_images=1,
    language="en",
    # You can't use a seed value and watermark at the same time.
    # add_watermark=False,
    # seed=100,
    aspect_ratio="1:1",
    safety_filter_level="block_some",
    person_generation="allow_adult",
)

images[0].save(location=output_file, include_generation_parameters=False)

# Optional. View the generated image in a notebook.
# images[0].show()

print(f"Created output image using {len(images[0]._image_bytes)} bytes")
# Example response:
# Created output image using 1234567 bytes

Mejorar las imágenes

REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

LOCATION: La región del proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para obtener una lista de las regiones disponibles, consulta IA generativa en ubicaciones de Vertex AI.
PROJECT_ID: El Google Cloud ID del proyecto.
B64_BASE_IMAGE: La imagen base que se editará o mejorará. La imagen debe especificarse como una cadena de bytes codificada en base64. Límite de tamaño: 10 MB.
IMAGE_SOURCE: La ubicación de Cloud Storage de la imagen que deseas editar o mejorar. Por ejemplo: gs://output-bucket/source-photos/photo.png.
UPSCALE_FACTOR: Opcional El factor al que se ampliará la imagen. Si no se especifica, el factor de mejora se determinará a partir del lado más largo de la imagen de entrada y sampleImageSize. Valores disponibles: x2 o x4 .

HTTP method and URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "B64_BASE_IMAGE"
        "gcsUri": "IMAGE_SOURCE"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "sampleCount": 1,
    "mode": "upscale",
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content

Deberías recibir una respuesta JSON similar a la que se muestra a continuación:

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII="
    }
  ]
}

¿Qué sigue?

Para obtener más información, consulta la descripción general de Imagen en Vertex AI y cómo generar imágenes con instrucciones de texto.

Genera imágenes con mensajes de texto