Generar imágenes

La API de Imagen te permite crear imágenes de alta calidad en segundos, con instrucciones de texto para guiar la generación. También puedes mejorar las imágenes con la API de Image.

Cómo ver la tarjeta de modelo de Imagen para la generación

Modelos compatibles

La API de Imagen admite los siguientes modelos:

  • imagen-4-0-generate-preview-05-20 (vista previa)
  • imagen-4.0-ultra-generate-exp-05-20 (experimental)
  • imagen-3.0-generate-002
  • imagen-3.0-generate-001
  • imagen-3.0-fast-generate-001
  • imagen-3.0-capability-001
  • imagegeneration@006
  • imagegeneration@005
  • imagegeneration@002

Para obtener más información sobre las funciones que admite cada modelo, consulta Modelos de imagen.

Ejemplo de sintaxis

Sintaxis para crear una imagen a partir de una instrucción de texto.

Sintaxis

Sintaxis para generar una imagen.

REST

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \

https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/google/models/${MODEL_VERSION}:predict \
-d '{
  "instances": [
    {
      "prompt": "..."
    }
  ],
  "parameters": {
    "sampleCount": ...
  }
}'

Python

generation_model = ImageGenerationModel.from_pretrained("MODEL_VERSION")

response = generation_model.generate_images(
    prompt="...",
    negative_prompt="...",
    aspect_ratio=...,
)
response.images[0].show()

Lista de parámetros

Consulta ejemplos para obtener detalles sobre la implementación.

Generar imágenes

REST

Parámetros
prompt

string

Obligatorio. Es la instrucción de texto para la imagen.

sampleCount

int

Obligatorio. Es la cantidad de imágenes que se generarán. El valor predeterminado es 4.

seed

Uint32

Opcional. La semilla aleatoria para la generación de imágenes. No está disponible cuando addWatermark se configura como true.

Si enhancePrompt se establece en true, el parámetro seed no funcionará, ya que enhancePrompt genera una instrucción nueva, lo que genera una imagen nueva o diferente.

enhancePrompt

boolean

Opcional. Es un parámetro opcional para usar una función de reformulación de instrucciones basada en LLM para generar imágenes de mayor calidad que reflejen mejor la intención de la instrucción original. Inhabilitar esta función puede afectar la calidad de la imagen y el cumplimiento de las instrucciones.

negativePrompt

string

Opcional. Una descripción de lo que se debe evitar en las imágenes generadas.

negativePrompt no es compatible con imagen-3.0-generate-002 ni con modelos más recientes.

aspectRatio

string

Opcional. Es la relación de aspecto de la imagen. El valor predeterminado es "1:1".

outputOptions

outputOptions

Opcional. Describe el formato de imagen de salida en un objeto outputOptions.

sampleImageStyle

string

Opcional. Describe el estilo de las imágenes generadas. Se admiten los siguientes valores:

  • "photograph"
  • "digital_art"
  • "landscape"
  • "sketch"
  • "watercolor"
  • "cyberpunk"
  • "pop_art"

sampleImageStyle solo es compatible con imagegeneration@002.

personGeneration

string

Opcional. Permite que el modelo genere personas. Se admiten los siguientes valores:

  • "dont_allow": No permite la inclusión de personas ni rostros en las imágenes.
  • "allow_adult": Permite la generación de adultos solamente.
  • "allow_all": permite la generación de personas de todas las edades.

El valor predeterminado es "allow_adult".

language

string

Opcional. Es el código de idioma que corresponde al idioma de la instrucción de texto. Se admiten los siguientes valores:

  • auto: Detección automática Si Imagen detecta un idioma admitido, la instrucción y una instrucción negativa opcional se traducen al inglés. Si el idioma detectado no es compatible, Imagen usa el texto de entrada de forma literal, lo que podría generar un resultado inesperado. No se muestra ningún código de error.
  • en: Inglés (si se omite, se usa el valor predeterminado)
  • zh o zh-CN: Chino (simplificado)
  • zh-TW: Chino (tradicional)
  • hi: Hindi
  • ja: Japonés
  • ko: Coreano
  • pt: Portugués
  • es: Español
safetySetting

string

Opcional. Agrega un nivel de filtro al filtrado de seguridad. Se admiten los siguientes valores:

  • "block_low_and_above": Es el nivel de filtrado más estricto y el bloqueo más estricto. Valor obsoleto: "block_most".
  • "block_medium_and_above": Bloquea algunas instrucciones y respuestas problemáticas. Valor obsoleto: "block_some".
  • "block_only_high": Reduce la cantidad de solicitudes bloqueadas debido a los filtros de seguridad. Puede aumentar el contenido censurable que genera Imagen. Valor obsoleto: "block_few".
  • "block_none": Bloquea muy pocas instrucciones y respuestas problemáticas. El acceso a esta función está restringido. Valor del campo anterior: "block_fewest".

El valor predeterminado es "block_medium_and_above".

addWatermark

bool

Opcional. Agrega una marca de agua invisible a las imágenes generadas.

El valor predeterminado es true, excepto para los siguientes modelos:

  • imagegeneration@002
  • imagegeneration@005
storageUri

Opcional: string

Es el URI de Cloud Storage para almacenar las imágenes generadas.

Objeto de opciones de salida

El objeto outputOptions describe el resultado de la imagen.

Parámetros
outputOptions.mimeType

Opcional: string

Es el formato de imagen en el que se debe guardar el resultado. Se admiten los siguientes valores:

  • "image/png": Guardar como imagen PNG
  • "image/jpeg": Guardar como imagen JPEG

El valor predeterminado es "image/png".

outputOptions.compressionQuality

Opcional: int

El nivel de compresión si el tipo de salida es "image/jpeg". Los valores aceptados son del 0 al 100. El valor predeterminado es 75.

Respuesta

El cuerpo de la respuesta de la solicitud de REST.

Parámetro
predictions

Un array de objetos VisionGenerativeModelResult, uno para cada sampleCount solicitado. Si la IA responsable filtra alguna imagen, no se incluyen, a menos que includeRaiReason se establezca en true.

Objeto del resultado del modelo generativo de visión

Objeto del resultado del modelo generativo de visión

Parámetro
bytesBase64Encoded

La imagen generada codificada en base64. No está presente si la imagen de salida no pasó los filtros de IA responsable.

mimeType

Es el tipo de la imagen generada. No está presente si la imagen de salida no pasó los filtros de IA responsable.

raiFilteredReason

El motivo del filtro de IA responsable. Solo se muestra si includeRaiReason está habilitado y esta imagen se filtró.

safetyAttributes.categories

Es el nombre del atributo de seguridad. Solo se muestra si includeSafetyAttributes está habilitado y la imagen de salida pasó los filtros de IA responsable.

safetyAttributes.scores

La puntuación del atributo de seguridad. Solo se muestra si includeSafetyAttributes está habilitado y la imagen de salida pasó los filtros de IA responsable.

Python

Parámetros
prompt

string

Obligatorio. Es la instrucción de texto para la imagen.

number_of_images

int

Obligatorio. Es la cantidad de imágenes que se generarán. El valor predeterminado es 1.

seed

int

Opcional. La semilla aleatoria para la generación de imágenes. No está disponible cuando addWatermark se configura como true.

Si enhancePrompt se establece en true, seed no funcionará, ya que enhancePrompt genera una instrucción nueva, lo que genera una imagen nueva o diferente.

negative_prompt

string

Opcional. Una descripción de lo que se debe evitar en las imágenes generadas.

negative_prompt no es compatible con imagen-3.0-generate-002 ni con modelos más recientes.

aspect_ratio

string

Opcional. Es la relación de aspecto de la imagen. El valor predeterminado es "1:1".

output_mime_type

string

Opcional. Es el formato de imagen en el que se debe guardar el resultado. Se admiten los siguientes valores:

  • "image/png": Guardar como imagen PNG
  • "image/jpeg": Guardar como imagen JPEG

El valor predeterminado es "image/png".

compression_quality

int

Opcional. El nivel de compresión si el tipo de MIME de salida es "image/jpeg". El valor predeterminado es 75.

language

string

Opcional. Es el idioma de la instrucción de texto de la imagen. Se admiten los siguientes valores:

  • auto: Detección automática Si Imagen detecta un idioma admitido, la instrucción y una instrucción negativa opcional se traducen al inglés. Si el idioma detectado no es compatible, Imagen usa el texto de entrada de forma literal, lo que podría generar un resultado inesperado. No se muestra ningún código de error.
  • en: Inglés (si se omite, se usa el valor predeterminado)
  • zh o zh-CN: Chino (simplificado)
  • zh-TW: Chino (tradicional)
  • hi: Hindi
  • ja: Japonés
  • ko: Coreano
  • pt: Portugués
  • es: Español

El valor predeterminado es "auto".

output_gcs_uri

string

Opcional. Es el URI de Cloud Storage para almacenar las imágenes generadas.

add_watermark

bool

Opcional. Agrega una marca de agua a la imagen generada.

El valor predeterminado es true, excepto para los siguientes modelos:

  • imagegeneration@002
  • imagegeneration@005
safety_filter_level

string

Opcional. Agrega un nivel de filtro al filtrado de seguridad. Se admiten los siguientes valores:

  • "block_low_and_above": Es el nivel de filtrado más estricto y el bloqueo más estricto. Valor obsoleto: "block_most".
  • "block_medium_and_above": Bloquea algunas instrucciones y respuestas problemáticas. Valor obsoleto: "block_some".
  • "block_only_high": Bloquea menos instrucciones y respuestas problemáticas. Valor obsoleto: "block_few".
  • "block_none": Bloquea muy pocas instrucciones y respuestas problemáticas. Valor obsoleto: "block_fewest".

El valor predeterminado es "block_medium_and_above".

person_generation

string

Opcional. Permite que el modelo genere personas. Se admiten los siguientes valores:

  • "dont_allow": Bloquea la generación de personas
  • "allow_adult": Genera adultos, pero no niños
  • "allow_all": Genera adultos y niños

El valor predeterminado es "allow_adult".

Mejorar las imágenes

REST

Parámetro
mode

string

Obligatorio. Debe establecerse en "upscale" para las solicitudes de escalamiento.

upscaleConfig

UpscaleConfig

Obligatorio. Un objeto UpscaleConfig.

outputOptions

OutputOptions

Opcional. Describe el formato de imagen de salida en un objeto outputOptions.

storageUri

string

Opcional. Es el URI de Cloud Storage donde se almacenarán las imágenes generadas.

Objeto de configuración de mejora

Parámetro
upscaleConfig.upscaleFactor

string

Obligatorio. El factor de mejora. Los valores admitidos son "x2" y "x4".

Respuesta

El cuerpo de la respuesta de la solicitud de REST.

Parámetro
predictions

Un array de objetos VisionGenerativeModelResult, uno para cada sampleCount solicitado. Si la IA responsable filtra alguna imagen, no se incluyen, a menos que includeRaiReason se establezca en true.

Ejemplos

En los siguientes ejemplos, se muestra cómo usar los modelos de Imagen para generar imágenes.

Generar imágenes

REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

  • PROJECT_ID: El Google Cloud ID de tu proyecto.
  • MODEL_VERSION: La versión del modelo imagegeneration que se usará. Valores disponibles:
      .
    • Imagen 3:
      • imagen-3.0-generate-002 (modelo más reciente)
      • imagen-3.0-generate-001
      • imagen-3.0-fast-generate-001: Versión del modelo de baja latencia.
    • Versión predeterminada del modelo:
      • imagegeneration: Usa la versión de modelo predeterminada v.006. Como práctica recomendada, siempre debes especificar una versión del modelo, en especial en entornos de producción.

    Para obtener más información sobre las versiones y los atributos del modelo, consulta las versiones del modelo.

  • LOCATION: La región del proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para obtener una lista de las regiones disponibles, consulta IA generativa en ubicaciones de Vertex AI.
  • TEXT_PROMPT: El mensaje de texto que guía qué imágenes genera el modelo. Este campo es obligatorio para la generación y la edición.
  • IMAGE_COUNT: La cantidad de imágenes generadas. Valores de números enteros aceptados: 1-8 (imagegeneration@002), 1-4 (todas las demás versiones del modelo). Valor predeterminado: 4.
  • Parámetros opcionales adicionales

    Usa las siguientes variables opcionales según tu caso de uso. Agrega algunos o todos los siguientes parámetros en el objeto "parameters": {}. Esta lista muestra parámetros opcionales comunes y no pretende ser exhaustiva. Para obtener más información sobre los parámetros opcionales, consulta la referencia de la API de Imagen: Genera imágenes.

    "parameters": {
      "sampleCount": IMAGE_COUNT,
      "addWatermark": ADD_WATERMARK,
      "aspectRatio": "ASPECT_RATIO",
      "enhancePrompt": ENABLE_PROMPT_REWRITING,
      "includeRaiReason": INCLUDE_RAI_REASON,
      "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES,
      "outputOptions": {
        "mimeType": "MIME_TYPE",
        "compressionQuality": COMPRESSION_QUALITY
      },
      "personGeneration": "PERSON_SETTING",
      "safetySetting": "SAFETY_SETTING",
      "seed": SEED_NUMBER,
      "storageUri": "OUTPUT_STORAGE_URI"
    }
    
    • ADD_WATERMARK: Es un valor booleano. Opcional. Indica si se debe habilitar una marca de agua para las imágenes generadas. Cualquier imagen generada cuando el campo se configura como true contiene un SynthID digital que puedes usar para verificar una imagen con marca de agua. Si omites este campo, se usa el valor predeterminado de true. Debes establecer el valor en false para inhabilitar esta función. Puedes usar el campo seed para obtener una salida determinista solo cuando este campo se establece en false.
    • ASPECT_RATIO: Es una cadena. Opcional. Un parámetro de modo de generación que controla la relación de aspecto. Valores de proporción admitidos y su uso previsto:
      • 1:1 (predeterminado, cuadrado)
      • 3:4 (anuncios y redes sociales)
      • 4:3 (TV, fotografía)
      • 16:9 (horizontal)
      • 9:16 (vertical)
    • ENABLE_PROMPT_REWRITING: Es un valor booleano. Opcional. Es un parámetro para usar una función de reformulación de instrucciones basada en LLM para generar imágenes de mayor calidad que reflejen mejor la intención de la instrucción original. Inhabilitar esta función puede afectar la calidad de la imagen y el cumplimiento de las instrucciones. Valor predeterminado true.
    • INCLUDE_RAI_REASON: Es un valor booleano. Opcional. Indica si se debe habilitar el código de motivo de IA responsable filtrado en respuestas con entradas o salidas bloqueadas. Valor predeterminado: false.
    • INCLUDE_SAFETY_ATTRIBUTES: Es un valor booleano. Opcional. Indica si se deben habilitar las puntuaciones redondeadas de IA responsable para obtener una lista de atributos de seguridad en las respuestas de entrada y salida sin filtrar. Categorías de atributos de seguridad: "Death, Harm & Tragedy", "Firearms & Weapons", "Hate", "Health", "Illicit Drugs", "Politics", "Porn", "Religion & Belief", "Toxic", "Violence", "Vulgarity", "War & Conflict". Valor predeterminado: false.
    • MIME_TYPE: Es una cadena. Opcional. El tipo de MIME del contenido de la imagen. Valores disponibles:
      • image/jpeg
      • image/gif
      • image/png
      • image/webp
      • image/bmp
      • image/tiff
      • image/vnd.microsoft.icon
    • COMPRESSION_QUALITY: Es un número entero. Opcional. Solo se aplica a los archivos de salida JPEG. Es el nivel de detalle que el modelo conserva para las imágenes generadas en formato de archivo JPEG. Valores: 0 a 100, en los que un número más alto significa más compresión. Valor predeterminado: 75.
    • PERSON_SETTING: Es una cadena. Opcional. Es la configuración de seguridad que controla el tipo de generación de personas o rostros que permite el modelo. Valores disponibles:
      • allow_adult (configuración predeterminada): permite la generación de adultos solamente, excepto la generación de celebridades. No se permite la generación de celebridades para ningún parámetro de configuración.
      • dont_allow: Inhabilita la inclusión de personas o rostros en las imágenes generadas.
    • SAFETY_SETTING: Es una cadena. Opcional. Es un parámetro de configuración que controla los umbrales del filtro de seguridad para las imágenes generadas. Valores disponibles:
      • block_low_and_above: El umbral de seguridad más alto, que da como resultado la mayor cantidad de imágenes generadas que se filtran. Valor anterior: block_most.
      • block_medium_and_above (configuración predeterminada): Un umbral de seguridad medio que equilibra el filtrado del contenido potencialmente dañino y seguro. Valor anterior: block_some.
      • block_only_high: Un umbral de seguridad que reduce la cantidad de solicitudes bloqueadas debido a los filtros de seguridad. Esta configuración puede aumentar el contenido censurable que genera Imagen. Valor anterior: block_few.
    • SEED_NUMBER: Es un número entero. Opcional. Cualquier número entero no negativo que proporciones para que las imágenes de salida sean determinísticas. Proporcionar el mismo número de origen siempre da como resultado las mismas imágenes de salida. Si el modelo que usas admite la marca de agua digital, debes configurar "addWatermark": false para usar este campo. Valores de números enteros aceptados: 1 - 2147483647.
    • OUTPUT_STORAGE_URI: Es una cadena. Opcional. Es el bucket de Cloud Storage para almacenar las imágenes de salida. Si no se proporciona, se muestran bytes de imagen codificados en base64 en la respuesta. Valor de muestra: gs://image-bucket/output/.

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
La siguiente respuesta de muestra es para una solicitud con "sampleCount": 2. La respuesta muestra dos objetos de predicción, con los bytes de imagen generados codificados en base64.
{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Si usas un modelo que admite la mejora de instrucciones, la respuesta incluye un campo prompt adicional con la instrucción mejorada que se usó para la generación:

{
  "predictions": [
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_1",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
    },
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_2",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
    }
  ]
}

Python

Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Python.

Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

En este ejemplo, se llama al método generate_images en la ImageGenerationModel (versión @006) y se guardan las imágenes generadas de forma local. Luego, de forma opcional, puedes usar el método show() en un notebook para mostrar las imágenes generadas. Para obtener más información sobre las versiones y las características de los modelos, consulta las versiones del modelo.


import vertexai
from vertexai.preview.vision_models import ImageGenerationModel

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# output_file = "input-image.png"
# prompt = "" # The text prompt describing what you want to see.

vertexai.init(project=PROJECT_ID, location="us-central1")

model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002")

images = model.generate_images(
    prompt=prompt,
    # Optional parameters
    number_of_images=1,
    language="en",
    # You can't use a seed value and watermark at the same time.
    # add_watermark=False,
    # seed=100,
    aspect_ratio="1:1",
    safety_filter_level="block_some",
    person_generation="allow_adult",
)

images[0].save(location=output_file, include_generation_parameters=False)

# Optional. View the generated image in a notebook.
# images[0].show()

print(f"Created output image using {len(images[0]._image_bytes)} bytes")
# Example response:
# Created output image using 1234567 bytes

Mejorar las imágenes

REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

  • LOCATION: La región del proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para obtener una lista de las regiones disponibles, consulta IA generativa en ubicaciones de Vertex AI.
  • PROJECT_ID: El Google Cloud ID de tu proyecto.
  • B64_BASE_IMAGE: La imagen base que se editará o mejorará. La imagen debe especificarse como una cadena de bytes codificada en base64. Límite de tamaño: 10 MB.
  • IMAGE_SOURCE: La ubicación de Cloud Storage de la imagen que deseas editar o mejorar. Por ejemplo: gs://output-bucket/source-photos/photo.png.
  • UPSCALE_FACTOR: Opcional El factor al que se ampliará la imagen. Si no se especifica, el factor de mejora se determinará a partir del lado más largo de la imagen de entrada y sampleImageSize. Valores disponibles: x2 o x4 .

HTTP method and URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "B64_BASE_IMAGE"
        "gcsUri": "IMAGE_SOURCE"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "sampleCount": 1,
    "mode": "upscale",
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content

Deberías recibir una respuesta JSON similar a la que se muestra a continuación:

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII="
    }
  ]
}

¿Qué sigue?