Questa pagina è stata tradotta dall'API Cloud Translation.

API di generazione di immagini

L'API Imagen ti consente di generare immagini di alta qualità in pochi secondi, utilizzando un prompt di testo per guidare la generazione. Puoi anche aumentare la risoluzione delle immagini utilizzando l'API Imagen.

Visualizza la scheda del modello Imagen per la generazione

Modelli supportati

Attenzione: a partire dal 24 giugno 2025, le versioni 1 e 2 di Imagen sono deprecate. I modelli Imagen imagegeneration@002, imagegeneration@005 e imagegeneration@006 verranno rimossi il 24 settembre 2025 . Per saperne di più sulla migrazione a Imagen 3, consulta la pagina Eseguire la migrazione a Imagen 3.

Attenzione:i seguenti modelli di anteprima di Imagen 4 verranno rimossi il 30 novembre 2025: imagen-4.0-generate-preview-06-06, imagen-4.0-ultra-generate-preview-06-06 e imagen-4.0-fast-generate-preview-06-06. Per evitare interruzioni del servizio, esegui la migrazione di tutti i flussi di lavoro che utilizzano i modelli di anteprima di Imagen 4 prima del 30 novembre 2025 ai seguenti modelli di Imagen 4 disponibili a livello generale: imagen-4.0-generate-001, imagen-4.0-ultra-generate-001, imagen-4.0-fast-generate-001.

L'API Imagen supporta i seguenti modelli:

imagen-4.0-generate-001
imagen-4.0-fast-generate-001
imagen-4.0-ultra-generate-001
imagen-3.0-generate-002
imagen-3.0-generate-001
imagen-3.0-fast-generate-001
imagen-3.0-capability-001
imagegeneration@006
imagegeneration@005
imagegeneration@002

Per saperne di più sulle funzionalità supportate da ciascun modello, consulta Modelli Imagen.

Sintassi di esempio

Sintassi per creare un'immagine da un prompt di testo.

Sintassi

Sintassi per generare un'immagine.

REST

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \

https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/google/models/${MODEL_VERSION}:predict \
-d '{
  "instances": [
    {
      "prompt": "..."
    }
  ],
  "parameters": {
    "sampleCount": ...
  }
}'

Python

generation_model = ImageGenerationModel.from_pretrained("MODEL_VERSION")

response = generation_model.generate_images(
    prompt="...",
    negative_prompt="...",
    aspect_ratio=...,
)
response.images[0].show()

Genera immagini

REST

Parametri
`prompt`	`string` Obbligatorio. Il prompt di testo per l'immagine.
`addWatermark`	`bool` Facoltativo. Aggiungi una filigrana invisibile alle immagini generate. Il valore predefinito è `true`, ad eccezione dei seguenti modelli: `imagegeneration@002` `imagegeneration@005`
`aspectRatio`	`string` Facoltativo. Le proporzioni dell'immagine di output generata. Il valore predefinito è "1:1". Questo parametro non si applica all'output di upscaling.
`enhancePrompt`	`boolean` Facoltativo. Un parametro facoltativo per utilizzare una funzionalità di riscrittura del prompt basata su LLM per fornire immagini di qualità superiore che riflettano meglio l'intent del prompt originale. La disabilitazione di questa funzionalità potrebbe influire sulla qualità delle immagini e sull'aderenza del prompt.
`language`	`string` Facoltativo. Il codice lingua che corrisponde alla lingua del prompt di testo. Sono supportati i seguenti valori: `auto`: rilevamento automatico. Se Imagen rileva una lingua supportata, il prompt e un prompt negativo facoltativo vengono tradotti in inglese. Se la lingua rilevata non è supportata, Imagen utilizza il testo di input letteralmente, il che potrebbe comportare un output imprevisto. Non viene restituito alcun codice di errore. `en`: inglese (se omesso, il valore predefinito) `zh` o `zh-CN`: cinese (semplificato) `zh-TW`: cinese (tradizionale) `hi`: hindi `ja`: giapponese `ko`: coreano `pt`: portoghese `es`: spagnolo
`negativePrompt`	`string` Facoltativo. Una descrizione di ciò che vuoi scoraggiare nelle immagini generate. `negativePrompt` non è supportato da `imagen-3.0-generate-002` e modelli più recenti.
`outputOptions`	`outputOptions` Facoltativo. Descrive il formato dell'immagine di output in un oggetto `outputOptions`.
`personGeneration`	`string` Facoltativo. Consenti la generazione di persone da parte del modello. Sono supportati i seguenti valori: `"dont_allow"`: Non consentire l'inclusione di persone o volti nelle immagini. `"allow_adult"`: Consenti la generazione solo di adulti. `"allow_all"`: Consenti la generazione di persone di tutte le età. Il valore predefinito è `"allow_adult"`.
`safetySetting`	`string` Facoltativo. Aggiunge un livello di filtro al filtro di sicurezza. Sono supportati i seguenti valori: `"block_low_and_above"`: il livello di filtraggio più elevato, il blocco più rigoroso. Valore deprecato: `"block_most"`. `"block_medium_and_above"`: Blocca alcuni prompt e risposte problematici. Valore deprecato: `"block_some"`. `"block_only_high"`: riduce il numero di richieste bloccate a causa dei filtri di sicurezza. Potrebbe aumentare i contenuti discutibili generati da Imagen. Valore deprecato: `"block_few"`. `"block_none"`: blocca pochissimi prompt e risposte problematici. L'accesso a questa funzionalità è limitato. Valore del campo precedente: `"block_fewest"`. Il valore predefinito è `"block_medium_and_above"`.
`sampleCount`	`int` Obbligatorio. Il numero di immagini da generare. Il valore predefinito è 4.
`sampleImageSize`	`string` Facoltativo. Specifica la risoluzione di output dell'immagine generata. I valori accettati sono `"1K"` o `"2K"`. Il valore predefinito è `"1K"`.
`seed`	`Uint32` Facoltativo. Il seed casuale per la generazione di immagini. Questa opzione non è disponibile quando `addWatermark` è impostato su `true`. Se `enhancePrompt` è impostato su `true`, il parametro `seed` non funzionerà perché `enhancePrompt` genera un nuovo prompt, che produce un'immagine nuova o diversa.
`storageUri`	(Facoltativo) `string` URI Cloud Storage per archiviare le immagini generate.

Oggetto delle opzioni di output

L'oggetto outputOptions descrive l'output dell'immagine.

Parametri

Parametri
`outputOptions.mimeType`	(Facoltativo) `string` Il formato dell'immagine in cui deve essere salvato l'output. Sono supportati i seguenti valori: `"image/png"`: Salva come immagine PNG `"image/jpeg"`: Salva come immagine JPEG Il valore predefinito è `"image/png"`.
`outputOptions.compressionQuality`	(Facoltativo) `int` Il livello di compressione se il tipo di output è `"image/jpeg"`. I valori accettati vanno da 0 a 100. Il valore predefinito è 75.

outputOptions.mimeType

(Facoltativo) string

Il formato dell'immagine in cui deve essere salvato l'output. Sono supportati i seguenti valori:

"image/png": Salva come immagine PNG
"image/jpeg": Salva come immagine JPEG

Il valore predefinito è "image/png".

outputOptions.compressionQuality

(Facoltativo) int

Il livello di compressione se il tipo di output è "image/jpeg". I valori accettati vanno da 0 a 100. Il valore predefinito è 75.

Risposta

Il corpo della risposta della richiesta REST.

Parametro
`predictions`	Un array di oggetti `VisionGenerativeModelResult`, uno per ogni `sampleCount` richiesto. Se alcune immagini vengono filtrate dall'AI responsabile, non vengono incluse, a meno che `includeRaiReason` non sia impostato su `true`.

Oggetto risultato del modello generativo di visione

Informazioni sul risultato del modello.

Parametro
`bytesBase64Encoded`	L'immagine generata con codifica base64. Non presente se l'immagine di output non ha superato i filtri di AI responsabile.
`mimeType`	Il tipo di immagine generata. Non presente se l'immagine di output non ha superato i filtri di AI responsabile.
`raiFilteredReason`	Il motivo del filtro AI responsabile. Restituito solo se `includeRaiReason` è attivato e questa immagine è stata filtrata.
`safetyAttributes.categories`	Il nome dell'attributo di sicurezza. Restituito solo se `includeSafetyAttributes` è attivato e l'immagine di output ha superato i filtri di AI responsabile.
`safetyAttributes.scores`	Il punteggio dell'attributo di sicurezza. Restituito solo se `includeSafetyAttributes` è attivato e l'immagine di output ha superato i filtri di AI responsabile.

Python

Parametri
`prompt`	`string` Obbligatorio. Il prompt di testo per l'immagine.
`add_watermark`	`bool` Facoltativo. Aggiungi una filigrana all'immagine generata. Il valore predefinito è `true`, ad eccezione dei seguenti modelli: `imagegeneration@002` `imagegeneration@005`
`aspect_ratio`	`string` Facoltativo. Le proporzioni dell'immagine di output generata. Il valore predefinito è "1:1". Questo parametro non si applica all'output di upscaling.
`compression_quality`	`int` Facoltativo. Il livello di compressione se il tipo MIME di output è `"image/jpeg"`. Il valore predefinito è 75.
`language`	`string` Facoltativo. La lingua del prompt di testo per l'immagine. Sono supportati i seguenti valori: `auto`: rilevamento automatico. Se Imagen rileva una lingua supportata, il prompt e un prompt negativo facoltativo vengono tradotti in inglese. Se la lingua rilevata non è supportata, Imagen utilizza il testo di input letteralmente, il che potrebbe comportare un output imprevisto. Non viene restituito alcun codice di errore. `en`: inglese (se omesso, il valore predefinito) `zh` o `zh-CN`: cinese (semplificato) `zh-TW`: cinese (tradizionale) `hi`: hindi `ja`: giapponese `ko`: coreano `pt`: portoghese `es`: spagnolo Il valore predefinito è `"auto"`.
`negative_prompt`	`string` Facoltativo. Una descrizione di ciò che vuoi scoraggiare nelle immagini generate. `negative_prompt` non è supportato da `imagen-3.0-generate-002` e modelli più recenti.
`number_of_images`	`int` Obbligatorio. Il numero di immagini da generare. Il valore predefinito è 1.
`output_gcs_uri`	`string` Facoltativo. URI Cloud Storage per archiviare le immagini generate.
`output_mime_type`	`string` Facoltativo. Il formato dell'immagine in cui deve essere salvato l'output. Sono supportati i seguenti valori: `"image/png"`: Salva come immagine PNG `"image/jpeg"`: Salva come immagine JPEG Il valore predefinito è `"image/png"`.
`person_generation`	`string` Facoltativo. Consenti la generazione di persone da parte del modello. Sono supportati i seguenti valori: `"dont_allow"`: Blocco della generazione di persone `"allow_adult"`: Genera adulti, ma non bambini `"allow_all"`: Genera adulti e bambini Il valore predefinito è `"allow_adult"`.
`safety_filter_level`	`string` Facoltativo. Aggiunge un livello di filtro al filtro di sicurezza. Sono supportati i seguenti valori: `"block_low_and_above"`: il livello di filtraggio più elevato, che comporta il blocco più rigoroso. Valore deprecato: `"block_most"`. `"block_medium_and_above"`: Blocca alcuni prompt e risposte problematici. Valore deprecato: `"block_some"`. `"block_only_high"`: Blocca un numero inferiore di prompt e risposte problematici. Valore deprecato: `"block_few"`. `"block_none"`: blocca pochissimi prompt e risposte problematici. Valore deprecato: `"block_fewest"`. Il valore predefinito è `"block_medium_and_above"`.
`sample_image_size`	`string` Facoltativo. Specifica la risoluzione di output dell'immagine generata. I valori accettati sono `"1K"` o `"2K"`. Il valore predefinito è `"1K"`.
`seed`	`int` Facoltativo. Il seed casuale per la generazione di immagini. Questa opzione non è disponibile quando `addWatermark` è impostato su `true`. Se `enhancePrompt` è impostato su `true`, il `seed` non funzionerà, perché `enhancePrompt` genera un nuovo prompt, che produce un'immagine nuova o diversa.

Aumenta la risoluzione delle immagini

REST

Parametro
`mode`	`string` Obbligatorio. Deve essere impostato su `"upscale"` per le richieste di upscaling.
`upscaleConfig`	`UpscaleConfig` Obbligatorio. Un oggetto `UpscaleConfig`.
`outputOptions`	`OutputOptions` Facoltativo. Descrive il formato dell'immagine di output in un oggetto `outputOptions`.
`storageUri`	`string` Facoltativo. URI Cloud Storage in cui archiviare le immagini generate.

Oggetto di configurazione per l'upscale

Parametro

Parametro
`upscaleConfig.upscaleFactor`	`string` Obbligatorio. Il fattore di upscaling. I valori supportati sono `"x2"` e `"x4"`.

upscaleConfig.upscaleFactor

string

Obbligatorio. Il fattore di upscaling. I valori supportati sono "x2" e "x4".

Risposta

Il corpo della risposta della richiesta REST.

Parametro
`predictions`	Un array di oggetti `VisionGenerativeModelResult`, uno per ogni `sampleCount` richiesto. Se alcune immagini vengono filtrate dall'AI responsabile, non vengono incluse, a meno che `includeRaiReason` non sia impostato su `true`.

Esempi

Gli esempi riportati di seguito mostrano come utilizzare i modelli Imagen per generare immagini.

Genera immagini

REST

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

PROJECT_ID: il tuo Google Cloud ID progetto.
MODEL_VERSION: la versione del modello Imagen da utilizzare. Per saperne di più sui modelli disponibili, consulta Modelli Imagen.
LOCATION: la regione del progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.
TEXT_PROMPT: il prompt di testo che guida le immagini che il modello genera. Questo campo è obbligatorio sia per la generazione che per la modifica.
IMAGE_COUNT: il numero di immagini generate. Valori interi accettati: 1-8 (imagegeneration@002), 1-4 (tutte le altre versioni del modello). Il valore predefinito è 4.

Parametri facoltativi aggiuntivi

Utilizza le seguenti variabili facoltative a seconda del tuo caso d'uso. Aggiungi alcuni o tutti i seguenti parametri nell'oggetto "parameters": {}. Questo elenco mostra i parametri facoltativi comuni e non è esaustivo. Per ulteriori informazioni sui parametri facoltativi, consulta Riferimento API Imagen: Genera immagini.

"parameters": {
  "sampleCount": IMAGE_COUNT,
  "addWatermark": ADD_WATERMARK,
  "aspectRatio": "ASPECT_RATIO",
  "enhancePrompt": ENABLE_PROMPT_REWRITING,
  "includeRaiReason": INCLUDE_RAI_REASON,
  "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES,
  "outputOptions": {
    "mimeType": "MIME_TYPE",
    "compressionQuality": COMPRESSION_QUALITY
  },
  "personGeneration": "PERSON_SETTING",
  "safetySetting": "SAFETY_SETTING",
  "seed": SEED_NUMBER,
  "storageUri": "OUTPUT_STORAGE_URI"
}

ADD_WATERMARK: booleano. Facoltativo. Se attivare una filigrana per le immagini generate. Qualsiasi immagine generata quando il campo è impostato su true contiene una filigrana digitale SynthID che puoi utilizzare per verificare un'immagine con filigrana. Se ometti questo campo, viene utilizzato il valore predefinito true; devi impostare il valore su false per disattivare questa funzionalità. Puoi utilizzare il campo seed per ottenere un output deterministico solo quando questo campo è impostato su false.
ASPECT_RATIO: stringa. Facoltativo. Un parametro della modalità di generazione che controlla le proporzioni. Valori del rapporto supportati e loro utilizzo previsto:
- 1:1 (valore predefinito, quadrato)
- 3:4 (annunci, social media)
- 4:3 (TV, fotografia)
- 16:9 (orizzontale)
- 9:16 (verticale)
ENABLE_PROMPT_REWRITING: booleano. Facoltativo. Un parametro per utilizzare una funzionalità di riscrittura del prompt basata su LLM per fornire immagini di qualità superiore che riflettano meglio l'intent del prompt originale. La disabilitazione di questa funzionalità potrebbe influire sulla qualità delle immagini e sull'aderenza del prompt. Valore predefinito: true.
INCLUDE_RAI_REASON: booleano. Facoltativo. Se attivare il codice del motivo del filtro dell'AI responsabile nelle risposte con input o output bloccati. Valore predefinito: true.
INCLUDE_SAFETY_ATTRIBUTES: booleano. Facoltativo. Indica se attivare i punteggi di AI responsabile arrotondati per un elenco di attributi di sicurezza nelle risposte per input e output non filtrati. Categorie di attributi di sicurezza: "Death, Harm & Tragedy", "Firearms & Weapons", "Hate", "Health", "Illicit Drugs", "Politics", "Porn", "Religion & Belief", "Toxic", "Violence", "Vulgarity", "War & Conflict". Valore predefinito: false.
MIME_TYPE: stringa. Facoltativo. Il tipo MIME del contenuto dell'immagine. Valori disponibili:
- image/jpeg
- image/gif
- image/png
- image/webp
- image/bmp
- image/tiff
- image/vnd.microsoft.icon
COMPRESSION_QUALITY: numero intero. Facoltativo. Si applica solo ai file di output JPEG. Il livello di dettaglio che il modello conserva per le immagini generate in formato file JPEG. Valori: Da 0 a 100, dove un numero più alto indica una maggiore compressione. Predefinito: 75.
PERSON_SETTING: stringa. Facoltativo. L'impostazione di sicurezza che controlla il tipo di persone o volti che il modello può generare. Valori disponibili:
- allow_adult (impostazione predefinita): consente la generazione di immagini solo per adulti, ad eccezione di quelle di celebrità. La generazione di celebrità non è consentita per nessuna impostazione.
- dont_allow: disattiva l'inclusione di persone o volti nelle immagini generate.
SAFETY_SETTING: stringa. Facoltativo. Un'impostazione che controlla le soglie del filtro di sicurezza per le immagini generate. Valori disponibili:
- block_low_and_above: la soglia di sicurezza più elevata, che comporta il maggior numero di immagini generate filtrate. Valore precedente: block_most.
- block_medium_and_above (impostazione predefinita): una soglia di sicurezza media che bilancia il filtraggio di contenuti potenzialmente dannosi e sicuri. Valore precedente: block_some.
- block_only_high: una soglia di sicurezza che riduce il numero di richieste bloccate a causa dei filtri di sicurezza. Questa impostazione potrebbe aumentare i contenuti discutibili generati da Imagen. Valore precedente: block_few.
SEED_NUMBER: numero intero. Facoltativo. Qualsiasi numero intero non negativo fornito per rendere deterministiche le immagini di output. Fornire lo stesso numero di seed genera sempre le stesse immagini di output. Se il modello che utilizzi supporta la filigrana digitale, devi impostare "addWatermark": false per utilizzare questo campo. Valori interi accettati: 1 - 2147483647.
OUTPUT_STORAGE_URI: stringa. Facoltativo. Il bucket Cloud Storage in cui archiviare le immagini di output. Se non vengono forniti, nella risposta vengono restituiti i byte dell'immagine con codifica base64. Valore di esempio: gs://image-bucket/output/.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

Corpo JSON della richiesta:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content

La seguente risposta di esempio è per una richiesta con

"sampleCount":
  2

. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Se utilizzi un modello che supporta il miglioramento dei prompt, la risposta include un ulteriore campo prompt con il prompt migliorato utilizzato per la generazione:

{
  "predictions": [
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_1",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
    },
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_2",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
    }
  ]
}

Python

Prima di provare questo esempio, segui le istruzioni di configurazione di Python nella guida rapida di Vertex AI per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Vertex AI Python.

Per eseguire l'autenticazione in Vertex AI, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

In questo esempio, chiami il metodo generate_images su ImageGenerationModel (versione @006) e salvi le immagini generate localmente. Puoi quindi utilizzare facoltativamente il metodo show() in un blocco note per visualizzare le immagini generate. Per ulteriori informazioni sulle versioni e sulle funzionalità del modello, vedi Versioni del modello.


import vertexai
from vertexai.preview.vision_models import ImageGenerationModel

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# output_file = "input-image.png"
# prompt = "" # The text prompt describing what you want to see.

vertexai.init(project=PROJECT_ID, location="us-central1")

model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002")

images = model.generate_images(
    prompt=prompt,
    # Optional parameters
    number_of_images=1,
    language="en",
    # You can't use a seed value and watermark at the same time.
    # add_watermark=False,
    # seed=100,
    aspect_ratio="1:1",
    safety_filter_level="block_some",
    person_generation="allow_adult",
)

images[0].save(location=output_file, include_generation_parameters=False)

# Optional. View the generated image in a notebook.
# images[0].show()

print(f"Created output image using {len(images[0]._image_bytes)} bytes")
# Example response:
# Created output image using 1234567 bytes

Aumenta la risoluzione delle immagini

REST

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

LOCATION: la regione del progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.
PROJECT_ID: il tuo Google Cloud ID progetto.
B64_BASE_IMAGE: L'immagine di base da modificare o di cui aumentare la risoluzione. L'immagine deve essere specificata come stringa di byte con codifica base64. Dimensioni massime: 10 MB.
IMAGE_SOURCE: La posizione Cloud Storage dell'immagine che vuoi modificare o aumentare di risoluzione. Ad esempio: gs://output-bucket/source-photos/photo.png.
UPSCALE_FACTOR: (Facoltativo) Il fattore in base al quale verrà aumentata la risoluzione dell'immagine. Se non specificato, il fattore di upscaling verrà determinato dal lato più lungo dell'immagine di input e sampleImageSize. Valori disponibili: x2 o x4 .

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict

Corpo JSON della richiesta:

{
  "instances": [
    {
      "prompt": "",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "B64_BASE_IMAGE"
        "gcsUri": "IMAGE_SOURCE"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "sampleCount": 1,
    "mode": "upscale",
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"

PowerShell

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content

Dovresti ricevere una risposta JSON simile alla seguente:

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII="
    }
  ]
}

Passaggi successivi

Per saperne di più, consulta la panoramica di Imagen su Vertex AI e Generare immagini utilizzando prompt di testo.

Indietro

Genera immagini utilizzando prompt di testo