Questa pagina è stata tradotta dall'API Cloud Translation.

Personalizzazione dell'oggetto

Attenzione: a partire dal 24 giugno 2025, le versioni 1 e 2 di Imagen sono deprecate. I modelli Imagen imagegeneration@002, imagegeneration@005 e imagegeneration@006 verranno rimossi il 24 settembre 2025 . Per saperne di più sulla migrazione a Imagen 3, consulta la pagina Eseguire la migrazione a Imagen 3.

La personalizzazione del soggetto di Imagen 3 ti aiuta a generare nuove immagini da un prompt di testo e da un'immagine di riferimento che fornisci. L'immagine di riferimento che fornisci aiuta a guidare la generazione di nuove immagini.

Casi d'uso

Imagen 3 Customization offre prompt in stile libero, che possono dare l'impressione di poter fare più di quanto è stato addestrato a fare. Le sezioni seguenti descrivono i casi d'uso previsti per Imagen 3 Customization e esempi non esaustivi di casi d'uso non previsti.

Ti consigliamo di utilizzare la personalizzazione di Imagen 3 per i casi d'uso previsti, in quanto abbiamo addestrato il modello su questi casi d'uso e ci aspettiamo buoni risultati. Al contrario, anche se puoi spingere il modello a fare cose al di fuori dei casi d'uso previsti, non ci aspettiamo buoni risultati.

Casi d'uso previsti

Di seguito sono riportati i casi d'uso pensati per la personalizzazione dei soggetti di Imagen 3 Customization:

Applicare uno stile a una foto di una persona
Stilizzare una foto di una persona e preservarne le espressioni facciali
(Successo basso) Inserisci un prodotto, ad esempio un divano o un biscotto, in diverse scene con diverse angolazioni del prodotto.
Generare varianti di un prodotto che non conservano i dettagli esatti
Stilizzare una foto di una persona preservando l'espressione facciale

Esempi di casi d'uso non previsti

Di seguito è riportato un elenco non esaustivo di casi d'uso per cui la personalizzazione di Imagen 3 non è addestrata e produce risultati scadenti per:

Posiziona due o più persone in scene diverse preservandone l'identità
Posiziona due o più persone in scene diverse preservandone l'identità e specificando lo stile dell'immagine di output utilizzando un'immagine di esempio come input per lo stile.
Applica uno stile a una foto di due o più persone preservandone l'identità
Inserire un animale domestico in scene diverse preservandone l'identità
Stilizzare la foto di un animale domestico e trasformarla in un disegno
Stilizza la foto di un animale domestico e trasformala in un disegno, mantenendo o specificando lo stile dell'immagine (ad esempio acquerello)
Inserisci un animale domestico e una persona in una scena diversa, preservando le identità di entrambi.
Stilizzare una foto di un animale domestico e di una o più persone e trasformarla in un disegno
Inserisci due prodotti in scene diverse con angolazioni diverse
Inserisci un prodotto, ad esempio un biscotto o un divano, in diverse scene con diverse angolazioni del prodotto e seguendo uno stile di immagine specifico (ad esempio fotorealistico con colori, stili di illuminazione o animazioni specifici)
Inserisci un prodotto in una scena diversa, mantenendo la composizione specifica della scena come specificato da un'immagine di controllo
Inserisci due prodotti in scene diverse con angolazioni diverse, utilizzando un'immagine specifica come input (ad esempio fotorealistica con colori, stili di illuminazione o animazioni specifici)
Inserisci due prodotti in scene diverse, preservando la composizione specifica della scena come specificato da un'immagine di controllo

Esempi di personalizzazione dell'oggetto

Le seguenti sezioni descrivono i casi supportati per la personalizzazione dei soggetti di Imagen 3 Customization:

Personalizzazione della persona

Input di esempio	Esempio di output
Immagine di riferimento¹: Prompt di testo: Genera un'immagine relativa a `woman with long hair[1]` che corrisponda a questa descrizione: un ritratto di un `woman with long hair[1]` in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con un sorriso, che guarda la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, dettagli super, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vivaci.

Input di esempio

Esempio di output

Immagine di riferimento¹:
Prompt di testo:
Genera un'immagine relativa a woman with long hair[1] che corrisponda a questa descrizione: un ritratto di un woman with long hair[1] in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con un sorriso, che guarda la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, dettagli super, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vivaci.

¹ Immagine di input di riferimento generata utilizzando Imagen 3 generazione di immagini dal prompt: ritratto di una donna a Parigi. Indossa pantaloni neri e una camicia bianca.

Personalizzazione del prodotto

Input di esempio	Esempio di output
Immagine di riferimento²: Prompt di testo: Genera un'immagine di `perfume bottle [1]`, ma in ciano

² Immagine di input di riferimento generata utilizzando Imagen 3 generazione di immagini dal prompt: immagine di stile del prodotto di un flacone di profumo davanti a uno sfondo nero.

Visualizza la scheda del modello Imagen per la modifica e la personalizzazione

Prima di iniziare

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Configura l'autenticazione per il tuo ambiente.

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

REST

Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali che fornisci a gcloud CLI.

Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il seguente comando:

gcloud init

Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.

Per saperne di più, consulta Autenticarsi per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud .

Personalizzazione dell'oggetto

Puoi fornire immagini di riferimento dei tipi di soggetto quando utilizzi la personalizzazione di Imagen 3. In particolare, il few-shot prompting con la personalizzazione di Imagen 3 supporta i seguenti soggetti: prodotto, persona e animale domestico. L'argomento scelto influisce sul modo in cui formuli la richiesta di generazione.

Il prompt che utilizzi con la personalizzazione di Imagen 3 potrebbe influire sulla qualità delle immagini generate. Le sezioni seguenti descrivono i modelli di prompt e gli esempi consigliati per inviare richieste di personalizzazione.

Personalizzazione della persona

La seguente tabella descrive i modelli di prompt che consigliamo come punto di partenza per scrivere prompt di personalizzazione della persona:

Caso d'uso	Immagini di riferimento	Modello di prompt	Esempio
Stilizzazione dell'immagine di una persona con input del mesh del volto	Immagine del soggetto (1) Immagine di controllo di Facemesh (1)	Genera un'immagine di `SUBJECT_DESCRIPTION [1]` con `facemesh from the control image [2]`. ${PROMPT}	Genera un'immagine di `the person [1]` con `facemesh from the control image [2]`. La persona deve guardare dritto davanti a sé con un'espressione neutra. Lo sfondo deve essere un ...
Stilizzazione dell'immagine di una persona senza input del mesh del volto	Immagine del soggetto (1-4)	Crea un'immagine di `SUBJECT_DESCRIPTION [1]` che corrisponda alla descrizione: un ritratto di `SUBJECT_DESCRIPTION [1]` ${PROMPT}	Crea un'immagine di `a woman with short hair[1]` che corrisponda alla descrizione: un ritratto di `a woman with short hair[1]` in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, faccia sorridente, che guarda la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, dettagli super, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vivaci
Stilizzazione dell'immagine di una persona senza input del mesh del volto	Immagine del soggetto (1-4)	Crea un'immagine `STYLE_DESCRIPTION [2]` di `SUBJECT_DESCRIPTION [1]` che corrisponda alla descrizione: un ritratto di `SUBJECT_DESCRIPTION [1]` STYLE_PROMPT	Crea un'immagine di `3d-cartoon style [2]` su `a woman with short hair [1]` che corrisponda alla descrizione: un ritratto di `a woman with short hair [1]` in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con un sorriso. Guarda la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vibranti
Stilizzazione dell'immagine di una persona con input del mesh del volto	Immagine del soggetto (1-3) Immagine di controllo Facemesh (1)	Crea un'immagine di `SUBJECT_DESCRIPTION [1]` nella posa di `CONTROL_IMAGE [2]` in modo che corrisponda alla descrizione: un ritratto di `SUBJECT_DESCRIPTION [1]` ${PROMPT}	Crea un'immagine di `a woman with short hair [1]` nella posa di `control image [2]` in linea con la descrizione: un ritratto di `a woman with short hair [1]` in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con una faccina sorridente. Vedi la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura della texture, ombre morbide, illuminazione morbida e realistica, colori vivaci
Stilizzazione dell'immagine di una persona con input del mesh del volto	Immagine del soggetto (1-3) Immagine di controllo Facemesh (1)	Crea un'immagine di `STYLE_DESCRIPTION [3]` che `SUBJECT_DESCRIPTION [1]` nella posa di `CONTROL_IMAGE [2]` corrisponda alla descrizione: un ritratto di `SUBJECT_DESCRIPTION [1]` ${PROMPT}	Crea un'immagine di `3d-cartoon style [3]` che riguarda `a woman with short hair [1]` nella posa di `control image [2]` per corrispondere alla descrizione: un ritratto di `a woman with short hair [1]` in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile con una faccina sorridente. Vedi la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura della texture, ombre morbide, illuminazione morbida e realistica, colori vivaci

Ti consigliamo che il volto nell'immagine di riferimento abbia le seguenti proprietà:

Sia centrato e occupi almeno metà dell'intera immagine
Viene ruotato nella visuale frontale in tutte le direzioni (rollio, beccheggio e imbardata)
Non sia occluso da oggetti, come occhiali da sole o maschere

Utilizza i seguenti esempi per inviare una richiesta di personalizzazione con immagini di riferimento della persona utilizzate per guidare la generazione di immagini. Puoi inviare questo tipo di richiesta con o senza un'immagine di controllo della mesh del volto per guidare ulteriormente la generazione di immagini.

REST

Per saperne di più sulle richieste del modello imagen-3.0-capability-001, consulta il riferimento API del modello imagen-3.0-capability-001.

Questo esempio mostra come specificare un'area di controllo del mesh del volto per guidare la generazione, ma puoi anche omettere l'oggetto di riferimento di controllo ("referenceType": "REFERENCE_TYPE_CONTROL") e Imagen rileverà automaticamente un'area di controllo del mesh del volto.

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

PROJECT_ID: il tuo Google Cloud ID progetto.
LOCATION: la regione del progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.
TEXT_PROMPT: il prompt di testo guida le immagini che il modello genera. Per utilizzare la personalizzazione di Imagen 3, includi il referenceId dell'immagine o delle immagini di riferimento che fornisci nel formato [$referenceId]. Ad esempio:
- Il seguente prompt di testo è per una richiesta che ha due immagini di riferimento con "referenceId": 1. Entrambe le immagini hanno una descrizione facoltativa di "subjectDescription": "man with short hair". Inoltre, è specificata un'immagine di controllo del mesh del volto con "referenceId": 2: Crea un'immagine di un man with short hair [1] nella posa dell'immagine di controllo [2] in modo che corrisponda alla descrizione: uno schizzo a matita di un ritratto a figura intera di un man with short hair [1] con disegno a tratteggio incrociato, disegno a tratteggio di un ritratto con matite 6B e di grafite, sfondo bianco, disegno a matita, alta qualità, tratto di matita, che guarda la fotocamera, occhi umani naturali
"referenceId": l'ID dell'immagine di riferimento o l'ID di una serie di immagini di riferimento che corrispondono allo stesso soggetto o stile. In questo esempio, le due immagini di riferimento sono della stessa persona, quindi condividono lo stesso referenceId (1) e l'immagine di controllo del mesh del volto ha un referenceId (2) distinto. L'immagine generata seguirà la struttura del volto del mesh del volto estratto dall'immagine di riferimento e migliorerà l'aspetto del volto. È supportato un solo controllo della mesh del volto.
BASE64_REFERENCE_IMAGE: un'immagine di riferimento per guidare la generazione di immagini. L'immagine deve essere specificata come stringa di byte con codifica base64.

SUBJECT_DESCRIPTION: (Facoltativo) Una descrizione testuale dell'immagine di riferimento che puoi utilizzare nel campo prompt. Ad esempio:

      "prompt": "a full-body portrait of a man with short hair [1] with hatch-cross
      drawing",
      [...],
      "subjectDescription": "man with short hair"

IMAGE_COUNT: il numero di immagini generate. Valori interi accettati: 1-4. Il valore predefinito è 4.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Corpo JSON della richiesta:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [

        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectDescription": "SUBJECT_DESCRIPTION",
            "subjectType": "SUBJECT_TYPE_PERSON"
          }
        },
        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectDescription": "SUBJECT_DESCRIPTION",
            "subjectType": "SUBJECT_TYPE_PERSON"
          }
        },
        {
          "referenceType": "REFERENCE_TYPE_CONTROL",
          "referenceId": 2,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "controlImageConfig": {
            "controlType": "CONTROL_TYPE_FACE_MESH",
            "enableControlImageComputation": true
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Python

from google import genai
from google.genai.types import (
    ControlReferenceConfig,
    ControlReferenceImage,
    EditImageConfig,
    Image,
    SubjectReferenceConfig,
    SubjectReferenceImage,
)

client = genai.Client()

# TODO(developer): Update and un-comment below line
# output_gcs_uri = "gs://your-bucket/your-prefix"

# Create subject and control reference images of a photograph stored in Google Cloud Storage
# using https://storage.googleapis.com/cloud-samples-data/generative-ai/image/person.png
subject_reference_image = SubjectReferenceImage(
    reference_id=1,
    reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/person.png"),
    config=SubjectReferenceConfig(
        subject_description="a headshot of a woman",
        subject_type="SUBJECT_TYPE_PERSON",
    ),
)
control_reference_image = ControlReferenceImage(
    reference_id=2,
    reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/person.png"),
    config=ControlReferenceConfig(control_type="CONTROL_TYPE_FACE_MESH"),
)

image = client.models.edit_image(
    model="imagen-3.0-capability-001",
    prompt="""
    a portrait of a woman[1] in the pose of the control image[2]in a watercolor style by a professional artist,
    light and low-contrast stokes, bright pastel colors, a warm atmosphere, clean background, grainy paper,
    bold visible brushstrokes, patchy details
    """,
    reference_images=[subject_reference_image, control_reference_image],
    config=EditImageConfig(
        edit_mode="EDIT_MODE_DEFAULT",
        number_of_images=1,
        safety_filter_level="BLOCK_MEDIUM_AND_ABOVE",
        person_generation="ALLOW_ADULT",
        output_gcs_uri=output_gcs_uri,
    ),
)

# Example response:
# gs://your-bucket/your-prefix
print(image.generated_images[0].image.gcs_uri)

Personalizzazione del prodotto

La seguente tabella descrive i modelli di prompt che consigliamo come punto di partenza per scrivere prompt di personalizzazione dei prodotti:

Immagini di riferimento	Modello di prompt	Esempio
Immagine del soggetto (1-4)	Crea un'immagine su `SUBJECT_DESCRIPTION [1]` che corrisponda alla descrizione: ${PROMPT}	Crea un'immagine su `Luxe Elixir hair oil, golden liquid in glass bottle [1]` che corrisponda alla descrizione: un primo piano con illuminazione intensa della mano di una donna che tiene `Luxe Elixir hair oil, golden liquid in glass bottle [1]` su uno sfondo bianco puro. La mano della donna è ben illuminata e la messa a fuoco è nitida sulla bottiglia, con una profondità di campo ridotta che sfoca lo sfondo ed enfatizza il prodotto. L'illuminazione è morbida e diffusa, creando un bagliore sottile intorno alla bottiglia e alla mano. La composizione complessiva è semplice ed elegante, mettendo in evidenza l'aspetto lussuoso del prodotto.
Immagine del soggetto (1-4)	Genera un'immagine di un `SUBJECT_DESCRIPTION` ma ${PROMPT}	Genera un'immagine di un `Seiko watch [1]` ma in blu.

Utilizza i seguenti esempi per inviare una richiesta di personalizzazione con immagini di riferimento del prodotto utilizzate per guidare la generazione di immagini.

Console

Nella console Google Cloud , vai alla pagina Vertex AI > Media Studio .
Vai a Media Studio
Nella sezione Modello del riquadro Parametri, seleziona Imagen 3 se non è già selezionato.
Facoltativo. Scegli un formato diverso da 1:1 (predefinito).
Facoltativo. Modifica il Numero di risultati.
Facoltativo. Fornisci un prompt negativo per indicare al modello cosa evitare di generare.
Facoltativo. Modifica le opzioni avanzate.
Nel campo Prompt di testo (Scrivi il prompt…), fai clic su Aggiungi riferimento.
1. Nel riquadro Aggiungi riferimento, scegli il Tipo di riferimento: Subject - product.
2. Nella sezione Immagini di riferimento, fai clic su Carica.
3. Scegli un'immagine memorizzata localmente e fai clic su Apri.
4. Facoltativo. Fornisci una Descrizione per l'immagine di riferimento.
5. Fai clic su Fine.
6. Facoltativo. Per aggiungere altre immagini di riferimento, fai clic su Aggiungi un'immagine e carica un'altra immagine.
7. Dopo aver aggiunto tutte le immagini di riferimento, fai clic su Aggiungi riferimento.
  Tutte le immagini di riferimento che aggiungi in questo riquadro hanno lo stesso numero di riferimento. Utilizza questo numero di riferimento quando aggiungi il prompt di testo.
Nel campo Prompt di testo (Scrivi il prompt…), aggiungi un prompt di testo che includa il numero o i numeri di riferimento per le immagini di riferimento. Ad esempio:
1. Stanza bianca e luminosa, il product [1] su un tavolo di vetro
2. il animal [1] in piedi in un ampio campo aperto con una foresta in lontananza
3. un ritratto in bianco e nero di person [1] su una strada cittadina di film noir style [2]

REST

Per saperne di più sulle richieste del modello imagen-3.0-capability-001, consulta il riferimento API del modello imagen-3.0-capability-001.

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

PROJECT_ID: il tuo Google Cloud ID progetto.
LOCATION: la regione del progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.
TEXT_PROMPT: il prompt di testo guida le immagini che il modello genera. Per utilizzare la personalizzazione di Imagen 3, includi il referenceId dell'immagine o delle immagini di riferimento che fornisci nel formato [$referenceId]. Ad esempio:
- Crea un'immagine su Luxe Elixir hair oil, golden liquid in glass bottle [1] che corrisponda alla descrizione: un primo piano in tonalità chiare della mano di una donna che tiene in mano Luxe Elixir hair oil, golden liquid in glass bottle [1] su uno sfondo bianco puro. La mano della donna è ben illuminata e la messa a fuoco è nitida sulla bottiglia, con una profondità di campo ridotta che sfoca lo sfondo ed enfatizza il prodotto.
"referenceId": l'ID dell'immagine di riferimento o l'ID di una serie di immagini di riferimento che corrispondono allo stesso soggetto o stile. In questo esempio, le due immagini di riferimento sono dello stesso prodotto, quindi condividono lo stesso referenceId (1).
BASE64_REFERENCE_IMAGE: un'immagine di riferimento per guidare la generazione di immagini. L'immagine deve essere specificata come stringa di byte con codifica base64.

SUBJECT_DESCRIPTION: (Facoltativo) Una descrizione testuale dell'immagine di riferimento che puoi utilizzare nel campo prompt. Ad esempio:

      "prompt": "Luxe Elixir hair oil, golden liquid in glass bottle [1]
       against a pure white background.",
      [...],
      "subjectDescription": "Luxe Elixir hair oil, golden liquid in glass bottle"

IMAGE_COUNT: il numero di immagini generate. Valori interi accettati: 1-4. Il valore predefinito è 4.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Corpo JSON della richiesta:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectType": "SUBJECT_TYPE_PRODUCT",
            "subjectDescription": "SUBJECT_DESCRIPTION"
          }
        },
        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectType": "SUBJECT_TYPE_PRODUCT",
            "subjectDescription": "SUBJECT_DESCRIPTION"
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Utilizzo del prodotto

Per visualizzare gli standard di utilizzo e le limitazioni dei contenuti associati a Imagen su Vertex AI, consulta le linee guida sull'utilizzo.

Versioni modello

Esistono più modelli di generazione di immagini che puoi utilizzare. Per saperne di più, consulta la sezione Modelli Imagen.

Passaggi successivi

Leggi gli articoli su Imagen e altri prodotti di AI generativa su Vertex AI: