La personalizzazione del soggetto di Imagen 3 Customization ti aiuta a generare nuove immagini da un prompt di testo e da un'immagine di riferimento che fornisci. L'immagine di riferimento che fornisci aiuta a guidare la generazione di nuove immagini.
Casi d'uso
Imagen 3 Customization offre prompt in stile libero, che possono dare l'impressione che possa fare più di quanto sia addestrato a fare. Le sezioni seguenti descrivono i casi d'uso previsti per Imagen 3 Customization ed esempi non esaustivi di casi d'uso non previsti.
Ti consigliamo di utilizzare la personalizzazione di Imagen 3 per i casi d'uso previsti, in quanto abbiamo addestrato il modello su questi casi d'uso e ci aspettiamo buoni risultati. Al contrario, anche se puoi spingere il modello a fare cose al di fuori dei casi d'uso previsti, non ci aspettiamo buoni risultati.
Casi d'uso previsti
Di seguito sono riportati i casi d'uso previsti per la personalizzazione dei soggetti di Imagen 3 Customization:
- Applicare uno stile a una foto di una persona
- Applicare uno stile a una foto di una persona e preservare le sue espressioni facciali
- (Riuscita bassa) Inserisci un prodotto, ad esempio un divano o un biscotto, in diverse scene con diverse angolazioni del prodotto.
- Generare varianti di un prodotto che non conservano i dettagli esatti
- Stilizzare una foto di una persona preservando l'espressione facciale
Esempi di casi d'uso non previsti
Di seguito è riportato un elenco non esaustivo di casi d'uso per cui la personalizzazione di Imagen 3 non è addestrata e produce risultati scadenti per:
- Posiziona due o più persone in scene diverse preservandone l'identità
- Posiziona due o più persone in scene diverse preservandone l'identità e specificando lo stile dell'immagine di output utilizzando un'immagine di esempio come input per lo stile.
- Applica uno stile a una foto di due o più persone preservandone l'identità
- Inserire un animale domestico in scene diverse preservandone l'identità
- Stilizzare la foto di un animale domestico e trasformarla in un disegno
- Stilizzare la foto di un animale domestico e trasformarla in un disegno, mantenendo o specificando lo stile dell'immagine (ad esempio acquerello)
- Inserisci un animale domestico e una persona in una scena diversa, preservando le identità di entrambi.
- Stilizzare una foto di un animale domestico e di una o più persone e trasformarla in un disegno
- Inserisci due prodotti in scene diverse con angolazioni diverse
- Inserisci un prodotto, ad esempio un biscotto o un divano, in diverse scene con diverse angolazioni del prodotto e seguendo uno stile di immagine specifico (ad esempio fotorealistico con colori, stili di illuminazione o animazioni specifici)
- Inserisci un prodotto in una scena diversa, mantenendo la composizione specifica della scena come specificato da un'immagine di controllo
- Inserisci due prodotti in scene diverse con angolazioni diverse, utilizzando un'immagine specifica come input (ad esempio fotorealistica con colori, stili di illuminazione o animazioni specifici)
- Inserisci due prodotti in scene diverse, mantenendo la composizione specifica della scena come specificato da un'immagine di controllo
Esempi di personalizzazione dell'oggetto
Le seguenti sezioni descrivono i casi supportati per la personalizzazione dei soggetti di Imagen 3 Customization:
Personalizzazione della persona
Input di esempio | Esempio di output |
---|---|
|
![]() |
1 Immagine di input di riferimento generata utilizzando Imagen 3 generazione di immagini dal prompt: ritratto di una donna a Parigi. Indossa pantaloni neri e una camicia bianca.
Personalizzazione del prodotto
Input di esempio | Esempio di output |
---|---|
|
![]() |
Visualizzare la scheda del modello Imagen per la modifica e la personalizzazione
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
Configura l'autenticazione per il tuo ambiente.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
REST
Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Per saperne di più, consulta la sezione Autenticarsi per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud .
Personalizzazione dell'oggetto
Puoi fornire immagini di riferimento dei tipi di soggetto quando utilizzi la personalizzazione di Imagen 3. In particolare, il few-shot prompting con la personalizzazione di Imagen 3 supporta i seguenti soggetti: prodotto, persona e animale domestico. L'argomento scelto influisce sul modo in cui formuli la richiesta di generazione.
Il prompt che utilizzi con la personalizzazione di Imagen 3 potrebbe influire sulla qualità delle immagini generate. Le sezioni seguenti descrivono i modelli di prompt consigliati ed esempi per inviare richieste di personalizzazione.
Personalizzazione della persona
La seguente tabella descrive i modelli di prompt che consigliamo come punto di partenza per scrivere prompt di personalizzazione della persona:
Caso d'uso Immagini di riferimento Modello di prompt Esempio Stilizzazione dell'immagine di una persona con input della mesh del volto Immagine del soggetto (1)
Immagine di controllo di Facemesh (1)Genera un'immagine di SUBJECT_DESCRIPTION [1] con facemesh from the control image [2]. ${PROMPT} Genera un'immagine di the person [1] con facemesh from the control image [2]. La persona deve guardare dritto davanti a sé con un'espressione neutra. Lo sfondo deve essere un ... Stilizzazione dell'immagine di una persona senza input della mesh del volto Immagine del soggetto (1-4) Crea un'immagine di SUBJECT_DESCRIPTION [1] che corrisponda alla descrizione: un ritratto di SUBJECT_DESCRIPTION [1] ${PROMPT} Crea un'immagine di a woman with short hair[1] che corrisponda alla descrizione: un ritratto di a woman with short hair[1] in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con un sorriso, che guarda la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vivaci Stilizzazione dell'immagine di una persona senza input della mesh del volto Immagine del soggetto (1-4) Crea un'immagine STYLE_DESCRIPTION [2] di SUBJECT_DESCRIPTION [1] che corrisponda alla descrizione: un ritratto di SUBJECT_DESCRIPTION [1] STYLE_PROMPT Crea un'immagine di 3d-cartoon style [2] su a woman with short hair [1] che corrisponda alla descrizione: un ritratto di a woman with short hair [1] in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con un sorriso. Guarda la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vibranti Stilizzazione dell'immagine di una persona con input della mesh del volto Immagine del soggetto (1-3)
Immagine di controllo di Facemesh (1)Crea un'immagine di SUBJECT_DESCRIPTION [1] nella posa di CONTROL_IMAGE [2] in modo che corrisponda alla descrizione: un ritratto di SUBJECT_DESCRIPTION [1] ${PROMPT} Crea un'immagine di a woman with short hair [1] nella posa di control image [2] in linea con la descrizione: un ritratto di a woman with short hair [1] in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con una faccina sorridente. Vedi la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura della texture, ombre morbide, illuminazione morbida e realistica, colori vivaci Stilizzazione dell'immagine di una persona con input della mesh del volto Immagine del soggetto (1-3)
Immagine di controllo di Facemesh (1)Crea un'immagine di STYLE_DESCRIPTION [3] SUBJECT_DESCRIPTION [1] nella posa di CONTROL_IMAGE [2] in modo che corrisponda alla descrizione: un ritratto di SUBJECT_DESCRIPTION [1] ${PROMPT} Crea un'immagine di 3d-cartoon style [3] che riguarda a woman with short hair [1] nella posa di control image [2] per corrispondere alla descrizione: un ritratto di a woman with short hair [1] in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile con una faccina sorridente. Vedi la fotocamera, tonalità pastello, alta qualità, 4k, capolavoro, super dettagli, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vivaci Ti consigliamo che il volto nell'immagine di riferimento abbia le seguenti proprietà:
- Sia centrato e occupi almeno metà dell'intera immagine
- Viene ruotato nella visualizzazione frontale in tutte le direzioni (rollio, beccheggio e imbardata)
- Non sia occluso da oggetti, come occhiali da sole o mascherine
Utilizza i seguenti esempi per inviare una richiesta di personalizzazione con immagini di riferimento della persona utilizzate per guidare la generazione di immagini. Puoi inviare questo tipo di richiesta con o senza un'immagine di controllo della mesh del volto per guidare ulteriormente la generazione di immagini.
REST
Per ulteriori informazioni sulle richieste del modello
imagen-3.0-capability-001
, consulta il riferimento API del modelloimagen-3.0-capability-001
.Questo esempio mostra come specificare un'area di controllo della mesh del volto per guidare la generazione, ma puoi anche omettere l'oggetto di riferimento del controllo (
"referenceType": "REFERENCE_TYPE_CONTROL"
) e Imagen rileverà automaticamente un'area di controllo della mesh del volto.Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_ID: il tuo Google Cloud ID progetto.
- LOCATION: la regione del tuo progetto. Ad esempio,
us-central1
,europe-west2
oasia-northeast3
. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI. - TEXT_PROMPT: Il prompt di testo guida le immagini che il modello
genera. Per utilizzare la personalizzazione di Imagen 3, includi il
referenceId
dell'immagine o delle immagini di riferimento che fornisci nel formato [$referenceId]. Ad esempio:- Il seguente prompt di testo è per una richiesta che ha due immagini di riferimento con
"referenceId": 1
. Entrambe le immagini hanno una descrizione facoltativa di"subjectDescription": "man with short hair"
. Inoltre, è presente un'immagine della mesh facciale di controllo specificata con"referenceId": 2
: Crea un'immagine di un man with short hair [1] nella posa dell'immagine di controllo [2] in modo che corrisponda alla descrizione: uno schizzo a matita di un ritratto a figura intera di un man with short hair [1] con disegno a tratteggio incrociato, disegno a tratteggio di un ritratto con matite 6B e di grafite, sfondo bianco, disegno a matita, alta qualità, tratto di matita, che guarda la fotocamera, occhi umani naturali
- Il seguente prompt di testo è per una richiesta che ha due immagini di riferimento con
"referenceId"
: l'ID dell'immagine di riferimento o l'ID di una serie di immagini di riferimento che corrispondono allo stesso soggetto o stile. In questo esempio, le due immagini di riferimento sono della stessa persona, quindi condividono lo stessoreferenceId
(1
) e l'immagine della mesh facciale di controllo ha unreferenceId
(2
) distinto. L'immagine generata seguirà la struttura del volto della mesh facciale estratta dall'immagine di riferimento e migliorerà l'aspetto del volto in seguito. È supportato un solo controllo della mesh del volto.- BASE64_REFERENCE_IMAGE: Un'immagine di riferimento per guidare la generazione di immagini. L'immagine deve essere specificata come stringa di byte con codifica base64.
- SUBJECT_DESCRIPTION: (Facoltativo). Una descrizione testuale dell'immagine di riferimento che puoi
utilizzare nel campo
prompt
. Ad esempio:"prompt": "a full-body portrait of a man with short hair [1] with hatch-cross drawing", [...], "subjectDescription": "man with short hair"
- IMAGE_COUNT: il numero di immagini generate. Valori interi accettati: 1-4. Il valore predefinito è 4.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Corpo JSON della richiesta:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectDescription": "SUBJECT_DESCRIPTION", "subjectType": "SUBJECT_TYPE_PERSON" } }, { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectDescription": "SUBJECT_DESCRIPTION", "subjectType": "SUBJECT_TYPE_PERSON" } }, { "referenceType": "REFERENCE_TYPE_CONTROL", "referenceId": 2, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "controlImageConfig": { "controlType": "CONTROL_TYPE_FACE_MESH", "enableControlImageComputation": true } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato
request.json
, quindi esegui il comando seguente:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
Salva il corpo della richiesta in un file denominato
request.json
, quindi esegui il comando seguente:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content"sampleCount": 2
. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Python
Personalizzazione del prodotto
La seguente tabella descrive i modelli di prompt che consigliamo come punto di partenza per scrivere prompt di personalizzazione dei prodotti:
Immagini di riferimento Modello di prompt Esempio Immagine del soggetto (1-4) Crea un'immagine su SUBJECT_DESCRIPTION [1] che corrisponda alla descrizione: ${PROMPT} Crea un'immagine di Luxe Elixir hair oil, golden liquid in glass bottle [1] in base alla descrizione: un primo piano di un'immagine in tonalità chiare della mano di una donna che tiene Luxe Elixir hair oil, golden liquid in glass bottle [1] su uno sfondo bianco puro. La mano della donna è ben illuminata e la messa a fuoco è nitida sulla bottiglia, con una profondità di campo ridotta che sfoca lo sfondo ed enfatizza il prodotto. L'illuminazione è morbida e diffusa, creando un bagliore delicato intorno alla bottiglia e alla mano. La composizione complessiva è semplice ed elegante, mettendo in evidenza l'aspetto lussuoso del prodotto.
Immagine del soggetto (1-4) Genera un'immagine di un SUBJECT_DESCRIPTION ma ${PROMPT} Genera un'immagine di un Seiko watch [1], ma in blu.
Utilizza gli esempi seguenti per inviare una richiesta di personalizzazione con immagini di riferimento del prodotto utilizzate per guidare la generazione di immagini.
Console
-
Nella console Google Cloud , vai alla pagina Vertex AI > Media Studio .
Vai a Media Studio - Nella sezione Modello del riquadro Parametri, seleziona Imagen 3 se non è già selezionato.
- Facoltativo. Scegli un formato diverso da 1:1 (impostazione predefinita).
- Facoltativo. Modifica il Numero di risultati.
- Facoltativo. Fornisci un prompt negativo per indicare al modello cosa evitare di generare.
- Facoltativo. Modifica le Opzioni avanzate.
- Nel campo Prompt di testo (Scrivi il prompt…), fai clic su
Aggiungi riferimento.
- Nel riquadro Aggiungi riferimento, scegli il Tipo di riferimento: Subject - product.
- Nella sezione Immagini di riferimento, fai clic su Carica.
- Scegli un'immagine memorizzata localmente e fai clic su Apri.
- Facoltativo. Fornisci una Descrizione per l'immagine di riferimento.
- Fai clic su Fine.
- Facoltativo. Per aggiungere altre immagini di riferimento, fai clic su Aggiungi un'immagine e carica un'altra immagine.
- Dopo aver aggiunto tutte le immagini di riferimento, fai clic su Aggiungi riferimento.
Tutte le immagini di riferimento che aggiungi in questo riquadro hanno lo stesso numero di riferimento. Utilizza questo numero di riferimento quando aggiungi il prompt di testo.
- Nel campo Prompt di testo (Scrivi il prompt…), aggiungi un prompt di testo che includa il numero o i numeri di riferimento per le immagini di riferimento. Ad esempio:
- Stanza bianca e luminosa, il product [1] su un tavolo di vetro
- il animal [1] in piedi in un ampio campo aperto con una foresta in lontananza
- un ritratto in bianco e nero di person [1] su una strada cittadina di film noir style [2]
REST
Per ulteriori informazioni sulle richieste del modello
imagen-3.0-capability-001
, consulta il riferimento API del modelloimagen-3.0-capability-001
.Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_ID: il tuo Google Cloud ID progetto.
- LOCATION: la regione del tuo progetto. Ad esempio,
us-central1
,europe-west2
oasia-northeast3
. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI. - TEXT_PROMPT: Il prompt di testo guida le immagini che il modello
genera. Per utilizzare la personalizzazione di Imagen 3, includi il
referenceId
dell'immagine o delle immagini di riferimento che fornisci nel formato [$referenceId]. Ad esempio:- Crea un'immagine di Luxe Elixir hair oil, golden liquid in glass bottle [1] che corrisponda alla descrizione: un primo piano in tonalità chiare della mano di una donna che tiene in mano Luxe Elixir hair oil, golden liquid in glass bottle [1] su uno sfondo bianco puro. La mano della donna è ben illuminata e la messa a fuoco è nitida sulla bottiglia, con una profondità di campo ridotta che sfoca lo sfondo ed enfatizza il prodotto.
"referenceId"
: l'ID dell'immagine di riferimento o l'ID di una serie di immagini di riferimento che corrispondono allo stesso soggetto o stile. In questo esempio, le due immagini di riferimento riguardano lo stesso prodotto, quindi condividono lo stessoreferenceId
(1
).- BASE64_REFERENCE_IMAGE: Un'immagine di riferimento per guidare la generazione di immagini. L'immagine deve essere specificata come stringa di byte con codifica base64.
- SUBJECT_DESCRIPTION: (Facoltativo). Una descrizione testuale dell'immagine di riferimento che puoi
utilizzare nel campo
prompt
. Ad esempio:"prompt": "Luxe Elixir hair oil, golden liquid in glass bottle [1] against a pure white background.", [...], "subjectDescription": "Luxe Elixir hair oil, golden liquid in glass bottle"
- IMAGE_COUNT: il numero di immagini generate. Valori interi accettati: 1-4. Il valore predefinito è 4.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Corpo JSON della richiesta:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectType": "SUBJECT_TYPE_PRODUCT", "subjectDescription": "SUBJECT_DESCRIPTION" } }, { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectType": "SUBJECT_TYPE_PRODUCT", "subjectDescription": "SUBJECT_DESCRIPTION" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato
request.json
, quindi esegui il comando seguente:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
Salva il corpo della richiesta in un file denominato
request.json
, quindi esegui il comando seguente:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content"sampleCount": 2
. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Utilizzo del prodotto
Per visualizzare gli standard di utilizzo e le limitazioni dei contenuti associati a Imagen su Vertex AI, consulta le linee guida sull'utilizzo.
Versioni modello
Esistono più modelli di generazione di immagini che puoi utilizzare. Per saperne di più, consulta Modelli Imagen.
Passaggi successivi
Leggi gli articoli su Imagen e altri prodotti di AI generativa su Vertex AI:
- Guida per gli sviluppatori per iniziare a utilizzare Imagen 3 su Vertex AI
- Nuovi modelli e strumenti di media generativi, creati con e per i creator
- Novità di Gemini: Custom Gem e generazione di immagini migliorata con Imagen 3
- Google DeepMind: Imagen 3, il nostro modello di conversione da testo a immagine di altissima qualità
Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2025-07-15 UTC.