Puoi utilizzare Imagen su Vertex AI per indicare al modello come personalizzare e trasformare i soggetti di un'immagine in uno stile specificato in un prompt di testo.
Visualizzare la scheda del modello Imagen per la modifica e la personalizzazione
Scrittura di prompt di personalizzazione
Il prompt che utilizzi con la personalizzazione di Imagen 3 potrebbe influire sulla qualità delle immagini generate. Utilizza i seguenti modelli di prompt come punto di partenza per scrivere prompt di personalizzazione. Potresti dover inviare diverse richieste per ottenere l'output mirato.
Caso d'uso | Immagini di riferimento | Modello di prompt | Esempio |
---|---|---|---|
Personalizzazione delle istruzioni - Trasferimento dello stile | Immagine (1) | Trasforma subject in image [1] in modo che abbia uno stile ${STYLE_DESCRIPTION}. L'immagine raffigura ${IMAGE_DESCRIPTION}. | Trasforma subject in image [1] in uno stile acquerello dell'immagine con tecniche acquerello libere, tonalità morbida, colori pastello, pennellate, sfondo delicato e pulito, spontaneità, disegno in stile analogico, pittura intricata e molto dettagliata. L'immagine raffigura il ritratto di una donna orgogliosa. |
Personalizzare utilizzando la personalizzazione delle istruzioni per il trasferimento dello stile
Utilizza i seguenti esempi di codice per specificare lo stile delle immagini di output in base allo stile descritto nel prompt di testo.
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_ID: il tuo Google Cloud ID progetto.
- LOCATION: la regione del tuo progetto. Ad esempio,
us-central1
,europe-west2
oasia-northeast3
. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI. - TEXT_PROMPT: Il prompt di testo guida le immagini che il modello
genera. Per utilizzare la personalizzazione di Imagen 3, includi il
referenceId
dell'immagine o delle immagini di riferimento che fornisci nel formato [$referenceId]. Ad esempio:- Trasforma il soggetto nell'immagine [1] in modo che abbia uno stile di immagine a vetrata digitale.
- Aggiungi un cappello da cowboy rosso al gatto nell'immagine [1].
- Rimuovi il cane corgi nell'immagine [1].
- Cambia la palla rossa nell'immagine [1] con una casella blu.
"referenceId"
: l'ID dell'immagine di riferimento o l'ID di una serie di immagini di riferimento che corrispondono allo stesso soggetto o stile.- BASE64_REFERENCE_IMAGE: Un'immagine di riferimento per guidare la generazione di immagini. L'immagine deve essere specificata come stringa di byte con codifica base64.
- IMAGE_COUNT: il numero di immagini generate. Valori interi accettati: 1-4. Il valore predefinito è 4.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Corpo JSON della richiesta:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_RAW", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
quindi esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
"sampleCount": 2
. La risposta restituisce due oggetti di previsione, con
i byte dell'immagine generata codificati in base64.
{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Utilizzo del prodotto
Per visualizzare gli standard di utilizzo e le limitazioni dei contenuti associati a Imagen su Vertex AI, consulta le linee guida sull'utilizzo.
Versioni modello
Esistono più modelli di generazione di immagini che puoi utilizzare. Per saperne di più, consulta Modelli Imagen.
Passaggi successivi
Leggi gli articoli su Imagen e altri prodotti di AI generativa su Vertex AI:
- Guida per gli sviluppatori per iniziare a utilizzare Imagen 3 su Vertex AI
- Nuovi modelli e strumenti di media generativi, creati con e per i creator
- Novità di Gemini: Custom Gem e generazione di immagini migliorata con Imagen 3
- Google DeepMind: Imagen 3, il nostro modello di conversione da testo a immagine di altissima qualità