Personalizzazione delle istruzioni

Puoi utilizzare Imagen su Vertex AI per indicare al modello come personalizzare e trasformare i soggetti di un'immagine in uno stile specificato in un prompt di testo.

Visualizzare la scheda del modello Imagen per la modifica e la personalizzazione

Scrittura di prompt di personalizzazione

Il prompt che utilizzi con la personalizzazione di Imagen 3 potrebbe influire sulla qualità delle immagini generate. Utilizza i seguenti modelli di prompt come punto di partenza per scrivere prompt di personalizzazione. Potresti dover inviare diverse richieste per ottenere l'output mirato.

Caso d'uso Immagini di riferimento Modello di prompt Esempio
Personalizzazione delle istruzioni - Trasferimento dello stile Immagine (1) Trasforma subject in image [1] in modo che abbia uno stile ${STYLE_DESCRIPTION}. L'immagine raffigura ${IMAGE_DESCRIPTION}. Trasforma subject in image [1] in uno stile acquerello dell'immagine con tecniche acquerello libere, tonalità morbida, colori pastello, pennellate, sfondo delicato e pulito, spontaneità, disegno in stile analogico, pittura intricata e molto dettagliata. L'immagine raffigura il ritratto di una donna orgogliosa.

Personalizzare utilizzando la personalizzazione delle istruzioni per il trasferimento dello stile

Utilizza i seguenti esempi di codice per specificare lo stile delle immagini di output in base allo stile descritto nel prompt di testo.

REST

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

  • PROJECT_ID: il tuo Google Cloud ID progetto.
  • LOCATION: la regione del tuo progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.
  • TEXT_PROMPT: Il prompt di testo guida le immagini che il modello genera. Per utilizzare la personalizzazione di Imagen 3, includi il referenceId dell'immagine o delle immagini di riferimento che fornisci nel formato [$referenceId]. Ad esempio:
    • Trasforma il soggetto nell'immagine [1] in modo che abbia uno stile di immagine a vetrata digitale.
    • Aggiungi un cappello da cowboy rosso al gatto nell'immagine [1].
    • Rimuovi il cane corgi nell'immagine [1].
    • Cambia la palla rossa nell'immagine [1] con una casella blu.
  • "referenceId": l'ID dell'immagine di riferimento o l'ID di una serie di immagini di riferimento che corrispondono allo stesso soggetto o stile.
  • BASE64_REFERENCE_IMAGE: Un'immagine di riferimento per guidare la generazione di immagini. L'immagine deve essere specificata come stringa di byte con codifica base64.
  • IMAGE_COUNT: il numero di immagini generate. Valori interi accettati: 1-4. Il valore predefinito è 4.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Corpo JSON della richiesta:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_RAW",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.
{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Utilizzo del prodotto

Per visualizzare gli standard di utilizzo e le limitazioni dei contenuti associati a Imagen su Vertex AI, consulta le linee guida sull'utilizzo.

Versioni modello

Esistono più modelli di generazione di immagini che puoi utilizzare. Per saperne di più, consulta Modelli Imagen.

Passaggi successivi

Leggi gli articoli su Imagen e altri prodotti di AI generativa su Vertex AI: