Personalizzazione dell'oggetto

La personalizzazione del soggetto di Imagen 3 Customization ti aiuta a generare nuove immagini da un prompt di testo e da un'immagine di riferimento che fornisci. L'immagine di riferimento che fornisci aiuta a guidare la generazione di nuove immagini.

Casi d'uso

Imagen 3 Customization offre prompt in stile libero, che possono dare l'impressione che possa fare più di quanto sia addestrato a fare. Le sezioni seguenti descrivono i casi d'uso previsti per Imagen 3 Customization ed esempi non esaustivi di casi d'uso non previsti.

Ti consigliamo di utilizzare la personalizzazione di Imagen 3 per i casi d'uso previsti, in quanto abbiamo addestrato il modello su questi casi d'uso e ci aspettiamo buoni risultati. Al contrario, anche se puoi spingere il modello a fare cose al di fuori dei casi d'uso previsti, non ci aspettiamo buoni risultati.

Casi d'uso previsti

Di seguito sono riportati i casi d'uso previsti per la personalizzazione dei soggetti di Imagen 3 Customization:

  • Applicare uno stile a una foto di una persona
  • Applicare uno stile a una foto di una persona e preservare le sue espressioni facciali
  • (Riuscita bassa) Inserisci un prodotto, ad esempio un divano o un biscotto, in diverse scene con diverse angolazioni del prodotto.
  • Generare varianti di un prodotto che non conservano i dettagli esatti
  • Stilizzare una foto di una persona preservando l'espressione facciale

Esempi di casi d'uso non previsti

Di seguito è riportato un elenco non esaustivo di casi d'uso per cui la personalizzazione di Imagen 3 non è addestrata e produce risultati scadenti per:

  • Posiziona due o più persone in scene diverse preservandone l'identità
  • Posiziona due o più persone in scene diverse preservandone l'identità e specificando lo stile dell'immagine di output utilizzando un'immagine di esempio come input per lo stile.
  • Applica uno stile a una foto di due o più persone preservandone l'identità
  • Inserire un animale domestico in scene diverse preservandone l'identità
  • Stilizzare la foto di un animale domestico e trasformarla in un disegno
  • Stilizzare la foto di un animale domestico e trasformarla in un disegno, mantenendo o specificando lo stile dell'immagine (ad esempio acquerello)
  • Inserisci un animale domestico e una persona in una scena diversa, preservando le identità di entrambi.
  • Stilizzare una foto di un animale domestico e di una o più persone e trasformarla in un disegno
  • Inserisci due prodotti in scene diverse con angolazioni diverse
  • Inserisci un prodotto, ad esempio un biscotto o un divano, in diverse scene con diverse angolazioni del prodotto e seguendo uno stile di immagine specifico (ad esempio fotorealistico con colori, stili di illuminazione o animazioni specifici)
  • Inserisci un prodotto in una scena diversa, mantenendo la composizione specifica della scena come specificato da un'immagine di controllo
  • Inserisci due prodotti in scene diverse con angolazioni diverse, utilizzando un'immagine specifica come input (ad esempio fotorealistica con colori, stili di illuminazione o animazioni specifici)
  • Inserisci due prodotti in scene diverse, mantenendo la composizione specifica della scena come specificato da un'immagine di controllo

Esempi di personalizzazione dell'oggetto

Le seguenti sezioni descrivono i casi supportati per la personalizzazione dei soggetti di Imagen 3 Customization:

Personalizzazione della persona

Input di esempio Esempio di output
  1. Immagine di riferimento1:
    Input di esempio per la personalizzazione del prodotto
  2. Prompt di testo:
    Genera un'immagine di woman with long hair[1] che corrisponda a questa descrizione: un ritratto di un woman with long hair[1] in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con un sorriso, che guarda la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vivaci.

Esempio di output per la personalizzazione del prodotto

1 Immagine di input di riferimento generata utilizzando Imagen 3 generazione di immagini dal prompt: ritratto di una donna a Parigi. Indossa pantaloni neri e una camicia bianca.

Personalizzazione del prodotto

Input di esempio Esempio di output
  1. Immagine di riferimento2:
    Input di esempio per la personalizzazione del prodotto
  2. Prompt di testo:
    Genera un'immagine di perfume bottle [1], ma in ciano

Esempio di output per la personalizzazione del prodotto
2 Immagine di input di riferimento generata utilizzando Imagen 3 generazione di immagini dal prompt: immagine di stile del prodotto di una bottiglia di profumo davanti a uno sfondo nero.

Visualizzare la scheda del modello Imagen per la modifica e la personalizzazione

Prima di iniziare

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Enable the API

  8. Configura l'autenticazione per il tuo ambiente.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.

      After installing the Google Cloud CLI, initialize it by running the following command:

      gcloud init

      If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

    Per saperne di più, consulta la sezione Autenticarsi per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud .

    Personalizzazione dell'oggetto

    Puoi fornire immagini di riferimento dei tipi di soggetto quando utilizzi la personalizzazione di Imagen 3. In particolare, il few-shot prompting con la personalizzazione di Imagen 3 supporta i seguenti soggetti: prodotto, persona e animale domestico. L'argomento scelto influisce sul modo in cui formuli la richiesta di generazione.

    Il prompt che utilizzi con la personalizzazione di Imagen 3 potrebbe influire sulla qualità delle immagini generate. Le sezioni seguenti descrivono i modelli di prompt consigliati ed esempi per inviare richieste di personalizzazione.

    Personalizzazione della persona

    La seguente tabella descrive i modelli di prompt che consigliamo come punto di partenza per scrivere prompt di personalizzazione della persona:

    Caso d'uso Immagini di riferimento Modello di prompt Esempio
    Stilizzazione dell'immagine di una persona con input della mesh del volto Immagine del soggetto (1)

    Immagine di controllo di Facemesh (1)
    Genera un'immagine di SUBJECT_DESCRIPTION [1] con facemesh from the control image [2]. ${PROMPT} Genera un'immagine di the person [1] con facemesh from the control image [2]. La persona deve guardare dritto davanti a sé con un'espressione neutra. Lo sfondo deve essere un ...
    Stilizzazione dell'immagine di una persona senza input della mesh del volto Immagine del soggetto (1-4) Crea un'immagine di SUBJECT_DESCRIPTION [1] che corrisponda alla descrizione: un ritratto di SUBJECT_DESCRIPTION [1] ${PROMPT} Crea un'immagine di a woman with short hair[1] che corrisponda alla descrizione: un ritratto di a woman with short hair[1] in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con un sorriso, che guarda la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vivaci
    Stilizzazione dell'immagine di una persona senza input della mesh del volto Immagine del soggetto (1-4) Crea un'immagine STYLE_DESCRIPTION [2] di SUBJECT_DESCRIPTION [1] che corrisponda alla descrizione: un ritratto di SUBJECT_DESCRIPTION [1] STYLE_PROMPT Crea un'immagine di 3d-cartoon style [2] su a woman with short hair [1] che corrisponda alla descrizione: un ritratto di a woman with short hair [1] in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con un sorriso. Guarda la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vibranti
    Stilizzazione dell'immagine di una persona con input della mesh del volto Immagine del soggetto (1-3)

    Immagine di controllo di Facemesh (1)
    Crea un'immagine di SUBJECT_DESCRIPTION [1] nella posa di CONTROL_IMAGE [2] in modo che corrisponda alla descrizione: un ritratto di SUBJECT_DESCRIPTION [1] ${PROMPT} Crea un'immagine di a woman with short hair [1] nella posa di control image [2] in linea con la descrizione: un ritratto di a woman with short hair [1] in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile, con una faccina sorridente. Vedi la fotocamera, tonalità pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura della texture, ombre morbide, illuminazione morbida e realistica, colori vivaci
    Stilizzazione dell'immagine di una persona con input della mesh del volto Immagine del soggetto (1-3)

    Immagine di controllo di Facemesh (1)
    Crea un'immagine di STYLE_DESCRIPTION [3] SUBJECT_DESCRIPTION [1] nella posa di CONTROL_IMAGE [2] in modo che corrisponda alla descrizione: un ritratto di SUBJECT_DESCRIPTION [1] ${PROMPT} Crea un'immagine di 3d-cartoon style [3] che riguarda a woman with short hair [1] nella posa di control image [2] per corrispondere alla descrizione: un ritratto di a woman with short hair [1] in stile cartone animato 3D con sfondo sfocato. Un personaggio carino e adorabile con una faccina sorridente. Vedi la fotocamera, tonalità pastello, alta qualità, 4k, capolavoro, super dettagli, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vivaci

    Ti consigliamo che il volto nell'immagine di riferimento abbia le seguenti proprietà:

    • Sia centrato e occupi almeno metà dell'intera immagine
    • Viene ruotato nella visualizzazione frontale in tutte le direzioni (rollio, beccheggio e imbardata)
    • Non sia occluso da oggetti, come occhiali da sole o mascherine

    Utilizza i seguenti esempi per inviare una richiesta di personalizzazione con immagini di riferimento della persona utilizzate per guidare la generazione di immagini. Puoi inviare questo tipo di richiesta con o senza un'immagine di controllo della mesh del volto per guidare ulteriormente la generazione di immagini.

    REST

    Per ulteriori informazioni sulle richieste del modello imagen-3.0-capability-001, consulta il riferimento API del modello imagen-3.0-capability-001.

    Questo esempio mostra come specificare un'area di controllo della mesh del volto per guidare la generazione, ma puoi anche omettere l'oggetto di riferimento del controllo ("referenceType": "REFERENCE_TYPE_CONTROL") e Imagen rileverà automaticamente un'area di controllo della mesh del volto.

    Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

    • PROJECT_ID: il tuo Google Cloud ID progetto.
    • LOCATION: la regione del tuo progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.
    • TEXT_PROMPT: Il prompt di testo guida le immagini che il modello genera. Per utilizzare la personalizzazione di Imagen 3, includi il referenceId dell'immagine o delle immagini di riferimento che fornisci nel formato [$referenceId]. Ad esempio:
      • Il seguente prompt di testo è per una richiesta che ha due immagini di riferimento con "referenceId": 1. Entrambe le immagini hanno una descrizione facoltativa di "subjectDescription": "man with short hair". Inoltre, è presente un'immagine della mesh facciale di controllo specificata con "referenceId": 2: Crea un'immagine di un man with short hair [1] nella posa dell'immagine di controllo [2] in modo che corrisponda alla descrizione: uno schizzo a matita di un ritratto a figura intera di un man with short hair [1] con disegno a tratteggio incrociato, disegno a tratteggio di un ritratto con matite 6B e di grafite, sfondo bianco, disegno a matita, alta qualità, tratto di matita, che guarda la fotocamera, occhi umani naturali
    • "referenceId": l'ID dell'immagine di riferimento o l'ID di una serie di immagini di riferimento che corrispondono allo stesso soggetto o stile. In questo esempio, le due immagini di riferimento sono della stessa persona, quindi condividono lo stesso referenceId (1) e l'immagine della mesh facciale di controllo ha un referenceId (2) distinto. L'immagine generata seguirà la struttura del volto della mesh facciale estratta dall'immagine di riferimento e migliorerà l'aspetto del volto in seguito. È supportato un solo controllo della mesh del volto.
    • BASE64_REFERENCE_IMAGE: Un'immagine di riferimento per guidare la generazione di immagini. L'immagine deve essere specificata come stringa di byte con codifica base64.
    • SUBJECT_DESCRIPTION: (Facoltativo). Una descrizione testuale dell'immagine di riferimento che puoi utilizzare nel campo prompt. Ad esempio:
            "prompt": "a full-body portrait of a man with short hair [1] with hatch-cross
            drawing",
            [...],
            "subjectDescription": "man with short hair"
          
    • IMAGE_COUNT: il numero di immagini generate. Valori interi accettati: 1-4. Il valore predefinito è 4.

    Metodo HTTP e URL:

    POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

    Corpo JSON della richiesta:

    {
      "instances": [
        {
          "prompt": "TEXT_PROMPT",
          "referenceImages": [
    
            {
              "referenceType": "REFERENCE_TYPE_SUBJECT",
              "referenceId": 1,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "subjectImageConfig": {
                "subjectDescription": "SUBJECT_DESCRIPTION",
                "subjectType": "SUBJECT_TYPE_PERSON"
              }
            },
            {
              "referenceType": "REFERENCE_TYPE_SUBJECT",
              "referenceId": 1,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "subjectImageConfig": {
                "subjectDescription": "SUBJECT_DESCRIPTION",
                "subjectType": "SUBJECT_TYPE_PERSON"
              }
            },
            {
              "referenceType": "REFERENCE_TYPE_CONTROL",
              "referenceId": 2,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "controlImageConfig": {
                "controlType": "CONTROL_TYPE_FACE_MESH",
                "enableControlImageComputation": true
              }
            }
          ]
        }
      ],
      "parameters": {
        "sampleCount": IMAGE_COUNT
      }
    }
    

    Per inviare la richiesta, scegli una di queste opzioni:

    curl

    Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

    PowerShell

    Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
    La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.
    {
      "predictions": [
        {
          "bytesBase64Encoded": "BASE64_IMG_BYTES",
          "mimeType": "image/png"
        },
        {
          "mimeType": "image/png",
          "bytesBase64Encoded": "BASE64_IMG_BYTES"
        }
      ]
    }
    

    Python

    from google import genai
    from google.genai.types import (
        ControlReferenceConfig,
        ControlReferenceImage,
        EditImageConfig,
        Image,
        SubjectReferenceConfig,
        SubjectReferenceImage
    )
    
    client = genai.Client()
    
    # TODO(developer): Update and un-comment below line
    # output_gcs_uri = "gs://your-bucket/your-prefix"
    
    # Create subject and control reference images of a photograph stored in Google Cloud Storage
    # using https://storage.googleapis.com/cloud-samples-data/generative-ai/image/person.png
    subject_reference_image = SubjectReferenceImage(
        reference_id=1,
        reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/person.png"),
        config=SubjectReferenceConfig(
            subject_description="a headshot of a woman", subject_type="SUBJECT_TYPE_PERSON"
        ),
    )
    control_reference_image = ControlReferenceImage(
        reference_id=2,
        reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/person.png"),
        config=ControlReferenceConfig(control_type="CONTROL_TYPE_FACE_MESH"),
    )
    
    image = client.models.edit_image(
        model="imagen-3.0-capability-001",
        prompt="""
        a portrait of a woman[1] in the pose of the control image[2]in a watercolor style by a professional artist,
        light and low-contrast stokes, bright pastel colors, a warm atmosphere, clean background, grainy paper,
        bold visible brushstrokes, patchy details
        """,
        reference_images=[subject_reference_image, control_reference_image],
        config=EditImageConfig(
            edit_mode="EDIT_MODE_DEFAULT",
            number_of_images=1,
            seed=1,
            safety_filter_level="BLOCK_MEDIUM_AND_ABOVE",
            person_generation="ALLOW_ADULT",
            output_gcs_uri=output_gcs_uri,
        ),
    )
    
    # Example response:
    # gs://your-bucket/your-prefix
    print(image.generated_images[0].image.gcs_uri)

    Personalizzazione del prodotto

    La seguente tabella descrive i modelli di prompt che consigliamo come punto di partenza per scrivere prompt di personalizzazione dei prodotti:

    Immagini di riferimento Modello di prompt Esempio
    Immagine del soggetto (1-4) Crea un'immagine su SUBJECT_DESCRIPTION [1] che corrisponda alla descrizione: ${PROMPT}

    Crea un'immagine di Luxe Elixir hair oil, golden liquid in glass bottle [1] in base alla descrizione: un primo piano di un'immagine in tonalità chiare della mano di una donna che tiene Luxe Elixir hair oil, golden liquid in glass bottle [1] su uno sfondo bianco puro. La mano della donna è ben illuminata e la messa a fuoco è nitida sulla bottiglia, con una profondità di campo ridotta che sfoca lo sfondo ed enfatizza il prodotto. L'illuminazione è morbida e diffusa, creando un bagliore delicato intorno alla bottiglia e alla mano. La composizione complessiva è semplice ed elegante, mettendo in evidenza l'aspetto lussuoso del prodotto.

    Immagine del soggetto (1-4) Genera un'immagine di un SUBJECT_DESCRIPTION ma ${PROMPT}

    Genera un'immagine di un Seiko watch [1], ma in blu.

    Utilizza gli esempi seguenti per inviare una richiesta di personalizzazione con immagini di riferimento del prodotto utilizzate per guidare la generazione di immagini.

    Console

    1. Nella console Google Cloud , vai alla pagina Vertex AI > Media Studio .
      Vai a Media Studio
    2. Nella sezione Modello del riquadro Parametri, seleziona Imagen 3 se non è già selezionato.
    3. Facoltativo. Scegli un formato diverso da 1:1 (impostazione predefinita).
    4. Facoltativo. Modifica il Numero di risultati.
    5. Facoltativo. Fornisci un prompt negativo per indicare al modello cosa evitare di generare.
    6. Facoltativo. Modifica le Opzioni avanzate.
    7. Nel campo Prompt di testo (Scrivi il prompt…), fai clic su Aggiungi riferimento.
      1. Nel riquadro Aggiungi riferimento, scegli il Tipo di riferimento: Subject - product.
      2. Nella sezione Immagini di riferimento, fai clic su Carica.
      3. Scegli un'immagine memorizzata localmente e fai clic su Apri.
      4. Facoltativo. Fornisci una Descrizione per l'immagine di riferimento.
      5. Fai clic su Fine.
      6. Facoltativo. Per aggiungere altre immagini di riferimento, fai clic su Aggiungi un'immagine e carica un'altra immagine.
      7. Dopo aver aggiunto tutte le immagini di riferimento, fai clic su Aggiungi riferimento.

        Tutte le immagini di riferimento che aggiungi in questo riquadro hanno lo stesso numero di riferimento. Utilizza questo numero di riferimento quando aggiungi il prompt di testo.

    8. Nel campo Prompt di testo (Scrivi il prompt…), aggiungi un prompt di testo che includa il numero o i numeri di riferimento per le immagini di riferimento. Ad esempio:
      1. Stanza bianca e luminosa, il product [1] su un tavolo di vetro
      2. il animal [1] in piedi in un ampio campo aperto con una foresta in lontananza
      3. un ritratto in bianco e nero di person [1] su una strada cittadina di film noir style [2]

    REST

    Per ulteriori informazioni sulle richieste del modello imagen-3.0-capability-001, consulta il riferimento API del modello imagen-3.0-capability-001.

    Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

    • PROJECT_ID: il tuo Google Cloud ID progetto.
    • LOCATION: la regione del tuo progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.
    • TEXT_PROMPT: Il prompt di testo guida le immagini che il modello genera. Per utilizzare la personalizzazione di Imagen 3, includi il referenceId dell'immagine o delle immagini di riferimento che fornisci nel formato [$referenceId]. Ad esempio:
      • Crea un'immagine di Luxe Elixir hair oil, golden liquid in glass bottle [1] che corrisponda alla descrizione: un primo piano in tonalità chiare della mano di una donna che tiene in mano Luxe Elixir hair oil, golden liquid in glass bottle [1] su uno sfondo bianco puro. La mano della donna è ben illuminata e la messa a fuoco è nitida sulla bottiglia, con una profondità di campo ridotta che sfoca lo sfondo ed enfatizza il prodotto.
    • "referenceId": l'ID dell'immagine di riferimento o l'ID di una serie di immagini di riferimento che corrispondono allo stesso soggetto o stile. In questo esempio, le due immagini di riferimento riguardano lo stesso prodotto, quindi condividono lo stesso referenceId (1).
    • BASE64_REFERENCE_IMAGE: Un'immagine di riferimento per guidare la generazione di immagini. L'immagine deve essere specificata come stringa di byte con codifica base64.
    • SUBJECT_DESCRIPTION: (Facoltativo). Una descrizione testuale dell'immagine di riferimento che puoi utilizzare nel campo prompt. Ad esempio:
            "prompt": "Luxe Elixir hair oil, golden liquid in glass bottle [1]
             against a pure white background.",
            [...],
            "subjectDescription": "Luxe Elixir hair oil, golden liquid in glass bottle"
          
    • IMAGE_COUNT: il numero di immagini generate. Valori interi accettati: 1-4. Il valore predefinito è 4.

    Metodo HTTP e URL:

    POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

    Corpo JSON della richiesta:

    {
      "instances": [
        {
          "prompt": "TEXT_PROMPT",
          "referenceImages": [
            {
              "referenceType": "REFERENCE_TYPE_SUBJECT",
              "referenceId": 1,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "subjectImageConfig": {
                "subjectType": "SUBJECT_TYPE_PRODUCT",
                "subjectDescription": "SUBJECT_DESCRIPTION"
              }
            },
            {
              "referenceType": "REFERENCE_TYPE_SUBJECT",
              "referenceId": 1,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "subjectImageConfig": {
                "subjectType": "SUBJECT_TYPE_PRODUCT",
                "subjectDescription": "SUBJECT_DESCRIPTION"
              }
            }
          ]
        }
      ],
      "parameters": {
        "sampleCount": IMAGE_COUNT
      }
    }
    

    Per inviare la richiesta, scegli una di queste opzioni:

    curl

    Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

    PowerShell

    Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
    La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.
    {
      "predictions": [
        {
          "bytesBase64Encoded": "BASE64_IMG_BYTES",
          "mimeType": "image/png"
        },
        {
          "mimeType": "image/png",
          "bytesBase64Encoded": "BASE64_IMG_BYTES"
        }
      ]
    }
    

    Utilizzo del prodotto

    Per visualizzare gli standard di utilizzo e le limitazioni dei contenuti associati a Imagen su Vertex AI, consulta le linee guida sull'utilizzo.

    Versioni modello

    Esistono più modelli di generazione di immagini che puoi utilizzare. Per saperne di più, consulta Modelli Imagen.

    Passaggi successivi

    Leggi gli articoli su Imagen e altri prodotti di AI generativa su Vertex AI: