Guida agli attributi di prompt e immagine

Per utilizzare Imagen su Vertex AI, devi fornire una descrizione testuale di ciò che vuoi generare o modificare. Queste descrizioni sono chiamate prompt e rappresentano il modo principale per comunicare con l'IA generativa su Vertex AI.

Questa guida mostra come la modifica di parti di un prompt da testo a immagine può produrre risultati diversi e fornisce esempi di immagini che puoi creare. Questa guida fornisce anche indicazioni su come modificare le immagini utilizzando prompt di testo e iterazione.

Per visualizzare gli standard di utilizzo e le limitazioni relative ai contenuti associati a Imagen su Vertex AI, consulta le linee guida sull'utilizzo.

Filtro dei contenuti: testo inserito, immagini caricate e immagini generate

Le immagini generate vengono filtrate per rilevare contenuti indesiderati o dannosi. Analogamente, tutti gli input ricevuti da Imagen su Vertex AI vengono controllati per verificare la presenza di contenuti offensivi. Sono inclusi il prompt di testo inserito e le foto caricate nel caso di modifica delle immagini. Per ulteriori informazioni, consulta le linee guida sull'IA responsabile e sull'utilizzo di Imagen.

Puoi anche segnalare un sospetto abuso di Imagen su Vertex AI o qualsiasi output generato che contenga materiale inappropriato o informazioni imprecise utilizzando il modulo Segnala un sospetto abuso su Google Cloud.

Nozioni di base sulla scrittura dei prompt (oggetto, contesto e stile)

Anche se non esiste un modo unico per scrivere buoni prompt, l'aggiunta di alcune parole chiave e di alcuni modi per modificarle ti aiuterà ad avvicinarti al tuo obiettivo finale. I prompt non devono essere lunghi o complessi, ma la maggior parte dei prompt efficaci è descrittivo e chiaro.

Un buon punto di partenza può essere pensare a soggetto, contesto e stile.

Prompt con soggetto, contesto e stile evidenziati
Testo dell'immagine: un schizzo (stile) di un moderno condominio (soggetto) circondato da grattacieli (contesto e sfondo).
  1. Soggetto: la prima cosa a cui pensare con qualsiasi prompt è il soggetto: l'oggetto, la persona, l'animale o lo scenario di cui vuoi un'immagine.

  2. Contesto e sfondo: altrettanto importante è lo sfondo o il contesto in cui verrà inserito il soggetto. Prova a posizionare il soggetto su diversi tipi di sfondo. Ad esempio, uno studio con sfondo bianco, all'aperto o in ambienti interni.

  3. Stile:infine, aggiungi lo stile dell'immagine che preferisci. Gli stili possono essere generici (pittura, fotografia, schizzi) o molto specifici (acquerello, disegno a carboncino, 3D isometrico).

Dopo aver scritto una prima versione del prompt, perfezionalo aggiungendo più dettagli finché non ottieni l'immagine che vuoi. L'iterazione è importante. Inizia definendo l'idea di base, poi perfezionala ed espandila finché l'immagine generata non si avvicina alla tua visione.

immagine di esempio fotorealistica 1
Prompt: un parco in primavera vicino a un lago
Immagine di esempio fotorealistica 2
Prompt: un parco in primavera vicino a un lago, il sole tramonta sul lago, ora d'oro
immagine di esempio fotorealistica 3
Prompt: un parco in primavera vicino a un lago, il sole che tramonta sul lago, ora d'oro, fiori selvatici rossi

Scrittura di prompt per Imagen 3

Imagen 3 può trasformare le tue idee in immagini dettagliate, indipendentemente dal fatto che i prompt siano brevi o lunghi e dettagliati. Perfeziona la tua visione tramite prompt iterativi, aggiungendo dettagli fino a ottenere il risultato perfetto.

I prompt brevi ti consentono di generare un'immagine rapidamente.

Esempio di prompt di Imagen 3
Prompt: foto in primo piano di una donna sui 20 anni, fotografia di strada, foto di scena di un film, tonalità calde arancioni smorzate

I prompt più lunghi ti consentono di aggiungere dettagli specifici e creare la tua immagine.

Esempio di prompt lungo di Imagen 3
Suggerimento: foto accattivante di una donna sui 20 anni in stile fotografia di strada. L'immagine deve avere l'aspetto di una foto di un film con sfumature arancioni opache e calde.

Suggerimenti aggiuntivi per la scrittura dei prompt di Imagen 3:

  • Utilizza un linguaggio descrittivo: utilizza aggettivi e avverbi dettagliati per fornire un quadro chiaro per Imagen 3.
  • Fornisci il contesto: se necessario, includi informazioni di base per aiutare l'IA a comprendere.
  • Fai riferimento a stili o artisti specifici: se hai in mente un'estetica particolare, può essere utile fare riferimento a movimenti artistici o artisti specifici.
  • Utilizza gli strumenti di prompt engineering: valuta la possibilità di esplorare strumenti o risorse di prompt engineering per perfezionare i prompt e ottenere risultati ottimali.
  • Migliorare i dettagli del viso nelle immagini personali e di gruppo:
    • Specifica i dettagli del viso come punto focale della foto (ad esempio, utilizza la parola "ritratto" nel prompt).
    • Valuta la possibilità di utilizzare un modello più grande come Imagen 3 anziché Imagen 3 Fast per migliorare i dettagli.

Generare testo nelle immagini

La capacità di Imagen 3 di aggiungere testo alle immagini apre nuove possibilità di generazione di immagini creative. Segui le indicazioni riportate di seguito per ottenere il massimo da questa funzionalità:

  • Esegui l'iterazione in tutta sicurezza: potresti dover rigenerare le immagini finché non ottieni il look che preferisci. L'integrazione del testo di Imagen è ancora in evoluzione e talvolta più tentativi generano i risultati migliori.
  • Mantieni breve il testo: limita il testo a 25 caratteri o meno per una generazione ottimale.
  • Più frasi: prova con due o tre frasi distinte per fornire informazioni aggiuntive. Evita di superare tre frasi per composizioni più chiare.

    Esempio di testo generato da Imagen 3
    Stimolo: un poster con il testo "Summerland" in grassetto come titolo. Sotto questo testo è riportato lo slogan "L'estate non è mai stata così bella"
  • Posizionamento guidato: anche se Imagen può tentare di posizionare il testo come indicato, dovresti aspettarti variazioni occasionali. Questa funzionalità è in costante miglioramento.

  • Stile carattere ispirato: specifica uno stile di carattere generale per influenzare leggermente le scelte di Imagen. Non fare affidamento sulla replica precisa dei caratteri, ma aspettati interpretazioni creative.

  • Dimensioni carattere: specifica una dimensione del carattere o un'indicazione generale delle dimensioni (ad es. piccolo, medio, grande) per influenzare la generazione delle dimensioni del carattere.

Parametrizzazione dei prompt

Per controllare meglio i risultati di output, potresti trovare utile parametrizzare gli input in Imagen quando utilizzi l'API Imagen o l'SDK Vertex AI per Python. Ad esempio, supponiamo che tu voglia che i tuoi clienti possano generare loghi per la loro attività e che tu voglia assicurarti che i loghi vengano sempre generati su uno sfondo a tinta unita. Vuoi anche limitare le opzioni che il cliente può selezionare da un menu.

In questo esempio, puoi creare un prompt parametro simile al seguente:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

Nell'interfaccia utente personalizzata, il cliente può inserire i parametri utilizzando un menu e il valore scelto viene inserito nel prompt ricevuto da Imagen.

Ad esempio:

  1. Prompt: A minimalist logo for a health care company on a solid color background. Include the text Journey.

    Esempio 1 di parametrizzazione del prompt di Imagen 3

  2. Prompt: A modern logo for a software company on a solid color background. Include the text Silo.

    Esempio 2 di parametrizzazione del prompt di Imagen 3

  3. Prompt: A traditional logo for a baking company on a solid color background. Include the text Seed.

    Esempio 3 di parametrizzazione del prompt di Imagen 3

Stile: fotografia

  • Il prompt include: "Una foto di…"

Per utilizzare questo stile, inizia con l'uso di parole chiave che indichino chiaramente a Imagen su Vertex AI che stai cercando una fotografia. Inizia i prompt con "Una foto di. . .". Ad esempio:

immagine di esempio fotorealistica 1
Prompt: una foto di chicchi di caffè in una cucina su una superficie di legno
Immagine di esempio fotorealistica 2
Prompt: una foto di una barretta di cioccolato su un banco da cucina
immagine di esempio fotorealistica 3
Prompt: una foto di un edificio moderno con acqua sullo sfondo

Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.

Stile: illustrazione e arte

  • Il prompt include: "Un painting di…", "Un sketch di…"

Gli stili artistici variano da quelli monocromatici, come gli schizzi a matita, all'arte digitale iperrealistica. Ad esempio, le seguenti immagini utilizzano lo stesso prompt con stili diversi:

"Un [art style or creation technique] di una berlina elettrica sportiva angolare con grattacieli sullo sfondo"

immagini di esempio di artwork
Prompt: un disegno tecnico a matita di un...
immagini di esempio di artwork
Prompt: un disegno a carboncino di una forma...
immagini di esempio di artwork
Prompt: un disegno a matita colorata di un...
immagini di esempio di artwork
Prompt: un dipinto a pastello di un...
immagini di esempio di artwork
Prompt: un'opera d'arte digitale di un...
immagini di esempio di artwork
Prompt: un poster (Art Déco) di un...

Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 2.

Tecniche avanzate di scrittura dei prompt

Utilizza i seguenti esempi per creare prompt più specifici in base agli attributi: descrizioni di fotografia, forme e materiali, movimenti artistici storici e modificatori della qualità delle immagini.

Modificatori per la fotografia

Negli esempi seguenti puoi vedere diversi parametri e modificatori specifici per la fotografia.

  1. Prossimità fotocamera: primo piano, foto scattata da lontano

    immagine di esempio di fotocamera in primo piano
    Prompt: una foto in primo piano di chicchi di caffè
    Immagine di esempio della fotocamera con zoom ridotto
    Prompt: una foto con lo zoom ridotto di una piccola busta di
    chicchi di caffè in una cucina disordinata

  2. Posizione videocamera: aerea, dall'alto

    immagine di esempio di foto aerea
    Prompt: foto aerea di una città urbana con grattacieli
    una vista dall'alto dell'immagine di esempio
    Suggerimento: una foto della chioma di una foresta con cielo blu da sotto
  3. Illuminazione: naturale, drammatica, calda, fredda

    immagine di esempio con illuminazione naturale
    Suggerimento: foto in studio di una poltrona moderna, illuminazione naturale
    immagine di esempio con illuminazione drammatica
    Suggerimento: foto in studio di una poltrona moderna, illuminazione drammatica
  4. Impostazioni della fotocamera - sfocatura in movimento, sfocatura, bokeh, ritratto

    immagine di esempio di sfocatura movimento
    Prompt: foto di una città con grattacieli dall'interno di un'auto con sfocatura in movimento
    immagine di esempio con sfocatura diffusa
    Prompt: fotografia con sfocatura di un ponte in una città urbana di notte
  5. Tipi di obiettivi: 35 mm, 50 mm, fisheye, grandangolare, macro

    immagine di esempio dell'obiettivo macro
    Prompt: foto di una foglia, obiettivo macro
    immagine di esempio di obiettivo fisheye
    Prompt: street photography, New York City, obiettivo fisheye
  6. Tipi di pellicole: bianco e nero, Polaroid

    immagine di esempio di foto Polaroid
    Prompt: un ritratto Polaroid di un cane con gli occhiali da sole
    Immagine di esempio di foto in bianco e nero
    Prompt: foto in bianco e nero di un cane con gli occhiali da sole

Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.

Forme e materiali

  • Il prompt include: "…realizzato in…", "…a forma di…"

Uno dei punti di forza di questa tecnologia è che puoi creare immagini che altrimenti sarebbero difficili o impossibili. Ad esempio, puoi ricreare il logo della tua azienda in diversi materiali e trame.

Immagine di esempio di forme e materiali 1
Stimolo: un borsone fatto di formaggio
Immagine di esempio di forme e materiali 2
Prompt: tubi al neon a forma di uccello
immagine di esempio di forme e materiali 3
Stimolo: una poltrona fatta di carta, foto in studio, stile origami

Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.

Riferimenti artistici storici

  • Il prompt include: "…nello stile di…"

Alcuni stili sono diventati iconici nel corso degli anni. Di seguito sono riportate alcune idee di stili artistici o di pittura storica che puoi provare.

"Genera un'immagine nello stile di [art period or movement]: un parco eolico"

impressionism example image
Prompt: genera un'immagine nello stile di un dipinto impressionista: un parco eolico
immagine di esempio rinascimentale
Prompt: genera un'immagine nello stile di un dipinto rinascimentale: un parco eolico
immagine di esempio di pop art
Prompt: genera un'immagine nello stile della pop art: un parco eolico

Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.

Modificatori della qualità delle immagini

Alcune parole chiave possono comunicare al modello che stai cercando un asset di alta qualità. Ecco alcuni esempi di modificatori della qualità:

  • Modificatori generali: di alta qualità, belli, stilizzati
  • Foto: 4K, HDR, foto professionali
  • Arte, illustrazione: di un professionista, dettagliata

Di seguito sono riportati alcuni esempi di prompt senza modificatori della qualità e lo stesso prompt con modificatori della qualità.

immagine di esempio di mais senza modificatori
Prompt (nessun modificatore della qualità): una foto di un gambo di mais
Immagine di esempio di mais con modificatori
Suggerimento (con modificatori della qualità): bellissima foto
HDR 4K di una pannocchia scattata da un fotografo professionista

Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.

Proporzioni

La generazione di immagini di Imagen 3 consente di impostare cinque proporzioni diverse per le immagini.

  1. Quadrato (1:1, predefinito): una foto quadrata standard. Gli utilizzi comuni di questo formato includono i post sui social media.
  2. A schermo intero (4:3): queste proporzioni sono comunemente utilizzate nei media o nei film. Sono anche le dimensioni della maggior parte delle vecchie TV (non widescreen) e delle fotocamere medio formato. Cattura più della scena in orizzontale (rispetto a 1:1), pertanto è il formato preferito per la fotografia.

    esempio di proporzioni
    Prompt: primo piano delle dita di un musicista che suona il piano, film in bianco e nero, vintage (formato 4:3)
    esempio di proporzioni
    Prompt: una foto professionale in studio di patatine fritte per un ristorante di alta gamma, nello stile di una rivista di cucina (formato 4:3)
  3. Schermo intero verticale (3:4): si tratta delle proporzioni a schermo intero ruotate di 90 gradi. In questo modo puoi acquisire più della scena in verticale rispetto alle proporzioni 1:1.

    esempio di proporzioni
    Stimolo: una donna che fa trekking, primo piano dei suoi stivali riflessi in una pozzanghera, grandi montagne sullo sfondo, nello stile di un annuncio pubblicitario, angolazioni drammatiche (formato 3:4)
    esempio di proporzioni
    Prompt: ripresa aerea di un fiume che scorre in una valle mistica (formato 3:4)
  4. Widescreen (16:9): questa proporzione ha sostituito il formato 4:3 ed è ora la più comune per TV, monitor e schermi di cellulari (orizzontale). Utilizza queste proporzioni quando vuoi catturare più dello sfondo (ad esempio paesaggi panoramici).

    esempio di proporzioni
    Prompt: un uomo che indossa abiti completamente bianchi seduto sulla spiaggia, primo piano, illuminazione dell'ora d'oro (proporzioni 16:9)
  5. Verticale (9:16): queste proporzioni sono widescreen, ma ruotate. Si tratta di un'apologia relativamente nuova, resa popolare dalle app di video nel formato breve (ad esempio YouTube Shorts). Utilizzalo per oggetti alti con forti orientamenti verticali, come edifici, alberi, cascate o altri oggetti simili.

    esempio di proporzioni
    Stimolo: un rendering digitale di un grattacielo enorme, moderno, grandioso, epico con un bellissimo tramonto sullo sfondo (proporzioni 9:16)

Prompt negativi

Gli esempi precedenti si concentrano sulla scrittura di prompt per ciò che vuoi che Imagen crei, ma puoi anche fornire un prompt negativo insieme al prompt originale per aiutare il prodotto a generare o modificare le immagini. Questi prompt negativi possono essere uno strumento efficace per specificare quali elementi eliminare dall'immagine. Descrivi semplicemente ciò che non vuoi.

Consigliato: descrivi in modo chiaro cosa non vuoi vedere. Ad esempio "parete, cornice".

Sconsigliato: evita un linguaggio didattico o parole come "no" o "non". Ad esempio, evita frasi come "nessuna parete" o "non mostrare le pareti".

immagine di esempio di pittura senza prompt negativo
Prompt (nessun prompt negativo): concept art di videogiochi 4K, giungla urbana, città cyberpunk, rendering dettagliato
Immagine di esempio di pittura con prompt negativo
Prompt: concept art di videogiochi 4K, giungla urbana, città cyberpunk, rendering dettagliato
Prompt negativo: verde, piante, foresta, alberi
immagine di esempio di pittura senza prompt negativo
Prompt (nessun prompt negativo): illustrazione di un drago alato mitico che vola sopra le montagne
Immagine di esempio di pittura con prompt negativo
Prompt: illustrazione di una mitica viverna che vola sopra le montagne
Prompt negativo: neve, gelo

Immagini fotorealistiche

Versioni diverse del modello di generazione delle immagini potrebbero offrire una combinazione di output artistici e fotorealistici. Utilizza la seguente formulazione nei prompt per generare un output più fotorealistico, in base all'oggetto che vuoi generare.

Caso d'uso Tipo di obiettivo Lunghezza focale Ulteriori dettagli
Persone (ritratti) Primo, zoom 24-35mm film in bianco e nero, film noir, profondità di campo, duotone (menziona due colori)
Cibo, insetti, piante (oggetti, nature morte) Macro 60-105mm Alto livello di dettaglio, messa a fuoco precisa, illuminazione controllata
Sport, fauna selvatica (in movimento) Zoom teleobiettivo 100-400mm Tempo di esposizione rapido, monitoraggio di azioni o movimenti
Astronomica, orizzontale (grandangolare) Grandangolare 10-24mm Tempi di esposizione lunghi, messa a fuoco nitida, esposizione lunga, acqua o nuvole lisce

Ritratti

Caso d'uso Tipo di obiettivo Lunghezza focale Ulteriori dettagli
Persone (ritratti) Primo, zoom 24-35mm film in bianco e nero, film noir, profondità di campo, duotone (menziona due colori)

Utilizzando diverse parole chiave della tabella, Imagen può generare i seguenti ritratti.

esempio di fotografia ritrattistica esempio di fotografia ritrattistica esempio di fotografia ritrattistica esempio di fotografia ritrattistica

Prompt: Una donna, ritratto 35 mm, duotone blu e grigio
Modello: Imagen 2 (imagegeneration@005)

esempio di fotografia ritrattistica esempio di fotografia ritrattistica esempio di fotografia ritrattistica esempio di fotografia ritrattistica

Prompt: Una donna, ritratto 35 mm, film noir
Modello: Imagen 2 (imagegeneration@005)

Oggetti

Caso d'uso Tipo di obiettivo Lunghezza focale Ulteriori dettagli
Cibo, insetti, piante (oggetti, nature morte) Macro 60-105mm Alto livello di dettaglio, messa a fuoco precisa, illuminazione controllata

Utilizzando diverse parole chiave della tabella, Imagen può generare le seguenti immagini di oggetti.

Esempio di fotografia di oggetti Esempio di fotografia di oggetti Esempio di fotografia di oggetti Esempio di fotografia di oggetti

Prompt: foglia di una pianta di preghiera, obiettivo macro, 60 mm
Modello: Imagen 2 (imagegeneration@005)

Esempio di fotografia di oggetti Esempio di fotografia di oggetti Esempio di fotografia di oggetti Esempio di fotografia di oggetti

Prompt: un piatto di pasta, obiettivo macro da 100 mm
Modello: Imagen 2 (imagegeneration@005)

Azione

Caso d'uso Tipo di obiettivo Lunghezza focale Ulteriori dettagli
Sport, fauna selvatica (in movimento) Zoom teleobiettivo 100-400mm Tempo di esposizione rapido, monitoraggio di azioni o movimenti

Utilizzando diverse parole chiave della tabella, Imagen può generare le seguenti immagini in movimento.

Esempio di fotografia in movimento Esempio di fotografia in movimento Esempio di fotografia in movimento Esempio di fotografia in movimento

Prompt: un touchdown vincente, tempo di esposizione rapido, monitoraggio dei movimenti
Modello: Imagen 2 (imagegeneration@005)

Esempio di fotografia in movimento Esempio di fotografia in movimento Esempio di fotografia in movimento Esempio di fotografia in movimento

Prompt: Un cervo che corre nella foresta, velocità dell'otturatore elevata, monitoraggio dei movimenti
Modello: Imagen 2 (imagegeneration@005)

Grandangolare

Caso d'uso Tipo di obiettivo Lunghezza focale Ulteriori dettagli
Astronomica, orizzontale (grandangolare) Grandangolare 10-24mm Tempi di esposizione lunghi, messa a fuoco nitida, esposizione lunga, acqua o nuvole lisce

Utilizzando diverse parole chiave della tabella, Imagen può generare le seguenti immagini grandangolari.

Esempio di fotografia grandangolare Esempio di fotografia grandangolare Esempio di fotografia grandangolare Esempio di fotografia grandangolare

Prompt: una vasta catena montuosa, orizzontale grandangolare 10 mm
Modello: Imagen 2 (imagegeneration@005)

Esempio di fotografia grandangolare Esempio di fotografia grandangolare Esempio di fotografia grandangolare Esempio di fotografia grandangolare

Prompt: una foto della luna, astrofotografia, grandangolo 10 mm
Modello: Imagen 2 (imagegeneration@005)

Passaggi successivi

Leggi gli articoli su Imagen e su altri prodotti di IA generativa su Vertex AI: