Guida ai prompt per la generazione di video di Vertex AI

Questa guida fornisce esempi dei tipi di video che puoi creare utilizzando Veo e mostra come modificare parti specifiche di un prompt per produrre risultati diversi.

Richiedere l'accesso: funzionalità avanzate e lista d'attesa di Veo

Panoramica della guida ai prompt

Vertex AI Veo è un modello di generazione di video da testo e immagini. Per utilizzare Veo, devi fornire un prompt, ovvero una descrizione testuale di ciò che vuoi che il modello di AI generativa generi.

Filtri di sicurezza

Veo applica filtri di sicurezza in Vertex AI per garantire che i video generati e le foto caricate non contengano contenuti offensivi. Ad esempio, i prompt che violano le linee guida per l'AI responsabile vengono bloccati.

Se sospetti un abuso di Veo o di qualsiasi output generato che contenga materiale inappropriato o informazioni imprecise, utilizza il modulo Segnala sospetto abuso su Google Cloud.

Nozioni di base per scrivere i prompt

I prompt efficaci sono descrittivi e chiari. Per ottenere un video generato più vicino a quello che vuoi, inizia identificando l'idea principale e poi perfezionala aggiungendo parole chiave e modificatori.

I seguenti elementi devono essere inclusi nel prompt:

  1. Soggetto: l'oggetto, la persona, l'animale o il paesaggio che vuoi includere nel tuo video.
  2. Contesto: lo sfondo o il contesto in cui è inserito il soggetto.
  3. Azione: cosa sta facendo il soggetto (ad esempio, camminando, correndo o girando la testa).
  4. Stile: può essere generale o molto specifico. Prendi in considerazione l'utilizzo di parole chiave specifiche per lo stile cinematografico, ad esempio film horror, film noir o stili animati come il rendering in stile cartone animato.
  5. Movimento della videocamera: (facoltativo) cosa sta facendo la videocamera, ad esempio vista aerea, altezza degli occhi, scatto dall'alto o scatto dal basso.
  6. Composizione: (facoltativo) come viene inquadrata la ripresa, ad esempio campo lungo, primo piano o primissimo piano.
  7. Atmosfera: (facoltativo) in che modo il colore e la luce contribuiscono alla scena, ad esempio toni blu, notte o toni caldi.

Esempi di prompt e output generati

Questa sezione presenta diversi prompt e mostra come il livello di dettaglio fornito in ciascun prompt ti consente di avvicinarti a ciò che vuoi nel tuo video.

Ghiaccioli

Questo video mostra come utilizzare ciascuno degli elementi nel prompt.

Prompt Output generato
Primo piano (composizione) di stalattiti che si sciolgono (soggetto) su una parete rocciosa ghiacciata (contesto) con tonalità fredde di blu (atmosfera), con zoom (movimento della videocamera) che mantiene i dettagli ravvicinati delle gocce d'acqua (azione). Stalattiti che gocciolano su uno sfondo blu.

Uomo al telefono

Questi video mostrano come rivedere il prompt con dettagli più specifici sul video che vuoi che Veo generi.

Prompt Output generato Analisi
La videocamera si sposta per mostrare il primo piano di un uomo disperato che indossa un impermeabile verde e sta telefonando con un telefono a muro in stile rotativo con una luce verde al neon e una scena di un film. Uomo che parla al telefono. Questo è il primo video generato in base al prompt.
Un primo piano cinematografico segue un uomo disperato con un trench verde consunto mentre compone un numero su un telefono a disco montato su un muro di mattoni grezzi, immerso nel bagliore inquietante di un'insegna al neon verde. La videocamera si avvicina, rivelando la tensione nella mascella e la disperazione incisa sul suo volto mentre fatica a fare la chiamata. La profondità di campo ridotta mette a fuoco la sua fronte aggrottata e il telefono nero con tasti rotanti, sfocando lo sfondo in un mare di colori al neon e ombre indistinte, creando un senso di urgenza e isolamento. Uomo che parla al telefono Un prompt più dettagliato genera un video più mirato con un ambiente più ricco.
Un video con un movimento fluido che si avvicina a un uomo disperato con un trench verde che usa un telefono rotativo vintage contro un muro immerso in un inquietante bagliore verde al neon. La videocamera inizia da una distanza media, avvicinandosi lentamente al volto dell'uomo, rivelando la sua espressione frenetica e il sudore sulla fronte mentre compone urgentemente il numero di telefono. Il focus è sulle mani dell'uomo, le cui dita smanettano con il quadrante mentre cerca disperatamente di connettersi. La luce al neon verde proietta lunghe ombre sul muro, contribuendo a creare un'atmosfera di tensione. La scena è inquadrata per enfatizzare l'isolamento e la disperazione dell'uomo, evidenziando il forte contrasto tra la luce intensa del neon e la determinazione cupa dell'uomo. Uomo che parla al telefono. L'aggiunta di maggiori dettagli ha conferito al soggetto un'espressione realistica e ha creato una scena intensa e vibrante.

Leopardo delle nevi

Questo prompt mostra l'output che Veo potrebbe generare.

Prompt Output generato
Una simpatica creatura con pelliccia simile a quella del leopardo delle nevi cammina in una foresta invernale, rendering in stile cartone animato 3D. Il leopardo delle nevi è letargico.

Leopardo delle nevi che corre

Questo prompt è più dettagliato e mostra un output generato che potrebbe avvicinarsi di più a ciò che vuoi nel tuo video.

Prompt Output generato
Crea una breve scena animata in 3D in un allegro stile cartone animato. Una simpatica creatura con pelliccia simile a quella del leopardo delle nevi, grandi occhi espressivi e una forma amichevole e arrotondata che trotterella felice in una foresta invernale fantastica. La scena dovrebbe mostrare alberi arrotondati e innevati, fiocchi di neve che cadono delicatamente e una calda luce solare che filtra attraverso i rami. I movimenti rimbalzanti della creatura e il suo ampio sorriso devono trasmettere pura gioia. Punta a un tono allegro e commovente con colori vivaci e allegri e animazioni giocose. Valuta la possibilità di aggiungere effetti sonori sottili e stravaganti per migliorare l'atmosfera gioiosa dell'inverno. Il leopardo delle nevi sta correndo più velocemente.

Altri suggerimenti per scrivere prompt

I seguenti suggerimenti ti aiutano a scrivere prompt che generano i tuoi video:

  • Utilizza un linguaggio descrittivo: utilizza aggettivi e avverbi per fornire un quadro chiaro a Veo.
  • Fornisci il contesto: se necessario, includi informazioni di base per aiutare il modello a capire cosa vuoi.
  • Fai riferimento a stili artistici specifici: se hai in mente un'estetica particolare, fai riferimento a stili artistici o movimenti artistici specifici.
  • Utilizza strumenti di prompt engineering: valuta la possibilità di esplorare strumenti o risorse di prompt engineering per perfezionare i prompt e ottenere risultati ottimali. Per ulteriori informazioni, consulta la sezione Introduzione ai prompt.
  • Migliora i dettagli del viso nelle tue immagini personali e di gruppo: specifica i dettagli del viso come punto focale della foto, ad esempio utilizzando la parola ritratto nel prompt.

Aggiungere più dettagli ai prompt

Questi esempi mostrano come perfezionare i prompt per generare i video.

Descrizione del soggetto

Questo esempio mostra come specificare una descrizione del soggetto.

Descrizione del soggetto Prompt Output generato
Questa descrizione può includere un soggetto, più soggetti e azioni, ad esempio "palazzo di appartamenti in cemento bianco". Rendering architettonico di un condominio in cemento bianco con forme organiche fluide, che si fondono perfettamente con la vegetazione lussureggiante ed elementi futuristici Segnaposto.

Contesto

Questo esempio mostra come specificare il contesto.

Contesto Prompt Output generato
Lo sfondo o il contesto in cui verrà inserito il soggetto è molto importante. Prova a posizionare il soggetto in una serie di sfondi, ad esempio in una strada trafficata, nello spazio Un satellite che fluttua nello spazio con la luna e alcune stelle sullo sfondo. Satellite che fluttua nell'atmosfera.

Azione

Questo esempio mostra come specificare l'azione.

Azione Prompt Output generato
Cosa sta facendo il soggetto, ad esempio camminando, correndo o girando la testa. Un'inquadratura ampia di una donna che cammina lungo la spiaggia, con un'espressione felice e rilassata, mentre guarda verso l'orizzonte al tramonto. Il tramonto è assolutamente meraviglioso.

Stile

Questo esempio mostra come specificare lo stile.

Stile Prompt Output generato
Puoi aggiungere parole chiave per migliorare la qualità della generazione e indirizzarla verso uno stile più vicino a quello previsto, ad esempio profondità di campo ridotta, fotogramma di un film, minimalista, surreale, vintage, futuristico, doppia esposizione. Stile noir, uomo e donna camminano per strada, mistero, cinematografico, bianco e nero. Lo stile noir è assolutamente meraviglioso.

Movimento della videocamera

Questo esempio mostra come specificare il movimento della videocamera.

Movimento della videocamera Prompt Output generato
Soggettiva, vista aerea, vista del drone di monitoraggio, ripresa di monitoraggio Una ripresa in soggettiva da un'auto d'epoca che guida sotto la pioggia, Canada di notte, cinematografica. Il tramonto è assolutamente meraviglioso.

Composizione

Questo esempio mostra come specificare la composizione.

Composizione Prompt Output generato
Come viene inquadrata la ripresa (campo lungo, primo piano, angolazione dal basso) Primo piano estremo di un occhio con il riflesso della città. Il tramonto è assolutamente meraviglioso.
Come viene inquadrata la ripresa (campo lungo, primo piano, angolazione dal basso) Crea un video con un'inquadratura ampia di un surfista che cammina su una spiaggia con una tavola da surf, un bellissimo tramonto, in stile cinematografico. Il tramonto è assolutamente meraviglioso.

Atmosfera

Questo esempio mostra come specificare l'ambiente.

Atmosfera Prompt Output generato
L'aggiunta di colori ha contribuito a rendere l'immagine unica e a trasmettere le emozioni che volevo comunicare: "toni caldi arancione tenui", "luce naturale", "alba / tramonto". Le palette di colori svolgono un ruolo fondamentale nella fotografia, influenzando l'atmosfera e l'impatto emotivo di un'immagine e rendendo lo stile dell'immagine coerente. Ad esempio, una tavolozza calda e dorata può infondere un'atmosfera romantica e suggestiva in una fotografia. Esempio di tavolozze di colori: "toni di blu e rosa pastello", "illuminazione ambientale soffusa", "toni freddi e tenui" Primo piano di una ragazza che tiene in braccio un adorabile cucciolo di golden retriever nel parco, luce solare. Un cucciolo tra le braccia di una bambina.
L'aggiunta di colori ha contribuito a rendere l'immagine unica e a trasmettere le emozioni che volevo comunicare: "toni caldi arancione tenui", "luce naturale", "alba / tramonto". Le palette di colori svolgono un ruolo fondamentale nella fotografia, influenzando l'atmosfera e l'impatto emotivo di un'immagine e rendendo lo stile dell'immagine coerente. Ad esempio, una tavolozza calda e dorata può infondere un'atmosfera romantica e suggestiva in una fotografia. Esempio di tavolozze di colori: "toni di blu e rosa pastello", "illuminazione ambientale soffusa", "toni freddi e tenui" Primo piano cinematografico di una donna triste che viaggia in autobus sotto la pioggia, con tonalità fredde di blu e un'atmosfera malinconica. Una donna che viaggia su un autobus e si sente triste.

Audio

L'audio è supportato da veo-3.0-generate-preview in Anteprima.

Specifica chiaramente se vuoi l'audio. Ti consigliamo di utilizzare frasi separate nel prompt per descrivere l'audio. Di seguito sono riportati esempi di audio descritti come parte di un prompt:

  • Effetti sonori:

    • L'audio include il rumore dell'acqua che schizza sullo sfondo.
    • Aggiungi musica soft in sottofondo.
  • Speech:

    • L'uomo con il cappello rosso dice: "Dov'è il coniglio?" Poi la donna con il vestito verde accanto a lui risponde: "Lì, nel bosco".

Utilizzare immagini di riferimento per generare video

Puoi dare vita alle immagini utilizzando la funzionalità di conversione da immagine a video di Veo e utilizzare gli asset esistenti o Imagen per generare qualcosa di nuovo.

Prompt Output generato
Coniglio con una barretta di cioccolato. Il coniglio sta scappando.
Il coniglietto scappa. Il coniglio sta scappando.

Quando utilizzi la funzionalità di conversione da immagine a video, ti consigliamo quanto segue:

  • Assicurati che le azioni e le descrizioni del discorso siano in linea con ogni soggetto presente nell'immagine di input.

  • Quando nell'immagine di input sono presenti più soggetti, specifica chiaramente quale personaggio sta eseguendo un'azione o parlando. Per distinguere più personaggi in un'immagine di input, utilizza i dettagli descrittivi più distintivi disponibili. Ad esempio:

    • L'uomo con il cappello rosso.
    • La donna con il vestito blu.

Prompt negativi

I prompt negativi possono essere uno strumento potente che aiuta a specificare gli elementi da escludere dal video. Descrivi ciò che vuoi che il modello non generi descrivendo ciò che vuoi che generi. Segui questi suggerimenti:

  • ❌ Non utilizzare un linguaggio istruttivo o parole come no o non. Ad esempio, "Nessuna parete" o "Non mostrare le pareti".

  • ✅ Descrivi ciò che non vuoi vedere. Ad esempio, "muro, cornice", il che significa che non vuoi un muro o una cornice nel video.

Prompt Output generato
Genera una breve animazione stilizzata di una grande quercia solitaria con le foglie che si muovono vigorosamente a causa di un forte vento. L'albero deve avere una forma leggermente esagerata e fantasiosa, con rami dinamici e fluenti. Le foglie devono mostrare una varietà di colori autunnali, che turbinano e danzano nel vento. L'animazione deve presentare una colonna sonora delicata e atmosferica e utilizzare una tavolozza dei colori calda e accogliente. Albero con parole.
Genera una breve animazione stilizzata di una grande quercia solitaria con le foglie che si muovono vigorosamente a causa di un forte vento. L'albero deve avere una forma leggermente esagerata e fantasiosa, con rami dinamici e fluenti. Le foglie devono mostrare una varietà di colori autunnali, che turbinano e danzano nel vento. L'animazione deve presentare una colonna sonora delicata e atmosferica e utilizzare una tavolozza di colori calda e accogliente.

Con prompt negativi: sfondo urbano, strutture artificiali, atmosfera cupa, tempestosa o minacciosa.
Albero senza parole negative.

Proporzioni

La generazione di video di Vertex AI Veo supporta i seguenti due formati:

Proporzioni Descrizione
Widescreen o 16:9 Le proporzioni 16:9 sono le più comuni per le televisioni, i monitor e gli schermi dei cellulari (orizzontale). Utilizza questa impostazione quando vuoi catturare una porzione più ampia dello sfondo, ad esempio paesaggi panoramici.
Verticale o 9:16

Widescreen ruotato. Questo formato è stato reso popolare dalle applicazioni di video nel formato breve, come YouTube Shorts. Utilizza queste proporzioni per ritratti o oggetti alti con un forte orientamento verticale, come edifici, alberi, cascate o edifici.

Widescreen - proporzioni 16:9

Questo è un esempio di prompt del formato widescreen con proporzioni 16:9.

Prompt Output generato
Crea un video con la visuale di un drone che segue un uomo alla guida di un'auto cabriolet rossa a Palm Springs negli anni '70, con una calda luce solare e lunghe ombre. La cascata è assolutamente meravigliosa.

Verticale - proporzioni 9:16

Questo è un esempio di prompt per un ritratto con proporzioni 9:16.

Prompt Output generato
Crea un video con il movimento fluido di una maestosa cascata hawaiana all'interno di una lussureggiante foresta pluviale. Concentrati sul flusso d'acqua realistico, sul fogliame dettagliato e sull'illuminazione naturale per trasmettere tranquillità. Cattura l'acqua impetuosa, l'atmosfera nebbiosa e la luce del sole che filtra attraverso la fitta canopia. Utilizza movimenti di macchina fluidi e cinematografici per mostrare la cascata e l'ambiente circostante. Punta a un tono tranquillo e realistico, trasportando lo spettatore nella serena bellezza della foresta pluviale hawaiana. La cascata è assolutamente meravigliosa.