Leitfaden für Prompts zur Videogenerierung mit Vertex AI

Diese Anleitung enthält Beispiele für die Arten von Videos, die Sie mit Veo erstellen können, und zeigt, wie Sie bestimmte Teile einer Eingabeaufforderung ändern, um unterschiedliche Ergebnisse zu erzielen.

Zugriff anfordern: Erweiterte Funktionen und Veo-Warteliste

Übersicht über die Prompt-Anleitung

Vertex AI Veo ist ein Modell zur Generierung von Text-zu-Video und Bild-zu-Video. Wenn Sie Veo verwenden möchten, müssen Sie einen Prompt angeben. Das ist eine Textbeschreibung der Inhalte, die Ihr generatives KI-Modell generieren soll.

Sicherheitsfilter

Veo wendet Sicherheitsfilter in Vertex AI an, um sicherzustellen, dass generierte Videos und hochgeladene Fotos keine anstößigen Inhalte enthalten. So werden beispielsweise Prompts, die gegen die Richtlinien für Responsible AI verstoßen, blockiert.

Wenn Sie den Verdacht haben, dass Veo missbraucht wird oder dass eine generierte Ausgabe unangemessenes Material oder ungenaue Informationen enthält, verwenden Sie das Formular Einen mutmaßlichen Missbrauch inGoogle Cloudmelden.

Grundlagen zum Schreiben von Prompts

Gute Prompts sind beschreibend und klar. Damit das generierte Video Ihren Vorstellungen entspricht, sollten Sie zuerst Ihre Kernidee festlegen und sie dann durch Hinzufügen von Keywords und Modifikatoren verfeinern.

Ihr Prompt sollte die folgenden Elemente enthalten:

  1. Motiv: Das Objekt, die Person, das Tier oder die Landschaft, die Sie in Ihrem Video haben möchten.
  2. Kontext: Der Hintergrund oder Kontext, in dem das Motiv platziert wird.
  3. Aktion: Was das Subjekt tut (z. B. gehen, laufen oder den Kopf drehen).
  4. Stil: Dieser kann allgemein oder sehr spezifisch sein. Verwenden Sie spezifische Keywords für Filmstile wie Horrorfilm, Film noir oder animierte Stile wie Cartoon.
  5. Kamerabewegung: Optional. Was die Kamera tut, z. B. Luftaufnahme, Augenhöhe, Aufnahme von oben oder Froschperspektive.
  6. Komposition: Optional: Wie die Aufnahme gerahmt ist, z. B. als Weitwinkelaufnahme, Nahaufnahme oder extreme Nahaufnahme.
  7. Atmosphäre (optional): Wie Farbe und Licht zur Szene beitragen, z. B. Blautöne, Nacht oder warme Farbtöne.

Beispiele für Prompts und generierte Ausgaben

In diesem Abschnitt werden verschiedene Prompts vorgestellt und es wird gezeigt, wie Sie durch den Detaillierungsgrad in den einzelnen Prompts dem gewünschten Ergebnis näher kommen.

Eiszapfen

In diesem Video wird gezeigt, wie Sie die einzelnen Elemente in Ihrem Prompt verwenden können.

Eingabeaufforderung Generierte Ausgabe
Nahaufnahme (Komposition) von schmelzenden Eiszapfen (Motiv) an einer gefrorenen Felswand (Kontext) mit kühlen Blautönen (Atmosphäre), herangezoomt (Kamerabewegung), wobei die Nahaufnahmedetails von Wassertropfen (Aktion) beibehalten werden. Tropfende Eiszapfen vor blauem Hintergrund.

Mann am Telefon

In diesen Videos wird gezeigt, wie Sie Ihren Prompt mit genaueren Details zum Video, das Veo generieren soll, überarbeiten können.

Eingabeaufforderung Generierte Ausgabe Analyse
Die Kamera fährt heran und zeigt eine Nahaufnahme eines verzweifelten Mannes in einem grünen Trenchcoat, der an einem Wandtelefon mit Wählscheibe telefoniert. Die Szene ist in grünes Neonlicht getaucht und wirkt wie eine Filmszene. Mann, der telefoniert. Das ist das erste Video, das auf Grundlage des Prompts generiert wurde.
Eine filmische Nahaufnahme zeigt einen verzweifelten Mann in einem abgewetzten grünen Trenchcoat, der ein Wählscheibentelefon wählt, das an einer schmutzigen Backsteinmauer angebracht ist und im unheimlichen Schein eines grünen Leuchtreklameschilds liegt. Die Kamera fährt näher heran und zeigt die Anspannung in seinem Kiefer und die Verzweiflung in seinem Gesicht, während er versucht, den Anruf zu tätigen. Die geringe Schärfentiefe lenkt den Fokus auf seine gerunzelte Stirn und das schwarze Wählscheibentelefon. Der Hintergrund verschwimmt zu einem Meer aus Neonfarben und undeutlichen Schatten, was ein Gefühl der Dringlichkeit und Isolation erzeugt. Mann, der telefoniert Ein detaillierterer Prompt führt zu einem Video, das fokussierter ist und eine reichhaltigere Umgebung bietet.
Ein Video mit flüssigen Bewegungen, das auf einen verzweifelten Mann in einem grünen Trenchcoat zufährt, der ein altes Wählscheibentelefon an einer Wand benutzt, die in einem unheimlichen grünen Neonlicht erstrahlt. Die Kamera beginnt mit einer mittleren Entfernung und nähert sich langsam dem Gesicht des Mannes. Sein verzweifelter Gesichtsausdruck und der Schweiß auf seiner Stirn werden sichtbar, während er dringend die Telefonnummer wählt. Der Fokus liegt auf den Händen des Mannes, dessen Finger nervös am Wählrad drehen, während er verzweifelt versucht, eine Verbindung herzustellen. Das grüne Neonlicht wirft lange Schatten an die Wand und trägt zur angespannten Atmosphäre bei. Die Szene ist so gerahmt, dass die Isolation und Verzweiflung des Mannes betont werden, wodurch der starke Kontrast zwischen dem lebhaften Leuchten des Neons und der grimmigen Entschlossenheit des Mannes hervorgehoben wird. Mann, der telefoniert. Durch die zusätzlichen Details erhielt das Motiv einen realistischen Ausdruck und es entstand eine intensive und lebendige Szene.

Schneeleopard

Dieser Prompt zeigt die Ausgabe, die Veo generieren könnte.

Eingabeaufforderung Generierte Ausgabe
Eine niedliche Kreatur mit einem Fell, das dem eines Schneeleoparden ähnelt, geht in einem Winterwald. 3D-Cartoon-Rendering. Der Schneeleopard ist lethargisch.

Laufender Schneeleopard

Dieser Prompt enthält mehr Details und zeigt eine generierte Ausgabe, die möglicherweise eher Ihren Vorstellungen entspricht.

Eingabeaufforderung Generierte Ausgabe
Erstelle eine kurze 3D-animierte Szene in einem fröhlichen Cartoonstil. Eine niedliche Kreatur mit schneeleopardenähnlichem Fell, großen ausdrucksstarken Augen und einer freundlichen, runden Form hüpft fröhlich durch einen skurrilen Winterwald. Die Szene sollte runde, schneebedeckte Bäume, sanft fallende Schneeflocken und warmes Sonnenlicht, das durch die Äste scheint, zeigen. Die hüpfenden Bewegungen und das breite Lächeln der Kreatur sollten pure Freude vermitteln. Der Ton sollte optimistisch und herzerwärmend sein. Die Farben sollten hell und fröhlich sein und die Animationen verspielt. Fügen Sie dezente, verspielte Soundeffekte hinzu, um die fröhliche Winterstimmung zu unterstreichen. Der Schneeleopard läuft schneller.

Weitere Tipps zum Verfassen von Prompts

Die folgenden Tipps helfen Ihnen, Prompts zu schreiben, mit denen Videos generiert werden:

  • Beschreibende Sprache verwenden: Verwenden Sie Adjektive und Adverbien, um Veo ein klares Bild zu vermitteln.
  • Kontext bereitstellen: Fügen Sie bei Bedarf Hintergrundinformationen hinzu, damit das Modell versteht, was Sie möchten.
  • Auf bestimmte künstlerische Stile verweisen: Wenn Sie eine bestimmte Ästhetik im Sinn haben, verweisen Sie auf bestimmte künstlerische Stile oder Kunstrichtungen.
  • Tools für Prompt Engineering nutzen: Sie können Tools oder Ressourcen für Prompt Engineering verwenden, um Ihre Prompts zu optimieren und optimale Ergebnisse zu erzielen. Weitere Informationen finden Sie unter Einführung in das Prompting.
  • Gesichtsdetails in Ihren persönlichen und Gruppenbildern optimieren: Geben Sie Gesichtsdetails als Fokus des Fotos an, z. B. indem Sie das Wort Porträt im Prompt verwenden.

Prompts weitere Details hinzufügen

Diese Beispiele zeigen, wie Sie Ihre Prompts optimieren können, um Videos zu generieren.

Beschreibung des Themas

In diesem Beispiel wird gezeigt, wie Sie eine Beschreibung des Themas angeben.

Beschreibung des Themas Eingabeaufforderung Generierte Ausgabe
Diese Beschreibung kann ein oder mehrere Subjekte und Aktionen enthalten, z. B. „weißes Beton-Mehrfamilienhaus“. Eine architektonische Darstellung eines Apartmentgebäudes aus weißem Beton mit fließenden organischen Formen, das nahtlos in üppiges Grün und futuristische Elemente übergeht Platzhalter.

Kontext

In diesem Beispiel wird gezeigt, wie Sie Kontext angeben.

Kontext Eingabeaufforderung Generierte Ausgabe
Der Hintergrund oder Kontext, in dem das Motiv platziert wird, ist sehr wichtig. Platzieren Sie das Motiv vor verschiedenen Hintergründen, z. B. auf einer belebten Straße oder im Weltraum. Ein Satellit, der durch das Weltall schwebt, mit dem Mond und einigen Sternen im Hintergrund. Satellit, der in der Atmosphäre schwebt.

Aktion

In diesem Beispiel wird gezeigt, wie Sie eine Aktion angeben.

Aktion Eingabeaufforderung Generierte Ausgabe
Was macht das Motiv, z. B. geht, läuft oder dreht es den Kopf? Eine Weitwinkelaufnahme einer Frau, die am Strand entlanggeht und dabei zufrieden und entspannt wirkt. Sie blickt bei Sonnenuntergang auf den Horizont. Der Sonnenuntergang ist wunderschön.

Stil

In diesem Beispiel wird gezeigt, wie Sie den Stil festlegen.

Stil Eingabeaufforderung Generierte Ausgabe
Sie können Keywords hinzufügen, um die Qualität der Generierung zu verbessern und sie in die gewünschte Richtung zu lenken, z. B. geringe Schärfentiefe, Filmbild, minimalistisch, surreal, Vintage, futuristisch oder Doppelbelichtung. Film-Noir-Stil, Mann und Frau gehen auf der Straße, Mystery, filmisch, Schwarz-Weiß. Der Film-noir-Stil ist wunderschön.

Kamerabewegung

In diesem Beispiel wird gezeigt, wie Sie die Kamerabewegung angeben.

Kamerabewegung Eingabeaufforderung Generierte Ausgabe
POV-Aufnahme, Luftaufnahme, Tracking-Drohnenaufnahme, Tracking-Aufnahme Eine POV-Aufnahme aus einem Oldtimer, der nachts im Regen in Kanada fährt, filmreif. Der Sonnenuntergang ist wunderschön.

Komposition

In diesem Beispiel wird gezeigt, wie Sie die Komposition angeben.

Zusammensetzung Eingabeaufforderung Generierte Ausgabe
Wie die Aufnahme gerahmt ist (Weitwinkelaufnahme, Nahaufnahme, Froschperspektive) Extreme Nahaufnahme eines Auges, in dem sich eine Stadt spiegelt. Der Sonnenuntergang ist wunderschön.
Wie die Aufnahme gerahmt ist (Weitwinkelaufnahme, Nahaufnahme, Froschperspektive) Erstelle ein Video mit einer Weitwinkelaufnahme eines Surfers, der mit einem Surfbrett an einem Strand entlanggeht. Es soll ein schöner Sonnenuntergang zu sehen sein und das Video soll filmisch wirken. Der Sonnenuntergang ist wunderschön.

Ambiance

In diesem Beispiel wird gezeigt, wie Sie das Ambiente angeben.

Ambiente Eingabeaufforderung Generierte Ausgabe
Durch das Hinzufügen von Farben wurde das Bild einzigartig und die beabsichtigten Emotionen „gedämpfte warme Orangetöne“, „natürliches Licht“, „Sonnenaufgang / Sonnenuntergang“ wurden vermittelt. Farbpaletten spielen in der Fotografie eine wichtige Rolle. Sie beeinflussen die Stimmung und emotionale Wirkung eines Bildes und sorgen für einen einheitlichen Bildstil. Eine warme, goldene Farbpalette kann einem Foto beispielsweise eine romantische und stimmungsvolle Note verleihen. Beispiele für Farbpaletten: „Pastellblau und Rosatöne“, „gedämpfte Umgebungsbeleuchtung“, „kalte, gedämpfte Töne“ Nahaufnahme eines Mädchens, das einen niedlichen Golden Retriever-Welpen im Park hält, Sonnenlicht. Ein Welpe in den Armen eines jungen Mädchens.
Durch das Hinzufügen von Farben wurde das Bild einzigartig und die beabsichtigten Emotionen „gedämpfte warme Orangetöne“, „natürliches Licht“, „Sonnenaufgang / Sonnenuntergang“ wurden vermittelt. Farbpaletten spielen in der Fotografie eine wichtige Rolle. Sie beeinflussen die Stimmung und emotionale Wirkung eines Bildes und sorgen für einen einheitlichen Bildstil. Eine warme, goldene Farbpalette kann einem Foto beispielsweise eine romantische und stimmungsvolle Note verleihen. Beispiele für Farbpaletten: „Pastellblau und Rosatöne“, „gedämpfte Umgebungsbeleuchtung“, „kalte, gedämpfte Töne“ Kinoreife Nahaufnahme einer traurigen Frau, die im Regen mit dem Bus fährt, kühle Blautöne, traurige Stimmung. Eine Frau, die mit dem Bus fährt und traurig aussieht.

Audio

Audio wird von veo-3.0-generate-preview in der Vorabversion unterstützt.

Geben Sie deutlich an, ob Sie Audio wünschen. Wir empfehlen, die Audioinhalte in separaten Sätzen im Prompt zu beschreiben. Hier einige Beispiele für Audio, das in einem Prompt beschrieben wird:

  • Soundeffekte:

    • Im Hintergrund ist das Geräusch von spritzendem Wasser zu hören.
    • Füge im Hintergrund sanfte Musik hinzu.
  • Sprache:

    • Der Mann mit dem roten Hut sagt: „Wo ist das Kaninchen?“ Die Frau im grünen Kleid neben ihm antwortet: „Dort, im Wald.“

Mit Referenzbildern Videos generieren

Mit der Funktion „Bild zu Video“ von Veo können Sie Bilder zum Leben erwecken. Sie können Ihre vorhandenen Assets oder Imagen verwenden, um etwas Neues zu generieren.

Eingabeaufforderung Generierte Ausgabe
Hase mit einer Schokoladentafel. Das Kaninchen läuft weg.
Das Kaninchen läuft weg. Das Kaninchen läuft weg.

Wenn Sie das Tool „Bild zu Video“ verwenden, empfehlen wir Folgendes:

  • Achten Sie darauf, dass Aktionen und Sprachbeschreibungen mit jedem Motiv auf dem Eingabebild übereinstimmen.

  • Wenn im Eingabebild mehrere Motive vorhanden sind, geben Sie deutlich an, welche Figur eine Aktion ausführt oder spricht. Wenn Sie zwischen mehreren Zeichen in einem Eingabebild unterscheiden möchten, verwenden Sie die auffälligsten verfügbaren beschreibenden Details. Beispiel:

    • Der Mann mit dem roten Hut.
    • Die Frau im blauen Kleid.

Negative Prompts

Negative Prompts können ein leistungsstarkes Tool sein, mit dem Sie angeben können, welche Elemente nicht im Video enthalten sein sollen. Beschreiben Sie, was das Modell generieren soll, um zu verhindern, dass es etwas anderes generiert. Befolgen Sie diese Tipps:

  • ❌ Verwenden Sie keine Formulierungen oder Wörter wie keine oder Nicht. Beispiele: „Keine Wände“ oder „Wände nicht anzeigen“.

  • ✅ Beschreiben Sie, was Sie nicht sehen möchten. Beispiel: „Wand, Rahmen“. Das bedeutet, dass Sie keine Wand oder keinen Rahmen im Video haben möchten.

Eingabeaufforderung Generierte Ausgabe
Erstelle eine kurze, stilisierte Animation einer großen, einzelnen Eiche, deren Blätter im starken Wind wehen. Der Baum sollte eine leicht übertriebene, skurrile Form mit dynamischen, fließenden Ästen haben. Die Blätter sollten eine Vielzahl von Herbstfarben aufweisen und sich im Wind drehen und tanzen. Die Animation sollte einen sanften, atmosphärischen Soundtrack und eine warme, einladende Farbpalette haben. Baum mit Wörtern.
Erstelle eine kurze, stilisierte Animation einer großen, einzelnen Eiche, deren Blätter im starken Wind wehen. Der Baum sollte eine leicht übertriebene, skurrile Form mit dynamischen, fließenden Ästen haben. Die Blätter sollten eine Vielzahl von Herbstfarben aufweisen und sich im Wind drehen und tanzen. Die Animation sollte einen sanften, atmosphärischen Soundtrack und eine warme, einladende Farbpalette haben.

Negativer Prompt: städtischer Hintergrund, von Menschen geschaffene Strukturen, dunkle, stürmische oder bedrohliche Atmosphäre.
Baum ohne negative Wörter.

Seitenverhältnisse

Die Videogenerierung mit Vertex AI Veo unterstützt die folgenden beiden Seitenverhältnisse:

Seitenverhältnis Beschreibung
Breitbild oder 16:9 Das Seitenverhältnis 16:9 ist das gängigste Seitenverhältnis für Fernseher, Monitore und Bildschirme von Smartphones (Querformat). Verwenden Sie dieses Seitenverhältnis, wenn Sie mehr vom Hintergrund erfassen möchten, z. B. malerische Landschaften.
Hochformat oder 9:16

Gedrehtes Breitbild. Dieses Seitenverhältnis ist in Kurzvideo-Apps wie YouTube Shorts beliebt. Verwenden Sie dieses Seitenverhältnis für Porträts oder hohe Objekte mit stark vertikalen Ausrichtungen wie Gebäude, Bäume oder Wasserfälle.

Widescreen – Seitenverhältnis von 16:9

Dies ist ein Beispiel für einen Prompt für das Breitbildformat mit einem Seitenverhältnis von 16:9.

Eingabeaufforderung Generierte Ausgabe
Erstelle ein Video mit einer Drohnenaufnahme eines Mannes, der in den 1970er-Jahren in Palm Springs in einem roten Cabrio fährt. Das Video soll warmes Sonnenlicht und lange Schatten zeigen. Der Wasserfall ist wunderschön.

Hochformat – Seitenverhältnis von 9:16

Dies ist ein Beispiel für einen Prompt für ein Porträt mit einem Seitenverhältnis von 9:16.

Eingabeaufforderung Generierte Ausgabe
Erstelle ein Video mit einer sanften Bewegung eines majestätischen hawaiianischen Wasserfalls in einem üppigen Regenwald. Konzentriere dich auf einen realistischen Wasserfluss, detaillierte Blätter und eine natürliche Beleuchtung, um Ruhe zu vermitteln. Halten Sie das rauschende Wasser, die neblige Atmosphäre und das gefleckte Sonnenlicht fest, das durch das dichte Blätterdach dringt. Verwende sanfte, filmische Kamerabewegungen, um den Wasserfall und seine Umgebung zu präsentieren. Der Ton sollte ruhig und realistisch sein und den Zuschauer in die friedliche Schönheit des hawaiianischen Regenwalds entführen. Der Wasserfall ist wunderschön.