Vertex AI 動画生成プロンプト ガイド

このガイドでは、Veo を使用して作成できる動画の種類の例を紹介し、プロンプトの特定部分を変更して異なる結果を生成する方法について説明します。

アクセス権をリクエストする: 上級者向け機能と Veo の順番待ちリスト

プロンプト ガイドの概要

Vertex AI Veo は、テキストから動画を作成するモデルと画像から動画を作成するモデルです。Veo を使用するには、生成 AI モデルに生成させたい内容を説明するテキストであるプロンプトを指定する必要があります。

安全フィルタ

Veo は Vertex AI 全体に安全フィルタを適用し、生成された動画やアップロードされた写真に不適切なコンテンツが含まれないようにします。たとえば、責任ある AI のガイドラインに違反するプロンプトはブロックされます。

Veo の不正使用の疑いがある場合や、生成された出力に不適切な内容や不正確な情報が含まれている場合は、不正行為が疑われる場合の報告フォームGoogle Cloud を使用してください。

プロンプト作成の基本

適切なプロンプトは、説明的で明確です。生成された動画を思い描いたものに近づけるには、まずコアアイデアを特定し、キーワードと修飾子を追加してアイデアを絞り込みます。

プロンプトには次の要素を含める必要があります。

  1. 被写体: 動画に含める物体、人物、動物、風景。
  2. コンテキスト: 被写体が配置される背景やコンテキスト。
  3. アクション: 被写体が行っていること(歩く、走る、首を回すなど)。
  4. スタイル: 概括的なものから特定化されたものまで、さまざまなスタイルを指定できます。ホラー映画フィルム ノワール漫画風のレンダリングなどの特定の映画スタイルのキーワードの使用を検討してください。
  5. カメラの動き: 省略可。空撮、目の高さ、俯瞰撮影、ローアングル撮影など、カメラの動き。
  6. 構図: 省略可: ワイドショット、クローズアップ、エクストリーム クローズアップなど、ショットのフレーミング方法。
  7. 雰囲気: 省略可。色と光がシーンにどのように貢献しているか(青い色調、夜、暖かい色調など)。

プロンプトと生成された出力の例

このセクションでは、いくつかのプロンプトと、各プロンプトで提供される詳細レベルによって、動画で実現したい内容に近づく方法について説明します。

アイシクル

この動画では、プロンプトで各要素を使用する方法について説明します。

プロンプト 生成された出力
凍った岩壁(コンテキスト)に垂れ下がる溶けかけたつらら(被写体)を、クールな青色のトーン(雰囲気)でクローズアップ(構図)撮影した写真。水滴(アクション)のクローズアップのディテールを維持しながらズームイン(カメラの動き)している。 青い背景に垂れるつらら。

電話中の男性

これらの動画では、Veo に生成してほしい動画の詳細をプロンプトに指定する方法を紹介しています。

プロンプト 生成された出力 分析
カメラがドリーして、緑色のネオンライトと映画のシーンを背景に、緑色のトレンチコートに身を包み、追い詰められた表情の男がダイヤル式壁掛け電話で話している様子をクローズアップで映し出す。 電話で話している男性。 これは、プロンプトに基づいて生成された最初の動画です。
緑色のネオンサインの不気味な光に照らされた、ざらざらしたレンガの壁に取り付けられたダイヤル式電話を回す、緑色のトレンチコートを着た絶望的な男を追うクローズアップの映画のようなショット。カメラがドリーインし、電話をかけようと苦労する彼の顎の緊張と顔に刻まれた絶望を映し出す。被写界深度が浅いため、彼の眉間のしわと黒いダイヤル式電話に焦点が当てられ、背景はネオンカラーの海と不明瞭な影にぼかされ、緊急性と孤立感が生まれている。 電話で話す男性 プロンプトをより詳細にすると、より焦点が絞られ、環境が豊かな動画が生成されます。
緑色のトレンチコートを着た絶望的な表情の男が、不気味な緑色のネオンの光に照らされた壁を背に、古いダイヤル式電話を使っている様子を、スムーズな動きでドリーインした動画。カメラは中距離から始まり、男性の顔にゆっくりと近づき、男性が電話を急いでダイヤルしているときの必死の表情と額の汗を映し出します。男性の手元に焦点が当てられ、必死にダイヤルを回して接続しようとする指が映し出されています。緑色のネオンライトが壁に長い影を落とし、緊張感のある雰囲気を醸し出しています。このシーンは、男の孤独と絶望を強調するようにフレームが組まれており、ネオンの鮮やかな光と男の厳しい決意との鮮明なコントラストが際立っています。 電話で話している男性。 詳細を追加することで、被写体にリアルな表情が生まれ、強烈で鮮やかなシーンが作り出されました。

ユキヒョウ

このプロンプトは、Veo が生成する可能性のある出力を示しています。

プロンプト 生成された出力
雪ヒョウのような毛皮を持つかわいい生き物が冬の森を歩いている。3D アニメ風のレンダリング。 ユキヒョウがぐったりしている。

雪の中を走るユキヒョウ

このプロンプトはより詳細で、動画で必要なものに近い出力が生成される可能性があります。

プロンプト 生成された出力
楽しいアニメ風の短い 3D アニメーション シーンを作成します。雪豹のような毛皮、大きな表情豊かな目、丸みを帯びた愛らしい姿をした生き物が、風変わりな冬の森を嬉しそうに跳ね回っている。丸みを帯びた雪に覆われた木々、優しく舞い落ちる雪、枝の間から差し込む暖かい日差しが映し出されている必要があります。生き物の弾むような動きと満面の笑みで、純粋な喜びを表現します。明るく陽気な色と遊び心のあるアニメーションで、明るく心温まるトーンを目指します。冬の楽しい雰囲気を高めるために、さりげなくユーモラスな効果音を追加することを検討してください。 Snow Leopard の動作が高速化されています。

プロンプトの書き方に関するその他のヒント

動画を生成するプロンプトを作成する際は、次のヒントを参考にしてください。

  • わかりやすい表現を使用する: 形容詞や副詞を使用して、Veo の明確な画像を描きます。
  • コンテキストを提供する: 必要に応じて、モデルがユーザーの意図を理解できるように背景情報を含めます。
  • 特定の芸術スタイルを参照する: 特定の美学を念頭に置いている場合は、特定の芸術スタイルや芸術運動を参照します。
  • プロンプト エンジニアリング ツールを活用する: プロンプトを改良して最適な結果を得るために、プロンプト エンジニアリング ツールやリソースの使用をおすすめします。詳細については、プロンプトの概要をご覧ください。
  • 個人写真やグループ写真の顔の細部を補正する: プロンプトで「ポートレート」という単語を使用するなど、写真の焦点として顔の細部を指定します。

プロンプトに詳細を追加する

これらの例は、プロンプトを調整して動画を生成する方法を示しています。

件名の説明

この例では、件名の説明を指定する方法を示します。

Subject description プロンプト 生成された出力
この説明には、「白いコンクリートのアパート」などの件名、複数の件名とアクションを含めることができます。 白いコンクリート製のアパートメント ビルの建築レンダリング。流れるような有機的な形状で、緑豊かな緑と未来的な要素がシームレスに融合している プレースホルダ。

コンテキスト

この例では、コンテキストを指定する方法を示します。

コンテキスト プロンプト 生成された出力
その主題が配置される背景やコンテキストは非常に重要です。被写体を、にぎやかな通りや宇宙など、さまざまな背景に置いてみてください。 宇宙空間を漂う衛星。背景には月と星がいくつか見える。 大気圏を漂う人工衛星。

アクション

この例では、アクションを指定する方法を示します。

操作 プロンプト 生成された出力
被写体は何をしているか(歩いている、走っている、頭を回しているなど)。 ビーチを歩きながら、満足してリラックスした表情で夕日の水平線を眺める女性のワイドショット。 夕日は本当に美しいです。

スタイル

この例では、スタイルを指定する方法を示します。

スタイル プロンプト 生成された出力
キーワードを追加して、生成の品質を高め、浅い被写界深度、映画の静止画、ミニマリスト、シュール、ビンテージ、未来的な二重露光など、意図したスタイルに近づけることができます。 フィルム ノワール風、通りを歩く男女、ミステリー、映画風、白黒。 フィルム ノワール スタイルは本当に美しいです。

カメラの動き

この例では、カメラの動きを指定する方法を示します。

カメラの動き プロンプト 生成された出力
POV ショット、空撮、追跡ドローン ビュー、追跡ショット 雨の中を走るクラシックカーからの POV ショット、カナダの夜、映画のような雰囲気。 夕日は本当に美しいです。

構成

この例では、コンポジションを指定する方法を示します。

楽曲 プロンプト 生成された出力
ショットのフレーミング(ワイドショット、クローズアップ、ローアングル) 街が映り込んだ目の極端なクローズアップ。 夕日は本当に美しいです。
ショットのフレーミング(ワイドショット、クローズアップ、ローアングル) サーフボードを持ってビーチを歩くサーファーのワイドショットの動画を作成して。美しい夕日、映画のような映像。 夕日は本当に美しいです。

アンビアンス

この例では、アンビエンスを指定する方法を示します。

雰囲気 プロンプト 生成された出力
色を追加することで、画像がユニークになり、「くすんだオレンジの暖色系」、「自然光」、「日の出 / 日の入り」といった意図した感情を伝えることができました。カラーパレットは写真において重要な役割を果たし、画像の雰囲気や感情的な影響に影響を与え、画像スタイルを統一します。たとえば、暖色系の金色パレットを使用すると、写真にロマンチックで雰囲気のある印象を与えることができます。カラーパレットの例: 「パステルブルーとピンクの色調」、「薄暗いアンビエント照明」、「冷たいミュートの色調」 公園で愛らしいゴールデン レトリバーの子犬を抱いている少女のクローズアップ、太陽光。 少女の腕に抱かれた子犬。
色を追加することで、画像がユニークになり、「くすんだオレンジの暖色系」、「自然光」、「日の出 / 日の入り」といった意図した感情を伝えることができました。カラーパレットは写真において重要な役割を果たし、画像の雰囲気や感情的な影響に影響を与え、画像スタイルを統一します。たとえば、暖色系の金色パレットを使用すると、写真にロマンチックで雰囲気のある印象を与えることができます。カラーパレットの例: 「パステルブルーとピンクの色調」、「薄暗いアンビエント照明」、「冷たいミュートの色調」 雨の中、バスに乗る悲しそうな女性の映画のようなクローズアップ ショット。クールな青色のトーン、悲しい雰囲気。 バスに乗っている女性が悲しそうな表情をしている。

音声

音声は、プレビュー版veo-3.0-generate-preview でサポートされています。

音声が必要な場合は、明確に指定してください。プロンプトで音声の説明に別々の文を使用することをおすすめします。プロンプトの一部として記述された音声の例を次に示します。

  • 効果音:

    • 音声には、水が跳ねる音が背景に聞こえます。
    • バックグラウンドにソフトな音楽を追加します。
  • 音声:

    • 赤い帽子をかぶった男性が「ウサギはどこだ?」と言っています。すると、彼の隣にいる緑のドレスを着た女性が「森の中よ」と答えます。

参照画像を使用して動画を生成する

Veo の画像から動画への変換機能を使用すると、画像を動画に変換できます。既存のアセットまたは Imagen を使用して、新しい動画を生成することもできます。

プロンプト 生成された出力
チョコレート キャンディバーを持ったウサギ。 ウサギが逃げている。
ウサギが逃げ出す。 ウサギが逃げている。

画像から動画への変換機能を使用する場合は、次のことをおすすめします。

  • アクションと音声の説明が、入力画像に存在する各被写体と一致していることを確認します。

  • 入力画像に複数の被写体がある場合は、どのキャラクターがアクションを実行しているか、または発言しているかを明確に指定します。入力画像内の複数の文字を区別するには、利用可能な最も特徴的な説明の詳細を使用します。次に例を示します。

    • 赤い帽子をかぶった男性。
    • 青いドレスを着た女性。

ネガティブ プロンプト

否定的なプロンプトは、動画から除外する要素を指定でき、強力なツールになります。モデルに生成させたい内容を記述することで、モデルに生成させたくない内容を記述します。次のヒントに従ってください。

  • ❌ 手順を示す言葉や、「なし」や「しない」などの言葉は避けます。たとえば、「壁なし」や「壁を表示しない」など。

  • ✅ 含めたくないものを記述します。たとえば、「壁、フレーム」と指定すると、動画に壁やフレームが表示されなくなります。

プロンプト 生成された出力
強い風に吹かれて葉が激しく揺れる、大きな一本のオークの木をスタイリッシュに描いた短いアニメーションを生成して。木は、少し誇張された、気まぐれな形をしており、枝はダイナミックに流れるように伸びています。葉はさまざまな秋の色を示し、風に舞い上がって踊っている。アニメーションには、穏やかで雰囲気のあるサウンドトラックを使用し、暖かく魅力的なカラーパレットを使用する必要があります。 単語を使ったツリー。
強い風に吹かれて葉が激しく揺れる、大きな一本のオークの木をスタイリッシュに描いた短いアニメーションを生成して。木は、少し誇張された、気まぐれな形をしており、枝はダイナミックに流れるように伸びています。葉はさまざまな秋の色を示し、風に舞い上がって踊っている。アニメーションには、穏やかで雰囲気のあるサウンドトラックを使用し、暖かく魅力的なカラーパレットを使用する必要があります。

ネガティブ プロンプト - 都市の背景、人工構造物、暗い雰囲気、嵐の雰囲気、脅威的な雰囲気。
否定的な言葉のない木。

アスペクト比

Vertex AI Veo の動画生成では、次の 2 つのアスペクト比がサポートされています。

アスペクト比 説明
ワイドスクリーンまたは 16:9 16:9 のアスペクト比は、テレビ、モニター、スマートフォンの画面(横向き)で最も一般的なアスペクト比です。風景など、広い背景を撮影する場合に使用します。
縦向きまたは 9:16

回転したワイドスクリーン。このアスペクト比は、YouTube ショートなどのショート動画アプリで普及しています。このアスペクト比は、人物写真や、建物、木、滝など、縦方向に長い対象に使用します。

ワイドスクリーン - アスペクト比 16:9

これは、アスペクト比 16:9 のワイドスクリーンのプロンプトの例です。

プロンプト 生成された出力
1970 年代のパーム スプリングスで、赤いオープンカーを運転する男性を追跡するドローンからの視点の動画を作成します。暖かい日差しが差し込み、長い影が伸びています。 滝は本当に美しいです。

縦向き - アスペクト比 9:16

これは、アスペクト比 9:16 の縦向きのプロンプトの例です。

プロンプト 生成された出力
緑豊かな熱帯雨林の中にあるハワイの雄大な滝の滑らかな動きを捉えた動画を作成します。リアルな水の流れ、細部まで表現された葉、自然な光に焦点を当て、静けさを伝えます。流れ落ちる水、霧が立ち込める雰囲気、密生した林冠から差し込む斑状の太陽光を捉えます。滑らかで映画のようなカメラの動きで、滝とその周辺の様子を映し出します。平和で現実的なトーンを目指し、視聴者をハワイの熱帯雨林の静かな美しさに誘います。 滝は本当に美しいです。