このページは Cloud Translation API によって翻訳されました。

最初と最後の動画フレームを使用して Vertex AI で Veo を使用して動画を生成する

動画の最初と最後のフレームを指定することで、Vertex AI で Veo 動画を生成できます。インターフェースとして Google Cloud コンソールと Vertex AI API がサポートされています。

動画生成用の効果的なテキストプロンプトの作成方法については、Veo プロンプトガイドをご覧ください。

始める前に

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

環境の認証を設定します。

Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
REST

このページの REST API サンプルをローカル開発環境で使用するには、gcloud CLI に指定した認証情報を使用します。
詳細については、 Google Cloud 認証ドキュメントの REST を使用して認証するをご覧ください。
最初と最後のフレームから動画を作成する

次の例は、Veo 動画の最初と最後のフレームを指定する方法を示しています。
コンソール
1. Google Cloud コンソールで、[Vertex AI] > [Media Studio] ページに移動します。
  
  Media Studio
2. [動画] をクリックします。Video Media Studio のページが表示されます。
3. [設定] ペインで、次の設定を構成します。
  
  モデル: 次のいずれかを選択します。
  
  Veo 2: veo-2.0-generate-001
  
  **Veo 3:
  
  veo-3.1-generate-preview**
  
  veo-3.1-fast-generate-preview**
  
  アスペクト比: 16:9 または 9:16 を選択します。
  
  検索結果の表示件数: スライダーを調整するか、1～4 の値を入力します。
  
  動画の長さ: メニューから動画の長さを選択します。
  
  出力ディレクトリ: [参照] をクリックして、生成されたファイルを保存する Cloud Storage バケットを作成または選択します。
4. [プロンプトを入力します] ボックスで、 [アップロード] をクリックします。表示されたダイアログで、最初のフレームの画像を選択します。
  
  アップロードした画像の横に [Add ending frame (Optional)] が表示されます。
5. 省略可: [Add ending frame] をクリックして、終了フレームを追加します。表示されたダイアログで、最後のフレームの画像を選択します。
6. [プロンプトを記述] ボックスに、生成する動画の説明となるテキストプロンプトを入力します。
7. [生成] をクリックします。
Python

インストール
pip install --upgrade google-genai
詳しくは、SDK リファレンスドキュメントをご覧ください。

Vertex AI で Gen AI SDK を使用するための環境変数を設定します。
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
import time from google import genai from google.genai.types import GenerateVideosConfig, Image client = genai.Client() # TODO(developer): Update and un-comment below line # output_gcs_uri = "gs://your-bucket/your-prefix" operation = client.models.generate_videos( model="veo-3.1-generate-preview", prompt="a hand reaches in and places a glass of milk next to the plate of cookies", image=Image( gcs_uri="gs://cloud-samples-data/generative-ai/image/cookies.png", mime_type="image/png", ), config=GenerateVideosConfig( aspect_ratio="16:9", last_frame=Image( gcs_uri="gs://cloud-samples-data/generative-ai/image/cookies-milk.png", mime_type="image/png", ), output_gcs_uri=output_gcs_uri, ), ) while not operation.done: time.sleep(15) operation = client.operations.get(operation) print(operation) if operation.response: print(operation.result.generated_videos[0].video.uri) # Example response: # gs://your-bucket/your-prefix
REST

環境をセットアップしたら、REST を使用してテキストプロンプトをテストできます。次のサンプルは、パブリッシャーモデルのエンドポイントにリクエストを送信します。

Veo API の詳細については、Vertex AI の Veo API をご覧ください。
1. 動画生成リクエストを送信するには、次のコマンドを使用します。このリクエストにより長時間実行オペレーションが開始され、指定した Cloud Storage バケットに出力が保存されます。
  
  リクエストのデータを使用する前に、次のように置き換えます。
  
  PROJECT_ID: Google Cloud プロジェクト ID を表す文字列。
  
  MODEL_ID: 使用するモデル ID を表す文字列。最初または最後の動画フレームを指定する場合は、次のいずれかを使用します。
  
  Veo 2: veo-2.0-generate-001
  
  Veo 3: veo-3.1-generate-preview
  
  Veo 3: veo-3.1-fast-generate-preview
  
  TEXT_PROMPT: 動画の生成をガイドするために使用されるテキストプロンプト。
  
  PATH_TO_FIRST_FRAME_IMAGE: 最初のフレームの画像への Cloud Storage パスを表す文字列。例: "gs://video-bucket/input/first-frame.jpg"。
  
  IMAGE_MIME_TYPE: 入力画像の MIME タイプを表す文字列。次の MIME タイプの画像のみがサポートされています。
  
  image/jpeg
  
  image/png
  
  PATH_TO_LAST_FRAME_IMAGE: 最後のフレームの画像への Cloud Storage パスを表す文字列。例: "gs://video-bucket/input/last-frame.jpg"
  
  OUTPUT_STORAGE_URI: 省略可。出力動画を保存する Cloud Storage バケットを表す文字列。指定しない場合、動画のバイト数がレスポンスで返されます。例: "gs://video-bucket/output/"。
  
  RESPONSE_COUNT: 生成する動画ファイルの数。指定できる値の範囲は 1～4 です。
  
  DURATION: 生成された動画ファイルの長さを表す整数。各モデルで使用できる値は次のとおりです。
  
  Veo 2 モデル: 5～8。デフォルトは 8 です。
  
  Veo 3 モデル: 4、6、8。デフォルトは 8 です。
  
  その他のオプションパラメータ
  
  ユースケースに応じて、次のオプションの変数を使用します。"parameters": {} オブジェクトに次のパラメータの一部またはすべてを追加します。
  
  "parameters": { "aspectRatio": "ASPECT_RATIO", "negativePrompt": "NEGATIVE_PROMPT", "personGeneration": "PERSON_SAFETY_SETTING", // "resolution": RESOLUTION, // Veo 3 models only "sampleCount": RESPONSE_COUNT, "seed": SEED_NUMBER }
  
  ASPECT_RATIO: 省略可。生成された動画のアスペクト比を示す文字列値。使用できる値は次のとおりです。
  "16:9"（横向き）
  
  "9:16"（縦向き）
  
  デフォルト値は "16:9" です。
  
  NEGATIVE_PROMPT: 省略可。モデルが生成するのを防止するコンテンツを記述した文字列値。
  
  PERSON_SAFETY_SETTING: 省略可。人物や顔の生成の安全性設定を制御する文字列値。使用できる値は次のとおりです。
  "allow_adult": 成人の人物とその顔のみが生成されるようにします。
  
  "disallow": 人物や顔を生成しません。
  
  デフォルト値は "allow_adult" です。
  
  RESOLUTION: 省略可。生成された動画の解像度を制御する文字列値。Veo 3 モデルのみでサポートされています。使用できる値は次のとおりです。
  "720p"
  
  "1080p"
  
  デフォルト値は "720p" です。
  
  RESPONSE_COUNT: 省略可。生成する動画の数を表す整数値。指定できる値の範囲は 1～4 です。
  
  SEED_NUMBER: 省略可。モデルが決定的な動画を生成するために使用する uint32 値。他のパラメータを変更せずにリクエストでシード番号を指定すると、モデルは同じ動画を作成するように誘導されます。指定できる値の範囲は 0～4294967295 です。
  
  HTTP メソッドと URL:
  
  POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning
  
  リクエストの本文（JSON）:
  
  { "instances": [ { "prompt": "TEXT_PROMPT", "image": { "gcsUri": "PATH_TO_FIRST_FRAME_IMAGE, "mimeType": "IMAGE_MIME_TYPE" }, "lastFrame:" { "gcsUri": "PATH_TO_LAST_FRAME_IMAGE, "mimeType": "IMAGE_MIME_TYPE" } } ], "parameters": { "storageUri": "OUTPUT_STORAGE_URI", "sampleCount": RESPONSE_COUNT } }
  
  リクエストを送信するには、次のいずれかのオプションを選択します。
  
  curl
  
  注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ユーザーアカウントで gcloud CLI にログインしているか、Cloud Shell を使用して自動的に gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。
  
  リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。
  
  curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json; charset=utf-8" \
  -d @request.json \
  "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"
  
  PowerShell
  
  注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ご自分のユーザーアカウントで gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。
  
  リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。
  
  $cred = gcloud auth print-access-token
  $headers = @{ "Authorization" = "Bearer $cred" }
  
  Invoke-WebRequest `
  -Method POST `
  -Headers $headers `
  -ContentType: "application/json; charset=utf-8" `
  -InFile request.json `
  -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content
  
  このリクエストは、一意のオペレーション ID を含む完全なオペレーション名を返します。この完全なオペレーション名を使用して、動画生成リクエストのステータスをポーリングします。
  
  { "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8" }
2. 省略可: 動画生成の長時間実行オペレーションのステータスを確認します。
  
  リクエストのデータを使用する前に、次のように置き換えます。
  
  PROJECT_ID: 実際の Google Cloud プロジェクト ID。
  
  MODEL_ID: 使用するモデル ID。
  
  OPERATION_ID: 元の動画生成リクエストで返された一意のオペレーション ID。
  
  HTTP メソッドと URL:
  
  POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation
  
  リクエストの本文（JSON）:
  
  { "operationName": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID" }
  
  リクエストを送信するには、次のいずれかのオプションを選択します。
  
  curl
  
  注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ユーザーアカウントで gcloud CLI にログインしているか、Cloud Shell を使用して自動的に gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。
  
  リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。
  
  curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json; charset=utf-8" \
  -d @request.json \
  "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation"
  
  PowerShell
  
  注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ご自分のユーザーアカウントで gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。
  
  リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。
  
  $cred = gcloud auth print-access-token
  $headers = @{ "Authorization" = "Bearer $cred" }
  
  Invoke-WebRequest `
  -Method POST `
  -Headers $headers `
  -ContentType: "application/json; charset=utf-8" `
  -InFile request.json `
  -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation" | Select-Object -Expand Content
  
  このリクエストは、オペレーションがまだ実行中か完了しているかなど、オペレーションに関する情報を返します。
  レスポンス
  
  { "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID", "done": true, "response": { "raiMediaFilteredCount": 0, "@type": "type.googleapis.com/cloud.ai.large_models.vision.GenerateVideoResponse", "videos": [ { "gcsUri":"gs://BUCKET_NAME/TIMESTAMPED_FOLDER/sample_0.mp4", "mimeType": "video/mp4" } ] } }
次のステップ

最初と最後の動画フレームを使用して Vertex AI で Veo を使用して動画を生成する

始める前に

Console

REST

最初と最後のフレームから動画を作成する

コンソール

Python

インストール

REST

curl

PowerShell

curl

PowerShell

レスポンス

次のステップ