Diese Seite wurde von der Cloud Translation API übersetzt.

Veo on Vertex AI Video Generation API

Veo ist der Name des Modells, das die Videogenerierung unterstützt. Veo generiert ein Video aus einem von Ihnen bereitgestellten Text- oder Bild-Prompt. Weitere Informationen zu Veo finden Sie im Überblick über die Videogenerierung mit Veo.

Weitere Informationen zu diesem Modell finden Sie in der Console auf der Video Generation-Modellkarte in Model Garden.

Veo in Vertex AI (Vertex AI Studio) ausprobieren

Veo in einem Colab ausprobieren

Unterstützte Modelle

Die Veo API unterstützt die folgenden Modelle:

Weitere Informationen finden Sie unter Veo-Modelle.

HTTP-Anfrage

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:predictLongRunning \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
        "mimeType": string
      },
      "lastFrame": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
        "mimeType": string
      },
      "video": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
        "mimeType": string
      },
      "mask": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
        "mimeType": string,
        "maskMode": string
      },
      "referenceImages": [
        // A list of up to three asset images or at most one style image for the
        // model to use when generating videos.
        //
        // referenceImages is supported by the following models in Preview:
        //
        // *   veo-2.0-generate-exp
        // *   veo-3.1-generate-preview
        {
        "image:" {
          // Union field can be only one of the following:
          "bytesBase64Encoded": string,
          "gcsUri": string,
          // End of list of possible types for union field.
          "mimeType": string
        },
        "referenceType": string
        }
      ]
    }
  ],
  "parameters": {
    "aspectRatio": string,
    "compressionQuality": string,
    "durationSeconds": integer,
    "enhancePrompt": boolean,
    "generateAudio": boolean,
    "negativePrompt": string,
    "personGeneration": string,
    "resizeMode": string, // Veo 3 image-to-video only
    "resolution": string, // Veo 3 models only
    "sampleCount": integer,
    "seed": uint32,
    "storageUri": string
  }
}'

Instanzen

Instanzen
`prompt`	`string` Für Text-zu-Video erforderlich. Optional, wenn ein Eingabe-Bild-Prompt angegeben wird (Bild-zu-Video). Ein Textstring, der die ersten acht Sekunden des Videos beschreibt. Beispiel: Eine schnelle Kamerafahrt durch eine geschäftige dystopische Stadt mit hellen Neonschildern, fliegenden Autos und Nebel, Nacht, Lens Flare, volumetrischer Beleuchtung Ein Neonhologramm eines Autos, das mit Höchstgeschwindigkeit fährt, Lichtgeschwindigkeit, cinematisch, unglaubliche Details, volumetrische Beleuchtung Viele gepunktete Quallen pulsieren unter Wasser. Ihre Körper sind durchsichtig und leuchten im tiefen Ozean. Extremes Close-up mit geringer Schärfentiefe einer Pfütze auf einer Straße, die eine belebte, futuristische Stadt Tokio mit hellen Neonschildern bei Nacht und Lens Flare widerspiegelt Zeitrafferaufnahme von Nordlichtern, die über den arktischen Himmel tanzen, Sterne, die funkeln, schneebedeckte Landschaft Ein einsamer Cowboy reitet bei einem wunderschönen Sonnenuntergang mit seinem Pferd über eine offene Ebene, weiches Licht, warme Farben
`image`	Union-Feld Optional. Ein Bild, das als Grundlage für die Videogenerierung dient. Es kann entweder ein `bytesBase64Encoded`-String sein, der ein Bild codiert, oder ein `gcsUri`-String-URI zu einem Cloud Storage-Bucket-Speicherort.
`lastFrame`	Union-Feld Optional. Ein Bild des ersten Frames eines Videos, um den Zwischenraum zu füllen. `lastFrame` kann entweder ein `bytesBase64Encoded`-String sein, der ein Bild codiert, oder ein `gcsUri`-String-URI zu einem Cloud Storage-Bucket-Speicherort. `lastFrame` wird von den folgenden Modellen in der Vorschau unterstützt: `veo-2.0-generate-001` `veo-3.0-generate-exp` `veo-3.1-generate-preview` `veo-3.1-fast-generate-preview`
`video`	Union-Feld Optional. Ein von Veo generiertes Video, das verlängert werden soll. Dabei kann es sich entweder um einen `bytesBase64Encoded`-String, der ein Video codiert, oder um einen `gcsUri`-String-URI für einen Cloud Storage-Bucket-Standort handeln. `video` wird von den folgenden Modellen in der Vorschau unterstützt: `veo-2.0-generate-001` `veo-3.0-generate-exp`
`mask`	Union-Feld Optional. Ein Bild einer Maske, die auf ein Video angewendet werden soll, um ein Objekt hinzuzufügen oder zu entfernen. `mask` kann entweder ein `bytesBase64Encoded`-String sein, der ein Bild codiert, oder ein `gcsUri`-String-URI zu einem Cloud Storage-Bucket-Speicherort. `mask` wird von `veo-2.0-generate-preview` in der Vorschau unterstützt.
`referenceImages`	`list[referenceImages]` Optional. Eine Liste mit bis zu drei Asset-Bildern oder höchstens einem Stilbild, die den `referenceImages` beschreiben, den das Modell beim Generieren von Videos verwenden soll. Wichtig:Veo 3.1-Modelle unterstützen `referenceImages.style` nicht. Verwenden Sie `veo-2.0-generate-exp`, wenn Sie Stilbilder verwenden. `referenceImages` wird von den folgenden Modellen in der Vorschau unterstützt: `veo-2.0-generate-exp` `veo-3.1-generate-preview`
`referenceImages.image`	Union-Feld Optional. Enthält die Referenzbilder für `veo-2.0-generate-exp`, die als Eingabe für das Motiv verwendet werden sollen. Jedes Bild kann entweder ein `bytesBase64Encoded`-String sein, der ein Bild codiert, oder ein `gcsUri`-String-URI für einen Cloud Storage-Bucket-Speicherort.
`referenceImages.referenceType`	`string` Erforderlich in einem `referenceImages`-Objekt. Gibt den Typ des bereitgestellten Referenzbilds an. Folgende Werte werden unterstützt: `"asset"`: Das Referenzbild enthält Assets für das generierte Video, z. B. die Szene, ein Objekt oder eine Figur. `"style"`: Das Referenzbild enthält Stilinformationen für die generierten Videos, z. B. Szenenfarben, Beleuchtung oder Textur. Wichtig:Veo 3.1-Modelle unterstützen `referenceImages.style` nicht. Verwenden Sie `veo-2.0-generate-exp`, wenn Sie Stilbilder verwenden.
`bytesBase64Encoded`	`string` Ein Base64-codierter String einer Bild- oder Videodatei in Bytes. Wird mit den folgenden Objekten verwendet: `image` `video` `lastFrame` `referenceImages.image`
`gcsUri`	`string` Ein String-URI für einen Cloud Storage-Bucket-Speicherort. Wird mit den folgenden Objekten verwendet: `image` `video` `lastFrame` `referenceImages.image`
`mimeType`	`string` Erforderlich für die folgenden Objekte: `image` `video` `mask` `lastFrame` `referenceImages.image` Gibt den MIME-Typ eines Videos oder Bildes an. Für Bilder werden die folgenden MIME-Typen akzeptiert: `image/jpeg` `image/png` `image/webp` Für Videos werden die folgenden MIME-Typen akzeptiert: `video/mov` `video/mpeg` `video/mp4` `video/mpg` `video/avi` `video/wmv` `video/mpegps` `video/flv`

Parameter

Parameter
`aspectRatio`	`string` Optional. Gibt das Seitenverhältnis der generierten Videos an. Folgende Werte sind zulässig: `"16:9"` `"9:16"` Der Standardwert ist `"16:9"`.
`compressionQuality`	`string` Optional. Gibt die Komprimierungsqualität der generierten Videos an. Die zulässigen Werte sind `"optimized"` oder `"lossless"`. Der Standardwert ist `"optimized"`.
`durationSeconds`	`integer` Erforderlich. Die Länge in Sekunden der Videodateien, die Sie generieren möchten. Folgende Werte sind zulässig: Veo 2-Modelle: `5`–`8`. Der Standardwert ist `8`. Veo 3-Modelle: `4`, `6` oder `8`. Der Standardwert ist `8`. Bei Verwendung von `referenceImages`: `8`. Weitere Informationen finden Sie unter Veo-Modelle.
`enhancePrompt`	`boolean` Optional. Gemini verwenden, um Prompts zu optimieren Zulässige Werte sind `true` oder `false`. Der Standardwert ist `true`.
`generateAudio`	`boolean` Für Veo 3-Modelle erforderlich. Audio für das Video generieren. Zulässige Werte sind `true` oder `false`. `generateAudio` wird von `veo-2.0-generate-001` oder `veo-2.0-generate-exp` nicht unterstützt. Weitere Informationen zu den verfügbaren Veo-Modellen finden Sie unter Veo-Modelle.
`negativePrompt`	`string` Optional. Ein Textstring, der beschreibt, was das Modell nicht generieren soll. Beispiel: Deckenbeleuchtung, helle Farben Personen, Tiere mehrere Autos, Wind
`personGeneration`	`string` Optional. Die Sicherheitseinstellung, die bestimmt, ob die Generierung von Personen oder Gesichtern zulässig ist. Eines der folgenden Betriebssysteme: `"allow_adult"` (Standardwert): Es dürfen nur Erwachsene generiert werden. `"dont_allow"`: Das Einfügen von Personen/Gesichtern in Bilder wird nicht zugelassen.
`resizeMode`	`string` Optional. Nur Veo 3-Modelle, die mit `image` für die Bild-zu-Video-Funktion verwendet werden. Der Skalierungsmodus, den das Modell zum Skalieren des Videos verwendet. Zulässige Werte sind `"pad"` (Standard) oder `"crop"`.
`resolution`	`string` Optional. Nur Veo 3-Modelle: Die Auflösung des generierten Videos. Die zulässigen Werte sind `"720p"` (Standard) oder `"1080p"`.
`sampleCount`	`int` Optional. Die Anzahl der angeforderten Ausgabevideos. Zulässige Werte sind `1`–`4`.
`seed`	`uint32` Optional. Eine Zahl, die Sie einer Anfrage hinzufügen, um generierte Videos deterministisch zu machen. Wenn Sie Ihrer Anfrage eine Quell-Nummer hinzufügen, ohne andere Parameter zu ändern, generiert das Modell dieselben Videos. Der akzeptierte Bereich liegt zwischen `0` und `4,294,967,295`.
`storageUri`	`string` Optional. Ein Cloud Storage-Bucket-URI zum Speichern des Ausgabevideos im Format `gs://BUCKET_NAME/SUBDIRECTORY`. Wenn kein Cloud Storage-Bucket angegeben wird, werden Base64-codierte Videobytes in der Antwort zurückgegeben.

Beispielanforderungen

Anhand der folgenden Beispiele können Sie Ihre eigene Videoanfrage erstellen:

Antrag auf Videogenerierung aus Text

REST

Senden Sie zum Testen eines Text-Prompts mit der Vertex AI Veo API eine POST-Anfrage an den Endpunkt des Publisher-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ein String, der Ihre Google Cloud Projekt-ID darstellt.
MODEL_ID: Ein String, der die zu verwendende Modell-ID darstellt. Folgende Werte sind zulässig:
- Veo 2:"veo-2.0-generate-001"
- Veo 3:"veo-3.0-generate-001"
- Veo 3:"veo-3.0-fast-generate-001"
- Veo 3"veo-3.0-generate-preview" (Vorabversion)
- Veo 3"veo-3.0-fast-generate-preview" (Vorabversion)
- Veo 3.1:"veo-3.1-generate-preview"
- Veo 3.1:"veo-3.1-fast-generate-preview"
TEXT_PROMPT: Der Text-Prompt, der zur Steuerung der Videogenerierung verwendet wird.
OUTPUT_STORAGE_URI: Optional: Ein String, der den Cloud Storage-Bucket darstellt, in dem die Ausgabevideos gespeichert werden sollen. Wenn nicht angegeben, werden Videobyte in der Antwort zurückgegeben. Beispiel: "gs://video-bucket/output/".
RESPONSE_COUNT: Die Anzahl der zu generierenden Videodateien. Der akzeptierte Wertebereich ist 1–4.
DURATION: Eine Ganzzahl, die die Länge der generierten Videodateien angibt. Die folgenden Werte sind für die einzelnen Modelle zulässig:
- Veo 2-Modelle: 5–8. Der Standardwert ist 8.
- Veo 3-Modelle: 4, 6 oder 8. Der Standardwert ist 8.
Zusätzliche optionale Parameter

Je nach Anwendungsfall können Sie die folgenden optionalen Variablen verwenden. Fügen Sie dem "parameters": {}-Objekt einige oder alle der folgenden Parameter hinzu.
```
"parameters": {
  "aspectRatio": "ASPECT_RATIO",
  "negativePrompt": "NEGATIVE_PROMPT",
  "personGeneration": "PERSON_SAFETY_SETTING",
  // "resolution": RESOLUTION, // Veo 3 models only
  "sampleCount": RESPONSE_COUNT,
  "seed": SEED_NUMBER
}
```
- ASPECT_RATIO: Optional: Ein Stringwert, der das Seitenverhältnis der generierten Videos beschreibt. Sie können die folgenden Werte verwenden:
  - "16:9" für Landschaft
  - "9:16" für Hochformat
  Der Standardwert ist "16:9".
- NEGATIVE_PROMPT (optional): Ein Stringwert, der Inhalte beschreibt, die das Modell nicht generieren soll.
- PERSON_SAFETY_SETTING: Optional: Ein Stringwert, der die Sicherheitseinstellung für die Generierung von Personen oder Gesichtern steuert. Sie können die folgenden Werte verwenden:
  - "allow_adult": Nur Generierung von Erwachsenen und Gesichtern zulassen.
  - "disallow": Es werden keine Personen oder Gesichter generiert.
  Der Standardwert ist "allow_adult".
- RESOLUTION: Optional: Ein Stringwert, der die Auflösung des generierten Videos steuert. Wird nur von Veo 3-Modellen unterstützt. Sie können die folgenden Werte verwenden:
  - "720p"
  - "1080p"
  Der Standardwert ist "720p".
- RESPONSE_COUNT: Optional. Ein Ganzzahlwert, der die Anzahl der zu generierenden Videos angibt. Der akzeptierte Wertebereich ist 1–4.
- SEED_NUMBER: Optional. Ein uint32-Wert, den das Modell zum Generieren deterministischer Videos verwendet. Wenn Sie eine Quell-Nummer in Ihrer Anfrage angeben, ohne andere Parameter zu ändern, wird das Modell angewiesen, dieselben Videos zu erstellen. Der akzeptierte Wertebereich ist 0–4294967295.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "storageUri": "OUTPUT_STORAGE_URI",
    "sampleCount": "RESPONSE_COUNT"
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben. Dazu haben Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt, die Sie automatisch bei der gcloud CLI anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"

PowerShell

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben. Dazu führen Sie gcloud init oder gcloud auth login aus. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content

Diese Anfrage gibt einen vollständigen Vorgangsnamen mit einer eindeutigen Vorgangs-ID zurück. Verwenden Sie diesen vollständigen Vorgangsnamen, um den Status der Videogenerierungsanfrage abzufragen.

{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
}

Anfrage zur Bild-zu-Video-Generierung

REST

Senden Sie zum Testen eines Text-Prompts mit der Vertex AI Veo API eine POST-Anfrage an den Endpunkt des Publisher-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ein String, der Ihre Google Cloud Projekt-ID darstellt.
MODEL_ID: Ein String, der die zu verwendende Modell-ID darstellt. Folgende Werte sind zulässig:
- Veo 2veo-2.0-generate-001
- Veo 3:veo-3.0-generate-001
- Veo 3.1veo-3.1-generate-preview
- Veo 3.1veo-3.1-fast-generate-preview
TEXT_PROMPT: Der Text-Prompt, der zur Steuerung der Videogenerierung verwendet wird.
INPUT_IMAGE: Ein base64-codierter String, der das Eingabebild darstellt. Für eine optimale Qualität sollte das Eingabebild eine Auflösung von mindestens 720p (1.280 × 720 Pixel) und ein Seitenverhältnis von 16:9 oder 9:16 haben. Bilder mit anderen Seitenverhältnissen oder Größen können beim Hochladen in der Größe angepasst oder mittig zugeschnitten werden.
MIME_TYPE: Ein String, der den MIME-Typ des Eingabebilds darstellt. Es werden nur Bilder mit den folgenden MIME-Typen unterstützt:
- "image/jpeg"
- "image/png"
OUTPUT_STORAGE_URI: Optional: Ein String, der den Cloud Storage-Bucket darstellt, in dem die Ausgabevideos gespeichert werden sollen. Wenn nicht angegeben, werden Videobyte in der Antwort zurückgegeben. Beispiel: "gs://video-bucket/output/".
RESIZE_MODE: Ein String, der den zu verwendenden Skalierungsmodus darstellt. Folgende Werte sind zulässig:
- "crop": Das Video wird so zugeschnitten, dass es der neuen Größe entspricht.
- "pad": Das Video wird so angepasst, dass es der neuen Größe entspricht.
RESPONSE_COUNT: Die Anzahl der zu generierenden Videodateien. Der akzeptierte Wertebereich ist 1–4.
DURATION: Eine Ganzzahl, die die Länge der generierten Videodateien angibt. Die folgenden Werte sind für die einzelnen Modelle zulässig:
- Veo 2-Modelle: 5–8. Der Standardwert ist 8.
- Veo 3-Modelle: 4, 6 oder 8. Der Standardwert ist 8.
Zusätzliche optionale Parameter

Je nach Anwendungsfall können Sie die folgenden optionalen Variablen verwenden. Fügen Sie dem "parameters": {}-Objekt einige oder alle der folgenden Parameter hinzu.
```
"parameters": {
  "aspectRatio": "ASPECT_RATIO",
  "negativePrompt": "NEGATIVE_PROMPT",
  "personGeneration": "PERSON_SAFETY_SETTING",
  // "resolution": RESOLUTION, // Veo 3 models only
  "sampleCount": RESPONSE_COUNT,
  "seed": SEED_NUMBER
}
```
- ASPECT_RATIO: Optional: Ein Stringwert, der das Seitenverhältnis der generierten Videos beschreibt. Sie können die folgenden Werte verwenden:
  - "16:9" für Landschaft
  - "9:16" für Hochformat
  Der Standardwert ist "16:9".
- NEGATIVE_PROMPT (optional): Ein Stringwert, der Inhalte beschreibt, die das Modell nicht generieren soll.
- PERSON_SAFETY_SETTING: Optional: Ein Stringwert, der die Sicherheitseinstellung für die Generierung von Personen oder Gesichtern steuert. Sie können die folgenden Werte verwenden:
  - "allow_adult": Nur Generierung von Erwachsenen und Gesichtern zulassen.
  - "disallow": Es werden keine Personen oder Gesichter generiert.
  Der Standardwert ist "allow_adult".
- RESOLUTION: Optional: Ein Stringwert, der die Auflösung des generierten Videos steuert. Wird nur von Veo 3-Modellen unterstützt. Sie können die folgenden Werte verwenden:
  - "720p"
  - "1080p"
  Der Standardwert ist "720p".
- RESPONSE_COUNT: Optional. Ein Ganzzahlwert, der die Anzahl der zu generierenden Videos angibt. Der akzeptierte Wertebereich ist 1–4.
- SEED_NUMBER: Optional. Ein uint32-Wert, den das Modell zum Generieren deterministischer Videos verwendet. Wenn Sie eine Quell-Nummer in Ihrer Anfrage angeben, ohne andere Parameter zu ändern, wird das Modell angewiesen, dieselben Videos zu erstellen. Der akzeptierte Wertebereich ist 0–4294967295.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "image": {
        "bytesBase64Encoded": "INPUT_IMAGE",
        "mimeType": "MIME_TYPE"
      }
    }
  ],
  "parameters": {
    "storageUri": "OUTPUT_STORAGE_URI",
    "sampleCount": RESPONSE_COUNT
    "resizeMode": "RESIZE_MODE"
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content

{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
}

Videoanfrage mit Asset-Bildern

REST

Senden Sie zum Testen eines Text-Prompts mit der Vertex AI Veo API eine POST-Anfrage an den Endpunkt des Publisher-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
MODEL_ID: Ein String, der die zu verwendende Modell-ID darstellt. Folgende Werte sind zulässig:
- Veo 2: veo-2.0-generate-exp
- Veo 3: veo-3.1-generate-preview
TEXT_PROMPT: Der Text-Prompt, der zur Steuerung der Videogenerierung verwendet wird.
BASE64_ENCODED_IMAGE: Ein base64-codiertes Bild des Motivs. Sie können dieses Feld und mimeType wiederholen, um bis zu drei Motivbilder anzugeben.
IMAGE_MIME_TYPE: Der MIME-Typ des Eingabebilds. Nur einer der Folgenden:
- image/jpeg
- image/png
Sie können dieses Feld und bytesBase64Encoded wiederholen, um bis zu drei Motivbilder anzugeben.
OUTPUT_STORAGE_URI: Optional: Der Cloud Storage-Bucket, in dem die Ausgabevideos gespeichert werden sollen. Wenn nicht angegeben, wird in der Antwort ein Base64-Byte-codiertes Video zurückgegeben. Beispiel: gs://video-bucket/output/.
RESPONSE_COUNT: Die Anzahl der Videodateien, die Sie generieren möchten. Zulässige Ganzzahlwerte: 1–4.
Zusätzliche optionale Parameter

Je nach Anwendungsfall können Sie die folgenden optionalen Variablen verwenden. Fügen Sie dem "parameters": {}-Objekt einige oder alle der folgenden Parameter hinzu.
```
"parameters": {
  "aspectRatio": "ASPECT_RATIO",
  "negativePrompt": "NEGATIVE_PROMPT",
  "personGeneration": "PERSON_SAFETY_SETTING",
  // "resolution": RESOLUTION, // Veo 3 models only
  "sampleCount": RESPONSE_COUNT,
  "seed": SEED_NUMBER
}
```
- ASPECT_RATIO: Optional: Ein Stringwert, der das Seitenverhältnis der generierten Videos beschreibt. Sie können die folgenden Werte verwenden:
  - "16:9" für Landschaft
  - "9:16" für Hochformat
  Der Standardwert ist "16:9".
- NEGATIVE_PROMPT (optional): Ein Stringwert, der Inhalte beschreibt, die das Modell nicht generieren soll.
- PERSON_SAFETY_SETTING: Optional: Ein Stringwert, der die Sicherheitseinstellung für die Generierung von Personen oder Gesichtern steuert. Sie können die folgenden Werte verwenden:
  - "allow_adult": Nur Generierung von Erwachsenen und Gesichtern zulassen.
  - "disallow": Es werden keine Personen oder Gesichter generiert.
  Der Standardwert ist "allow_adult".
- RESOLUTION: Optional: Ein Stringwert, der die Auflösung des generierten Videos steuert. Wird nur von Veo 3-Modellen unterstützt. Sie können die folgenden Werte verwenden:
  - "720p"
  - "1080p"
  Der Standardwert ist "720p".
- RESPONSE_COUNT: Optional. Ein Ganzzahlwert, der die Anzahl der zu generierenden Videos angibt. Der akzeptierte Wertebereich ist 1–4.
- SEED_NUMBER: Optional. Ein uint32-Wert, den das Modell zum Generieren deterministischer Videos verwendet. Wenn Sie eine Quell-Nummer in Ihrer Anfrage angeben, ohne andere Parameter zu ändern, wird das Modell angewiesen, dieselben Videos zu erstellen. Der akzeptierte Wertebereich ist 0–4294967295.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      // The following fields can be repeated for up to three total
      // images.
      "referenceImages": [
        {
          "image": {
            "bytesBase64Encoded": "BASE64_ENCODED_IMAGE",
            "mimeType": "IMAGE_MIME_TYPE"
          },
          "referenceType": "asset"
        }
      ]
    }
  ],
  "parameters": {
    "durationSeconds": 8,
    "storageUri": "OUTPUT_STORAGE_URI",
    "sampleCount": RESPONSE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content

{
  "name":
  "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
}

Videoanfrage mit einem Stilbild

REST

Senden Sie zum Testen eines Text-Prompts mit der Vertex AI Veo API eine POST-Anfrage an den Endpunkt des Publisher-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
MODEL_ID: Ein String, der die zu verwendende Modell-ID darstellt. Verwenden Sie den folgenden Wert: veo-2.0-generate-exp.

Wichtig:Veo 3.1-Modelle unterstützen referenceImages.style nicht. Verwenden Sie veo-2.0-generate-exp, wenn Sie Stilbilder verwenden.
TEXT_PROMPT: Der Text-Prompt, der zur Steuerung der Videogenerierung verwendet wird.
BASE64_ENCODED_IMAGE: Ein base64-codiertes Stilbild.
IMAGE_MIME_TYPE: Der MIME-Typ des Eingabebilds. Nur eines der folgenden Elemente:
- image/jpeg
- image/png
OUTPUT_STORAGE_URI: Optional: Der Cloud Storage-Bucket, in dem die Ausgabevideos gespeichert werden sollen. Wenn nicht angegeben, werden Videobyte in der Antwort zurückgegeben. Beispiel: gs://video-bucket/output/.
RESPONSE_COUNT: Die Anzahl der Videodateien, die Sie generieren möchten. Zulässige Ganzzahlwerte: 1–4.
Zusätzliche optionale Parameter

Je nach Anwendungsfall können Sie die folgenden optionalen Variablen verwenden. Fügen Sie dem "parameters": {}-Objekt einige oder alle der folgenden Parameter hinzu.
```
"parameters": {
  "aspectRatio": "ASPECT_RATIO",
  "negativePrompt": "NEGATIVE_PROMPT",
  "personGeneration": "PERSON_SAFETY_SETTING",
  // "resolution": RESOLUTION, // Veo 3 models only
  "sampleCount": RESPONSE_COUNT,
  "seed": SEED_NUMBER
}
```
- ASPECT_RATIO: Optional: Ein Stringwert, der das Seitenverhältnis der generierten Videos beschreibt. Sie können die folgenden Werte verwenden:
  - "16:9" für Landschaft
  - "9:16" für Hochformat
  Der Standardwert ist "16:9".
- NEGATIVE_PROMPT (optional): Ein Stringwert, der Inhalte beschreibt, die das Modell nicht generieren soll.
- PERSON_SAFETY_SETTING: Optional: Ein Stringwert, der die Sicherheitseinstellung für die Generierung von Personen oder Gesichtern steuert. Sie können die folgenden Werte verwenden:
  - "allow_adult": Nur Generierung von Erwachsenen und Gesichtern zulassen.
  - "disallow": Es werden keine Personen oder Gesichter generiert.
  Der Standardwert ist "allow_adult".
- RESOLUTION: Optional: Ein Stringwert, der die Auflösung des generierten Videos steuert. Wird nur von Veo 3-Modellen unterstützt. Sie können die folgenden Werte verwenden:
  - "720p"
  - "1080p"
  Der Standardwert ist "720p".
- RESPONSE_COUNT: Optional. Ein Ganzzahlwert, der die Anzahl der zu generierenden Videos angibt. Der akzeptierte Wertebereich ist 1–4.
- SEED_NUMBER: Optional. Ein uint32-Wert, den das Modell zum Generieren deterministischer Videos verwendet. Wenn Sie eine Quell-Nummer in Ihrer Anfrage angeben, ohne andere Parameter zu ändern, wird das Modell angewiesen, dieselben Videos zu erstellen. Der akzeptierte Wertebereich ist 0–4294967295.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "image": {
            "bytesBase64Encoded": "BASE64_ENCODED_IMAGE",
            "mimeType": "IMAGE_MIME_TYPE"
          },
          "referenceType": "style"
        }
      ]
    }
  ],
  "parameters": {
    "durationSeconds": 8,
    "storageUri": "OUTPUT_STORAGE_URI",
    "sampleCount": RESPONSE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content

{
  "name":
  "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
}

Status des Vorgangs mit langer Ausführungszeit für die Videogenerierung abfragen

Prüfen Sie den Status des Vorgangs mit langer Ausführungszeit für die Videogenerierung.

REST

Bevor Sie die Anfragedaten verwenden, ersetzen Sie folgende Werte:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
MODEL_ID: Die zu verwendende Modell-ID.
OPERATION_ID: Die eindeutige Vorgangs-ID, die in der ursprünglichen Anfrage zum Generieren von Videos zurückgegeben wurde.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation

JSON-Text der Anfrage:

{
  "operationName": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID"
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation" | Select-Object -Expand Content

Diese Anfrage gibt Informationen zum Vorgang zurück, einschließlich der Frage, ob der Vorgang noch ausgeführt wird oder abgeschlossen ist.

Antwort

{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID",
  "done": true,
  "response": {
    "raiMediaFilteredCount": 0,
    "@type": "type.googleapis.com/cloud.ai.large_models.vision.GenerateVideoResponse",
    "videos": [
      {
        "gcsUri":"gs://BUCKET_NAME/TIMESTAMPED_FOLDER/sample_0.mp4",
        "mimeType": "video/mp4"
      }
    ]
  }
}

Antworttext (Anfrage zum Generieren von Videos)

Wenn Sie eine Text-zu-Video- oder Bild-zu-Video-Anfrage senden, wird die folgende Antwort zurückgegeben:

{
  "name": string
}

Antwortelement	Beschreibung
`name`	Der vollständige Vorgangsname des Vorgangs mit langer Ausführungszeit, der nach dem Senden einer Anfrage zur Videogenerierung beginnt.

Beispielantwort (Anfrage zum Generieren von Videos)

{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID"
}

Antworttext (Vorgang mit langer Ausführungszeit abfragen)

Wenn Sie den Status des ursprünglichen Vorgangs mit langer Ausführungszeit für die Videogenerierung abrufen, erhalten Sie eine Antwort wie die folgende:

{
   "name": string,
   "done": boolean,
   "response":{
      "@type":"type.googleapis.com/cloud.ai.large_models.vision.GenerateVideoResponse",
      "raiMediaFilteredCount": integer,
      "videos":[
         {
           "gcsUri": string,
           "mimeType": string
         },
         {
           "gcsUri": string,
           "mimeType": string
         },
         {
           "gcsUri": string,
           "mimeType": string
         },
         {
           "gcsUri": string,
           "mimeType": string
         },
      ]
   }
}

Antwortelement	Beschreibung
`bytesBase64Encoded`	Ein Base64-codierter String, der das Videoobjekt darstellt.
`done`	Ein boolescher Wert, der angibt, ob der Vorgang abgeschlossen ist.
`encoding`	Der Videocodierungstyp.
`gcsUri`	Der Cloud Storage-URI des generierten Videos.
`name`	Der vollständige Vorgangsname des Vorgangs mit langer Ausführungszeit, der beginnt, nachdem eine Anfrage zur Videogenerierung gesendet wurde.
`raiMediaFilteredCount`	Gibt die Anzahl der Videos zurück, die von Veo aufgrund von Richtlinien für verantwortungsbewusste KI gefiltert wurden. Wenn keine Videos gefiltert werden, ist die zurückgegebene Anzahl `0`.
`raiMediaFilteredReasons`	Hier werden die Gründe für alle aufgrund von Richtlinien für verantwortungsbewusste KI herausgefilterten Veo-Videos aufgeführt. Weitere Informationen finden Sie unter Codekategorien für Sicherheitsfilter.
`response`	Der Antworttext des Vorgangs mit langer Ausführungszeit.
`video`	Das generierte Video.

Beispielantwort (Vorgang mit langer Ausführungszeit abfragen)

{
   "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID",
   "done":true,
   "response":{
      "@type":"type.googleapis.com/cloud.ai.large_models.vision.GenerateVideoResponse",
      "raiMediaFilteredCount": 0,
      "videos":[
        {
          "gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_0.mp4",
          "mimeType":"video/mp4"
        },
        {
          "gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_1.mp4",
          "mimeType":"video/mp4"
        },
        {
          "gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_2.mp4",
          "mimeType":"video/mp4"
        },
        {
          "gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_3.mp4",
          "mimeType":"video/mp4"
        }
      ]
   }
}

Weitere Informationen

Weitere Informationen zur Verwendung von Veo in Vertex AI finden Sie unter Videos mit Text- und Bild-Prompts mit Veo generieren.

Nächste Schritte

Informationen von Google DeepMind zum Veo-Modell
Lesen Sie den Blogpost Veo und Imagen 3: Neue Modelle für die Video- und Bildgenerierung in Vertex AI.
Blogpost lesen