Générer des vidéos à partir de la première et de la dernière image

Vous pouvez générer des vidéos Veo sur Vertex AI en spécifiant les première et dernière images de la vidéo. Les interfaces compatibles incluent la console Google Cloud et l'API Vertex AI.

Pour en savoir plus sur l'écriture de requêtes de texte efficaces pour la génération de vidéos, consultez le guide des requêtes Veo.

Avant de commencer

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Enable the Vertex AI API.

    Enable the API

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Enable the Vertex AI API.

    Enable the API

  6. Configurez l'authentification pour votre environnement.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Pour utiliser les exemples d'API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à gcloud CLI.

      After installing the Google Cloud CLI, initialize it by running the following command:

      gcloud init

      If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

    Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .

    Créer une vidéo à partir de la première et de la dernière image

    Les exemples suivants montrent comment spécifier les première et dernière images d'une vidéo Veo :

    Console

    1. Dans la console Google Cloud , accédez à la page Vertex AI>Media Studio.

      Media Studio

    2. Cliquez sur Vidéo. La page Video Media Studio s'affiche.

    3. Dans le volet Paramètres, configurez les paramètres suivants :

      • Modèle : sélectionnez Veo 2 veo-2.0-generate-001.
      • Format : choisissez 16:9 ou 9:16.
      • Nombre de résultats : ajustez le curseur ou saisissez une valeur comprise entre 1 et 4.
      • Durée de la vidéo : sélectionnez une durée comprise entre 5 secondes et 8 secondes.
      • Répertoire de sortie : cliquez sur Parcourir pour créer ou sélectionner un bucket Cloud Storage afin d'y stocker les fichiers générés.
    4. Dans la zone Écrivez votre requête, cliquez sur Importer. Dans la boîte de dialogue qui s'affiche, sélectionnez une image pour la première frame.

      L'option Ajouter une image de fin (facultatif) s'affiche à côté de l'image importée.

    5. Facultatif : Ajoutez un écran de fin en cliquant sur Ajouter un écran de fin. Dans la boîte de dialogue qui s'affiche, sélectionnez une image pour le dernier frame.

    6. Dans la zone Écrivez votre requête, saisissez votre requête textuelle décrivant les vidéos à générer.

    7. Cliquez sur Générer.

    Python

    Installer

    pip install --upgrade google-genai

    Pour en savoir plus, lisez la documentation de référence du SDK.

    Définissez les variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :

    # Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
    # with appropriate values for your project.
    export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
    export GOOGLE_CLOUD_LOCATION=global
    export GOOGLE_GENAI_USE_VERTEXAI=True

    import time
    from google import genai
    from google.genai.types import GenerateVideosConfig, Image
    
    client = genai.Client()
    
    # TODO(developer): Update and un-comment below line
    # output_gcs_uri = "gs://your-bucket/your-prefix"
    
    operation = client.models.generate_videos(
        model="veo-2.0-generate-001",
        prompt="a hand reaches in and places a glass of milk next to the plate of cookies",
        image=Image(
            gcs_uri="gs://cloud-samples-data/generative-ai/image/cookies.png",
            mime_type="image/png",
        ),
        config=GenerateVideosConfig(
            aspect_ratio="16:9",
            last_frame=Image(
                gcs_uri="gs://cloud-samples-data/generative-ai/image/cookies-milk.png",
                mime_type="image/png",
            ),
            output_gcs_uri=output_gcs_uri,
        ),
    )
    
    while not operation.done:
        time.sleep(15)
        operation = client.operations.get(operation)
        print(operation)
    
    if operation.response:
        print(operation.result.generated_videos[0].video.uri)
    
    # Example response:
    # gs://your-bucket/your-prefix

    REST

    Une fois que vous avez configuré votre environnement, vous pouvez utiliser REST pour tester un prompt textuel. L'exemple suivant envoie une requête au point de terminaison du modèle de l'éditeur.

    Pour en savoir plus sur l'API Veo, consultez Veo sur l'API Vertex AI.

    1. Utilisez la commande suivante pour envoyer une requête de génération de vidéo. Cette requête lance une opération de longue durée et stocke le résultat dans un bucket Cloud Storage que vous spécifiez.

      Avant d'utiliser les données de requête, effectuez les remplacements suivants :

      • PROJECT_ID : ID de votre projet Google Cloud .
      • TEXT_PROMPT : requête textuelle utilisée pour guider la génération de vidéos.
      • PATH_TO_FIRST_FRAME_IMAGE : chemin d'accès Cloud Storage à l'image de la première frame.
      • IMAGE_MIME_TYPE : type MIME de l'image d'entrée. Un seul des éléments suivants :
        • image/jpeg
        • image/png
      • PATH_TO_LAST_FRAME_IMAGE : chemin d'accès Cloud Storage à l'image de la dernière frame.
      • OUTPUT_STORAGE_URI : (facultatif) bucket Cloud Storage dans lequel stocker les vidéos de sortie. Si cette valeur n'est pas fournie, les octets vidéo sont renvoyés dans la réponse. Exemple : gs://video-bucket/output/.
      • RESPONSE_COUNT : nombre de fichiers vidéo que vous souhaitez générer. Valeurs entières acceptées : 1 à 4.
      • DURATION : durée des fichiers vidéo que vous souhaitez générer. Valeurs entières acceptées : 5 à 8.
      • Paramètres facultatifs supplémentaires

        Utilisez les variables facultatives suivantes en fonction de votre cas d'utilisation. Ajoutez l'ensemble ou une partie des paramètres suivants dans l'objet "parameters": {}.

        "parameters": {
          "aspectRatio": "ASPECT_RATIO",
          "negativePrompt": "NEGATIVE_PROMPT",
          "personGeneration": "PERSON_SAFETY_SETTING",
          "sampleCount": RESPONSE_COUNT,
          "seed": SEED_NUMBER
        }
        • ASPECT_RATIO : chaîne. Paramètre facultatif. Définit le format des vidéos générées. Valeurs : 16:9 (par défaut, format paysage) ou 9:16 (format portrait).
        • NEGATIVE_PROMPT : chaîne. Paramètre facultatif. Chaîne de texte décrivant ce que vous ne souhaitez pas que le modèle génère.
        • PERSON_SAFETY_SETTING : chaîne. Paramètre facultatif. Paramètre de sécurité qui détermine si la génération de personnes ou de visages est autorisée. Valeurs :
          • allow_adult (valeur par défaut) : autorise uniquement la génération d'adultes.
          • disallow : interdit l'inclusion de personnes ou de visages dans les images.
        • RESPONSE_COUNT : entier. Paramètre facultatif. Nombre d'images de sortie demandées. Valeurs : 1 - 4.
        • SEED_NUMBER : uint32. Paramètre facultatif. Nombre permettant de rendre les vidéos générées déterministes. Si vous spécifiez un numéro source avec votre requête sans modifier d'autres paramètres, vous indiquez au modèle de produire les mêmes vidéos. Valeurs : 0 - 4294967295.

      Méthode HTTP et URL :

      POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001:predictLongRunning

      Corps JSON de la requête :

      {
        "instances": [
          {
            "prompt": "TEXT_PROMPT",
             "image": {
               "gcsUri": "PATH_TO_FIRST_FRAME_IMAGE,
               "mimeType": "IMAGE_MIME_TYPE"
             },
             "lastFrame:" {
               "gcsUri": "PATH_TO_LAST_FRAME_IMAGE,
               "mimeType": "IMAGE_MIME_TYPE"
             }
          }
        ],
        "parameters": {
          "storageUri": "OUTPUT_STORAGE_URI",
          "sampleCount": RESPONSE_COUNT
        }
      }
      

      Pour envoyer votre requête, choisissez l'une des options suivantes :

      curl

      Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

      curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json; charset=utf-8" \
      -d @request.json \
      "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001:predictLongRunning"

      PowerShell

      Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

      $cred = gcloud auth print-access-token
      $headers = @{ "Authorization" = "Bearer $cred" }

      Invoke-WebRequest `
      -Method POST `
      -Headers $headers `
      -ContentType: "application/json; charset=utf-8" `
      -InFile request.json `
      -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001:predictLongRunning" | Select-Object -Expand Content
      Cette requête renvoie un nom d'opération complet avec un ID d'opération unique. Utilisez ce nom d'opération complet pour interroger l'état de la demande de génération de vidéo.
      {
        "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
      }
      

    2. Facultatif : vérifiez l'état de l'opération de longue durée de génération de la vidéo.

      Avant d'utiliser les données de requête, effectuez les remplacements suivants :

      • PROJECT_ID : ID de votre projet Google Cloud .
      • MODEL_ID : ID du modèle à utiliser. Valeurs disponibles :
        • veo-2.0-generate-001 (DG)
        • veo-3.0-generate-preview (Bêta)
      • OPERATION_ID : ID d'opération unique renvoyé dans la requête de génération de vidéo d'origine.

      Méthode HTTP et URL :

      POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation

      Corps JSON de la requête :

      {
        "operationName": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID"
      }
      

      Pour envoyer votre requête, choisissez l'une des options suivantes :

      curl

      Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

      curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json; charset=utf-8" \
      -d @request.json \
      "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation"

      PowerShell

      Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

      $cred = gcloud auth print-access-token
      $headers = @{ "Authorization" = "Bearer $cred" }

      Invoke-WebRequest `
      -Method POST `
      -Headers $headers `
      -ContentType: "application/json; charset=utf-8" `
      -InFile request.json `
      -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation" | Select-Object -Expand Content
      Cette requête renvoie des informations sur l'opération, y compris si elle est toujours en cours d'exécution ou si elle est terminée.

    Étapes suivantes