Se usó la API de Cloud Translation para traducir esta página.

Genera videos con Veo en Vertex AI a partir de una imagen

Puedes usar Veo en Vertex AI para generar videos nuevos a partir de una imagen y una instrucción de texto. Las interfaces compatibles incluyen la consola de Google Cloud y la API de Vertex AI.

Si deseas obtener más información para escribir instrucciones de texto eficaces para la generación de videos, consulta la guía de instrucciones de Veo.

Probar Veo en Colab

Antes de comenzar

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Configura la autenticación para tu entorno.

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

REST

Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a gcloud CLI.

Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI ejecutando el siguiente comando:

gcloud init

Si usas un proveedor de identidad externo (IdP), primero debes acceder a gcloud CLI con tu identidad federada.

Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .

Genera videos a partir de una imagen

Muestra de entrada	Ejemplo de resultado
Imagen de entrada¹ Instrucción de texto: El elefante se mueve de forma natural

¹ Imagen generada con Imagen en Vertex AI a partir de la siguiente instrucción: Un elefante de croché con patrones intrincados caminando por la sabana

Puedes generar videos nuevos solo con una imagen como entrada, o bien con una imagen y texto descriptivo como entradas. En los siguientes ejemplos, se muestran instrucciones básicas para generar videos a partir de imágenes y texto.

Console

En la Google Cloud consola, ve a la página Vertex AI Studio > Media Studio.

Media Studio
Haz clic en Video.
Opcional: En el panel Configuración, establece los siguientes parámetros de configuración:
- Modelo: Elige un modelo entre las opciones disponibles.
- Relación de aspecto: Elige 16:9 o 9:16.
- Cantidad de resultados: Ajusta el control deslizante o ingresa un valor entre 1 y 4.
- Duración del video: Selecciona la duración deseada del video en el menú.
- Directorio de salida: Haz clic en Explorar para crear o seleccionar un bucket de Cloud Storage en el que se almacenarán los archivos de salida.
Opcional: En la sección Seguridad, selecciona uno de los siguientes parámetros de configuración de Generación de personas:
- Permitir (solo para adultos): Es el valor predeterminado. Generar solo personas o rostros adultos No se deben generar imágenes de personas o rostros de jóvenes o niños.
- No permitir: No genera personas ni rostros.
Opcional: En la sección Opciones avanzadas, ingresa un valor de Semilla para aleatorizar la generación de video.
En el cuadro Escribe tu instrucción, haz clic en Subir.
Elige una imagen local para subir y haz clic en Seleccionar.
En el cuadro Escribe tu instrucción, ingresa la instrucción de texto que describe los videos que se generarán.
Haz clic en Generar .

Python

Instalar

pip install --upgrade google-genai

Para obtener más información, consulta la documentación de referencia del SDK.

Establece variables de entorno para usar el SDK de IA generativa con Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

import time
from google import genai
from google.genai.types import GenerateVideosConfig, Image

client = genai.Client()

# TODO(developer): Update and un-comment below line
# output_gcs_uri = "gs://your-bucket/your-prefix"

operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt="Extreme close-up of a cluster of vibrant wildflowers swaying gently in a sun-drenched meadow.",
    image=Image(
        gcs_uri="gs://cloud-samples-data/generative-ai/image/flowers.png",
        mime_type="image/png",
    ),
    config=GenerateVideosConfig(
        aspect_ratio="16:9",
        output_gcs_uri=output_gcs_uri,
    ),
)

while not operation.done:
    time.sleep(15)
    operation = client.operations.get(operation)
    print(operation)

if operation.response:
    print(operation.result.generated_videos[0].video.uri)

# Example response:
# gs://your-bucket/your-prefix

REST

Después de configurar tu entorno, puedes usar REST para probar una instrucción de texto. En el siguiente ejemplo, se envía una solicitud al extremo del modelo de publicador.

Para obtener más información sobre la API de Veo, consulta la API de Veo en Vertex AI.

Usa el siguiente comando para enviar una solicitud de generación de video. Esta solicitud inicia una operación de larga duración y almacena el resultado en un bucket de Cloud Storage que especifiques.

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:
- PROJECT_ID: Es una cadena que representa el ID de tu proyecto de Google Cloud .
- MODEL_ID: Es una cadena que representa el ID del modelo que se usará. Se aceptan los siguientes valores:
  - Veo 2:veo-2.0-generate-001
  - Veo 3:veo-3.0-generate-001
  - Veo 3.1:veo-3.1-generate-preview
  - Veo 3.1:veo-3.1-fast-generate-preview
- TEXT_PROMPT: Es la instrucción de texto que se usa para guiar la generación de video.
- INPUT_IMAGE: Es una cadena codificada en Base64 que representa la imagen de entrada. Para obtener la mejor calidad, recomendamos que la resolución de la imagen de entrada sea de 720 p (1,280 x 720 píxeles) o superior, y que tenga una relación de aspecto de 16:9 o 9:16. Es posible que se cambie el tamaño o se recorte de forma central las imágenes con otras relaciones de aspecto o tamaños cuando se suban.
- MIME_TYPE: Es una cadena que representa el tipo de MIME de la imagen de entrada. Solo se admiten las imágenes de los siguientes tipos MIME:
  - "image/jpeg"
  - "image/png"
- OUTPUT_STORAGE_URI: Opcional: Es una cadena que representa el bucket de Cloud Storage en el que se almacenarán los videos de salida. Si no se proporciona, los bytes del video se devuelven en la respuesta. Por ejemplo: "gs://video-bucket/output/"
- RESIZE_MODE: Cadena que representa el modo de cambio de tamaño que se usará. Se aceptan los siguientes valores:
  - "crop": Recorta el video para que se ajuste al nuevo tamaño.
  - "pad": Agrega relleno al video para que se ajuste al nuevo tamaño.
- RESPONSE_COUNT: Es la cantidad de archivos de video que se generarán. El rango de valores aceptado es de 1 a 4.
- DURATION: Es un número entero que representa la duración de los archivos de video generados. A continuación, se indican los valores aceptados para cada modelo:
  - Modelos de Veo 2: 5-8. El valor predeterminado es 8.
  - Modelos de Veo: 4, 6 o 8. El valor predeterminado es 8.
- Parámetros opcionales adicionales
  
  Usa las siguientes variables opcionales según tu caso de uso. Agrega algunos o todos los siguientes parámetros en el objeto "parameters": {}.
```
"parameters": {
  "aspectRatio": "ASPECT_RATIO",
  "negativePrompt": "NEGATIVE_PROMPT",
  "personGeneration": "PERSON_SAFETY_SETTING",
  // "resolution": RESOLUTION, // Veo 3 models only
  "sampleCount": RESPONSE_COUNT,
  "seed": SEED_NUMBER
}
```
  - ASPECT_RATIO: Opcional: Es un valor de cadena que describe la relación de aspecto de los videos generados. Puedes usar los siguientes valores:
    - "16:9" para horizontal
    - "9:16" para vertical
    El valor predeterminado es "16:9".
  - NEGATIVE_PROMPT: Opcional: Es un valor de cadena que describe el contenido que deseas evitar que genere el modelo.
  - PERSON_SAFETY_SETTING: Opcional: Es un valor de cadena que controla el parámetro de configuración de seguridad para generar personas o rostros. Puedes usar los siguientes valores:
    - "allow_adult": Solo permite la generación de personas y rostros adultos.
    - "disallow": No genera personas ni rostros.
    El valor predeterminado es "allow_adult".
  - RESOLUTION: Opcional: Es un valor de cadena que controla la resolución del video generado. Solo es compatible con los modelos de Veo 3. Puedes usar los siguientes valores:
    - "720p"
    - "1080p"
    El valor predeterminado es "720p".
  - RESPONSE_COUNT: Opcional. Es un valor entero que describe la cantidad de videos que se generarán. El rango de valores aceptado es de 1 a 4.
  - SEED_NUMBER: Opcional. Es un valor uint32 que el modelo usa para generar videos determinísticos. Especificar un número de origen con tu solicitud sin cambiar otros parámetros guía al modelo para que produzca los mismos videos. El rango de valores aceptado es de 0 a 4294967295.
Método HTTP y URL:
```
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning
```
Cuerpo JSON de la solicitud:
```
{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "image": {
        "bytesBase64Encoded": "INPUT_IMAGE",
        "mimeType": "MIME_TYPE"
      }
    }
  ],
  "parameters": {
    "storageUri": "OUTPUT_STORAGE_URI",
    "sampleCount": RESPONSE_COUNT
    "resizeMode": "RESIZE_MODE"
  }
}
```
Para enviar tu solicitud, elige una de estas opciones:
curl

Nota: Con el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login, o a través del uso de Cloud Shell, que accede de forma automática a la CLI de gcloud. Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"
PowerShell

Nota: En el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login . Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content
Esta solicitud devuelve un nombre de operación completo con un ID de operación único. Usa este nombre de operación completo para sondear el estado de la solicitud de generación de video.
```
{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
}
```

Opcional: Verifica el estado de la operación de larga duración de generación de video.

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

PROJECT_ID: El Google Cloud ID del proyecto.
MODEL_ID: ID del modelo que se usará.
OPERATION_ID: Es el ID de operación único que se devolvió en la solicitud original de generación de video.

Método HTTP y URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation

Cuerpo JSON de la solicitud:

{
  "operationName": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID"
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Nota: Con el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login, o a través del uso de Cloud Shell, que accede de forma automática a la CLI de gcloud. Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation"

PowerShell

Nota: En el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login . Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation" | Select-Object -Expand Content

Esta solicitud devuelve información sobre la operación, incluido si la operación aún se está ejecutando o si ya finalizó.

Respuesta

{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID",
  "done": true,
  "response": {
    "raiMediaFilteredCount": 0,
    "@type": "type.googleapis.com/cloud.ai.large_models.vision.GenerateVideoResponse",
    "videos": [
      {
        "gcsUri":"gs://BUCKET_NAME/TIMESTAMPED_FOLDER/sample_0.mp4",
        "mimeType": "video/mp4"
      }
    ]
  }
}

Genera videos con Veo en Vertex AI a partir de una imagen

Antes de comenzar

Console

REST

Genera videos a partir de una imagen

Console

Python

Instalar

REST

curl

PowerShell

curl

PowerShell

Respuesta

¿Qué sigue?