Desactivar Veo en la herramienta de reformulación de peticiones de Vertex AI

Veo ofrece una herramienta de mejora de las peticiones basada en LLMs, también conocida como herramienta de reescritura de peticiones. La herramienta de reformulación de peticiones ofrece la opción de reformular tus peticiones para añadir descripciones de vídeo, movimientos de cámara, transcripciones y efectos de sonido. Cuanto más detalladas sean las peticiones, mayor será la calidad de los vídeos.

Si inhabilitas la mejora de las peticiones, puede que la calidad de los vídeos y la similitud del resultado con la petición que has proporcionado se vean afectadas. Esta función está habilitada de forma predeterminada en veo-2.0-generate-001.

La API solo devuelve una petición reescrita si la petición original tiene menos de 30 palabras.

Para obtener más información sobre cómo escribir peticiones de texto eficaces para generar vídeos, consulta la guía de peticiones de Veo.

Antes de empezar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  6. Configura la autenticación de tu entorno.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.

      Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:

      gcloud init

      Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.

    Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre autenticación de Google Cloud .

    Desactivar la función de reformulación de peticiones

    Para desactivar la mejora de peticiones, sigue estos pasos:

    Consola

    1. En la Google Cloud consola, ve a la página Vertex AI Studio > Media Studio.

      Ir a Media Studio

    2. Haz clic en Veo.

    3. En Configuración, haz clic en el interruptor Habilitar mejora de peticiones.

    4. En el cuadro Escribe tu petición, introduce la petición y haz clic en Generar.

    Python

    Instalar

    pip install --upgrade google-genai

    Para obtener más información, consulta la documentación de referencia del SDK.

    Define variables de entorno para usar el SDK de IA generativa con Vertex AI:

    # Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
    # with appropriate values for your project.
    export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
    export GOOGLE_CLOUD_LOCATION=global
    export GOOGLE_GENAI_USE_VERTEXAI=True

    import time
    from google import genai
    from google.genai.types import GenerateVideosConfig
    
    client = genai.Client()
    
    # TODO(developer): Update and un-comment below line
    # output_gcs_uri = "gs://your-bucket/your-prefix"
    
    operation = client.models.generate_videos(
        model="veo-2.0-generate-001",
        prompt="a cat reading a book",
        config=GenerateVideosConfig(
            aspect_ratio="16:9",
            output_gcs_uri=output_gcs_uri,
            number_of_videos=1,
            duration_seconds=5,
            person_generation="dont_allow",
            enhance_prompt=False,
        ),
    )
    
    while not operation.done:
        time.sleep(15)
        operation = client.operations.get(operation)
        print(operation)
    
    if operation.response:
        print(operation.result.generated_videos[0].video.uri)
    
    # Example response:
    # gs://your-bucket/your-prefix

    REST

    Después de configurar tu entorno, puedes usar REST para probar una petición de texto. En el siguiente ejemplo se envía una solicitud al endpoint del modelo del editor.

    Para obtener más información sobre la API de Veo, consulta la API de Veo en Vertex AI.

    1. Usa el siguiente comando para enviar una solicitud de generación de vídeo. Esta solicitud inicia una operación de larga duración y almacena la salida en un segmento de Cloud Storage que especifiques.

    Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

    • PROJECT_ID: tu Google Cloud ID de proyecto.
    • MODEL_ID: ID del modelo que se va a usar. Valores disponibles:
      • veo-2.0-generate-001
    • TEXT_PROMPT: la petición de texto que se ha usado para guiar la generación del vídeo.
    • OUTPUT_STORAGE_URI: opcional. Segmento de Cloud Storage en el que se almacenarán los vídeos de salida. Si no se proporciona, los bytes de vídeo se devuelven en la respuesta. Por ejemplo: gs://video-bucket/output/.
    • RESPONSE_COUNT: el número de archivos de vídeo que quieres generar. Valores enteros aceptados: del 1 al 4.
    • DURATION: la duración de los archivos de vídeo que quieras generar. Los valores enteros aceptados son del 5 al 8.
    • ENHANCED_PROMPT: si se deben usar peticiones mejoradas o no. Puedes usar una de las siguientes opciones:
      • True: (opción predeterminada) usa Gemini para mejorar tus peticiones.
      • False: no uses Gemini para mejorar tus peticiones.
    • Parámetros opcionales adicionales

      Usa las siguientes variables opcionales según tu caso práctico. Añada algunos o todos los parámetros siguientes en el objeto "parameters": {}.

      "parameters": {
        "aspectRatio": "ASPECT_RATIO",
        "negativePrompt": "NEGATIVE_PROMPT",
        "personGeneration": "PERSON_SAFETY_SETTING",
        // "resolution": RESOLUTION, // Veo 3 models only
        "sampleCount": RESPONSE_COUNT,
        "seed": SEED_NUMBER
      }
      • ASPECT_RATIO: Opcional: valor de cadena que describe la relación de aspecto de los vídeos generados. Puedes usar los siguientes valores:
        • "16:9" para horizontal
        • "9:16" para vertical

        El valor predeterminado es "16:9".

      • NEGATIVE_PROMPT: opcional. Cadena que describe el contenido que quieres evitar que genere el modelo.
      • PERSON_SAFETY_SETTING: Opcional: valor de cadena que controla el ajuste de seguridad para generar personas o caras. Puedes usar los siguientes valores:
        • "allow_adult": solo permite generar imágenes de personas adultas y caras de personas adultas.
        • "disallow": no genera personas ni caras.

        El valor predeterminado es "allow_adult".

      • RESOLUTION: Opcional: valor de cadena que controla la resolución del vídeo generado. Solo es compatible con los modelos de Veo 3. Puedes usar los siguientes valores:
        • "720p"
        • "1080p"

        El valor predeterminado es "720p".

      • RESPONSE_COUNT: Opcional. Un valor entero que describe el número de vídeos que se van a generar. El intervalo de valores aceptado es 1-4.
      • SEED_NUMBER: Opcional. Un valor uint32 que usa el modelo para generar vídeos deterministas. Si especificas un número de semilla en tu solicitud sin cambiar otros parámetros, el modelo generará los mismos vídeos. El intervalo de valores aceptado es 0-4294967295.

    Método HTTP y URL:

    POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning

    Cuerpo JSON de la solicitud:

    {
      "instances": [
        {
          "prompt": "TEXT_PROMPT"
        }
      ],
      "parameters": {
        "storageUri": "OUTPUT_STORAGE_URI",
        "sampleCount": "RESPONSE_COUNT",
        "durationSeconds": "DURATION",
        "enhancePrompt": ENHANCED_PROMPT
      }
    }
    

    Para enviar tu solicitud, elige una de estas opciones:

    curl

    Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"

    PowerShell

    Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content
    Esta solicitud devuelve un nombre de operación completo con un ID de operación único. Usa este nombre de operación completo para consultar el estado de la solicitud de generación de vídeo.
    {
      "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
    }
    

    Siguientes pasos