Guía de instrucciones para la generación de videos con Vertex AI

En esta guía, se brindan ejemplos de los tipos de videos que puedes crear con Veo y se muestra cómo modificar partes específicas de una instrucción para producir resultados diferentes.

Solicita acceso: Funciones avanzadas y lista de espera de Veo

Descripción general de la guía de instrucciones

Vertex AI Veo es un modelo de generación de video a partir de texto y de video a partir de imágenes. Para usar Veo, debes proporcionar una instrucción, que es una descripción de texto de lo que quieres que genere tu modelo de IA generativa.

Filtros de seguridad

Veo aplica filtros de seguridad en Vertex AI para garantizar que los videos generados y las fotos subidas no contengan contenido ofensivo. Por ejemplo, se bloquean las instrucciones que incumplen los lineamientos de IA responsable.

Si sospechas que se está abusando de Veo o de cualquier resultado generado que contenga material inapropiado o información imprecisa, usa el formulario para denunciar sospechas de abuso enGoogle Cloud.

Conceptos básicos para escribir instrucciones

Las buenas instrucciones son descriptivas y claras. Para que el video generado se acerque más a lo que deseas, primero identifica tu idea principal y, luego, defínela mejor agregando palabras clave y modificadores.

Los siguientes elementos deben incluirse en la instrucción:

  1. Sujeto: El objeto, la persona, el animal o el paisaje que quieres que aparezca en tu video.
  2. Contexto: Es el fondo o el contexto en el que se coloca el sujeto.
  3. Acción: Lo que hace el sujeto (por ejemplo, caminar, correr o girar la cabeza).
  4. Estilo: Puede ser general o muy específico. Considera usar palabras clave específicas del estilo de la película, como película de terror, cine negro o estilos animados como la renderización de estilo dibujos animados.
  5. Movimiento de la cámara: Opcional: Lo que hace la cámara, como vista aérea, a la altura de los ojos, toma desde arriba o toma desde un ángulo bajo.
  6. Composición: Opcional: Cómo se encuadra la toma, por ejemplo, toma general, primer plano o primer plano extremo.
  7. Ambiente: Opcional: Cómo el color y la luz contribuyen a la escena, como tonos azules, noche o tonos cálidos.

Ejemplos de instrucciones y resultados generados

En esta sección, se presentan varias instrucciones y cómo el nivel de detalle proporcionado en cada una te permite acercarte a lo que quieres en tu video.

Hielos

En este video, se muestra cómo puedes usar cada uno de los elementos de tu instrucción.

Instrucción Resultados generados
Primer plano (composición) de carámbanos que se derriten (sujeto) en una pared de roca congelada (contexto) con tonos azules fríos (ambiente), con zoom (movimiento de la cámara) que mantiene el detalle en primer plano de las gotas de agua (acción). Estalactitas que gotean con un fondo azul.

Hombre hablando por teléfono

En estos videos, se muestra cómo puedes revisar tu instrucción con detalles más específicos sobre el video que quieres que genere Veo.

Instrucción Resultados generados Análisis
La cámara se desplaza para mostrar un primer plano de un hombre desesperado con un abrigo verde que está haciendo una llamada en un teléfono de pared de disco con una luz verde de neón y una escena de película. Un hombre hablando por teléfono. Este es el primer video generado a partir de la instrucción.
Una toma cinematográfica en primer plano sigue a un hombre desesperado con un abrigo verde desgastado mientras marca un número en un teléfono de disco montado en una pared de ladrillos arenosa, bañada por el resplandor inquietante de un letrero de neón verde. La cámara se acerca y revela la tensión en su mandíbula y la desesperación grabada en su rostro mientras lucha por hacer la llamada. La profundidad de campo superficial se enfoca en su frente arrugada y el teléfono rotatorio negro, y desenfoca el fondo en un mar de colores neón y sombras indistintas, lo que crea una sensación de urgencia y aislamiento. Un hombre hablando por teléfono Una instrucción más detallada da como resultado un video más enfocado con un entorno más enriquecido.
Un video con movimiento fluido que se acerca a un hombre desesperado con un abrigo verde, usando un teléfono de disco antiguo contra una pared bañada en un inquietante resplandor verde neón. La cámara comienza a una distancia media y se acerca lentamente al rostro del hombre, lo que revela su expresión frenética y el sudor en su frente mientras marca el teléfono con urgencia. El enfoque está en las manos del hombre, sus dedos torpes con el dial mientras intenta desesperadamente conectarse. La luz de neón verde proyecta largas sombras en la pared, lo que aumenta la atmósfera tensa. La escena está enmarcada para enfatizar el aislamiento y la desesperación del hombre, y destaca el marcado contraste entre el brillo vibrante del neón y la sombría determinación del hombre. Un hombre hablando por teléfono. Agregar más detalles le dio al sujeto una expresión realista y creó una escena intensa y vibrante.

Leopardo de las nieves

Esta instrucción muestra el resultado que podría generar Veo.

Instrucción Resultados generados
Una criatura adorable con pelaje similar al de un leopardo de nieve camina por un bosque invernal, renderizado en estilo de dibujos animados en 3D. El leopardo de las nieves está letárgico.

Leopardo de las nieves corriendo

Esta instrucción incluye más detalles y muestra un resultado generado que podría acercarse más a lo que quieres en tu video.

Instrucción Resultados generados
Crea una escena animada en 3D breve con un estilo de dibujos animados alegre. Una criatura tierna con pelaje similar al de un leopardo de las nieves, ojos grandes y expresivos, y una forma redondeada y amigable se pavonea felizmente por un bosque invernal caprichoso. La escena debe incluir árboles redondeados cubiertos de nieve, copos de nieve que caen suavemente y luz solar cálida que se filtra entre las ramas. Los movimientos elásticos y la sonrisa amplia de la criatura deben transmitir pura alegría. Intenta usar un tono alegre y conmovedor con colores brillantes y alegres, y animaciones divertidas. Considera agregar efectos de sonido sutiles y caprichosos para mejorar el ambiente invernal alegre. El leopardo de las nieves corre más rápido.

Más sugerencias para escribir instrucciones

Las siguientes sugerencias te ayudarán a escribir instrucciones que generen tus videos:

  • Usa lenguaje descriptivo: Usa adjetivos y adverbios para que Veo tenga una idea clara.
  • Proporciona contexto: Si es necesario, incluye información general para ayudar al modelo a comprender lo que quieres.
  • Haz referencia a estilos artísticos específicos: Si tienes una estética particular en mente, haz referencia a estilos artísticos o movimientos artísticos específicos.
  • Utiliza herramientas de ingeniería de instrucciones: Considera explorar herramientas o recursos de ingeniería de instrucciones para ayudarte a definir mejor tus instrucciones y lograr resultados óptimos. Para obtener más información, consulta Introducción a la generación de instrucciones.
  • Mejora los detalles faciales en tus imágenes personales y grupales: Especifica los detalles faciales como el enfoque de la foto, por ejemplo, usando la palabra retrato en la instrucción.

Agrega más detalles a las instrucciones

En estos ejemplos, se muestra cómo definir mejor tus instrucciones para generar videos.

Descripción del asunto

En este ejemplo, se muestra cómo especificar una descripción del tema.

Descripción del asunto Instrucción Resultados generados
Esta descripción puede incluir un sujeto, varios sujetos y acciones, como "edificio de departamentos de hormigón blanco". Render arquitectónico de un edificio de departamentos de hormigón blanco con formas orgánicas fluidas, que se fusiona a la perfección con la vegetación exuberante y los elementos futuristas Marcador de posición.

Contexto

En este ejemplo, se muestra cómo especificar el contexto.

Contexto Instrucción Resultados generados
El fondo o el contexto en el que se colocará el asunto es muy importante. Intenta ubicar al sujeto en diferentes fondos, como en una calle concurrida o en el espacio exterior. Un satélite flotando en el espacio exterior con la Luna y algunas estrellas de fondo. Satélite flotando en la atmósfera.

Acción

En este ejemplo, se muestra cómo especificar la acción.

Acción Instrucción Resultados generados
Qué está haciendo el sujeto, como caminar, correr o girar la cabeza Toma panorámica de una mujer caminando por la playa, con una expresión de satisfacción y relajación, y mirando el horizonte al atardecer. El atardecer es absolutamente hermoso.

Estilo

En este ejemplo, se muestra cómo especificar el estilo.

Estilo Instrucción Resultados generados
Puedes agregar palabras clave para mejorar la calidad de la generación y orientarla hacia el estilo deseado, como profundidad de campo superficial, fotograma de película, minimalista, surrealista, vintage, futurista o doble exposición. Estilo de cine negro, hombre y mujer caminando por la calle, misterio, cinematográfico, blanco y negro. El estilo de cine negro es absolutamente hermoso.

Movimiento de la cámara

En este ejemplo, se muestra cómo especificar el movimiento de la cámara.

Movimiento de la cámara Instrucción Resultados generados
Toma en primera persona, vista aérea, vista de seguimiento con dron, toma de seguimiento Toma en primera persona desde un automóvil antiguo que conduce bajo la lluvia, Canadá de noche, cinematográfica. El atardecer es absolutamente hermoso.

Composición

En este ejemplo, se muestra cómo especificar la composición.

Composición Instrucción Resultados generados
Cómo se encuadra la toma (toma general, primer plano, ángulo bajo) Primer plano extremo de un ojo con la ciudad reflejada en él. El atardecer es absolutamente hermoso.
Cómo se encuadra la toma (toma general, primer plano, ángulo bajo) Crea un video de un plano general de un surfista caminando por una playa con una tabla de surf, un hermoso atardecer y un estilo cinematográfico. El atardecer es absolutamente hermoso.

Atmósfera

En este ejemplo, se muestra cómo especificar el ambiente.

Ambiente Instrucción Resultados generados
Agregar colores ayudó a que la imagen se viera única y transmitiera las emociones deseadas: "tonos cálidos naranja apagados", "luz natural", "amanecer o atardecer". Las paletas de colores desempeñan un papel fundamental en la fotografía, ya que influyen en el estado de ánimo y el impacto emocional de una imagen, y hacen que el estilo de la imagen sea coherente. Por ejemplo, una paleta cálida y dorada puede darle a una fotografía un toque romántico y atmosférico. Ejemplo de paletas de colores: "tonos pastel azules y rosas", "iluminación ambiental tenue", "tonos fríos y apagados" Primer plano de una niña sosteniendo un adorable cachorro de golden retriever en el parque, con luz solar. Un cachorro en los brazos de una niña.
Agregar colores ayudó a que la imagen se viera única y transmitiera las emociones deseadas: "tonos cálidos naranja apagados", "luz natural", "amanecer o atardecer". Las paletas de colores desempeñan un papel fundamental en la fotografía, ya que influyen en el estado de ánimo y el impacto emocional de una imagen, y hacen que el estilo de la imagen sea coherente. Por ejemplo, una paleta cálida y dorada puede darle a una fotografía un toque romántico y atmosférico. Ejemplo de paletas de colores: "tonos pastel azules y rosas", "iluminación ambiental tenue", "tonos fríos y apagados" Primer plano cinematográfico de una mujer triste que viaja en autobús bajo la lluvia, con tonos azules fríos y un ambiente melancólico. Una mujer que viaja en un autobús y se siente triste.

Audio

veo-3.0-generate-preview admite audio en Preview.

Especifica claramente si quieres audio. Te recomendamos que uses oraciones separadas en tu instrucción para describir el audio. A continuación, se muestran ejemplos de audio descrito como parte de una instrucción:

  • Efectos de sonido:

    • En el audio, se escucha el sonido del agua salpicando de fondo.
    • Agrega música suave de fondo.
  • Voz:

    • El hombre del sombrero rojo dice: "¿Dónde está el conejo?". Luego, la mujer del vestido verde que está a su lado responde: "Allí, en el bosque".

Usa imágenes de referencia para generar videos

Puedes dar vida a las imágenes con la función de imagen a video que tiene Veo y usar tus recursos existentes o Imagen para generar algo nuevo.

Instrucción Resultados generados
Conejo con una barra de chocolate. El conejo se escapa.
El conejo huye. El conejo se escapa.

Cuando uses la función de imagen a video, te recomendamos que hagas lo siguiente:

  • Asegúrate de que las acciones y las descripciones de voz se alineen con cada sujeto presente en la imagen de entrada.

  • Cuando haya varios sujetos en la imagen de entrada, especifica claramente qué personaje está realizando una acción o hablando. Para diferenciar entre varios caracteres en una imagen de entrada, usa los detalles descriptivos más distintivos disponibles. Por ejemplo:

    • El hombre del sombrero rojo.
    • La mujer del vestido azul.

Mensajes negativos

Los mensajes negativos pueden ser una herramienta potente que ayuda a especificar qué elementos no deben aparecer en el video. Describe lo que quieres que el modelo evite generar describiendo lo que quieres que genere. Sigue estas sugerencias:

  • ❌ No uses lenguaje instructivo ni palabras como no o no. Por ejemplo, "No paredes" o "No mostrar paredes".

  • ✅ Describe lo que no quieres ver. Por ejemplo, "pared, marco", lo que significa que no quieres una pared ni un marco en el video.

Instrucción Resultados generados
Genera una animación corta y estilizada de un roble grande y solitario con hojas que se agitan vigorosamente con un fuerte viento. El árbol debe tener una forma ligeramente exagerada y caprichosa, con ramas dinámicas y fluidas. Las hojas deben mostrar una variedad de colores otoñales, girando y bailando con el viento. La animación debe incluir una banda sonora suave y atmosférica, y usar una paleta de colores cálidos y atractivos. Árbol con palabras de uso.
Genera una animación corta y estilizada de un roble grande y solitario con hojas que se agitan vigorosamente con un fuerte viento. El árbol debe tener una forma ligeramente exagerada y caprichosa, con ramas dinámicas y fluidas. Las hojas deben mostrar una variedad de colores otoñales, girando y bailando con el viento. La animación debe incluir una banda sonora suave y atmosférica, y usar una paleta de colores cálida y atractiva.

Con instrucciones negativas: Fondo urbano, estructuras artificiales, atmósfera oscura, tormentosa o amenazante.
Árbol sin palabras negativas.

Relaciones de aspecto

La generación de videos de Vertex AI Veo admite las siguientes dos relaciones de aspecto:

Relación de aspecto Descripción
Pantalla ancha o 16:9 La relación de aspecto de 16:9 es la más común para televisores, monitores y pantallas de teléfonos celulares (horizontal). Usa esta opción cuando quieras capturar más del fondo, como paisajes panorámicos.
Vertical o 9:16

Pantalla panorámica rotada. Esta relación de aspecto se popularizó en las aplicaciones de video de formato corto, como YouTube Shorts. Usa esta relación de aspecto para retratos o objetos altos con orientaciones verticales sólidas, como edificios, árboles, cascadas o edificios.

Pantalla ancha: Relación de aspecto de 16:9

Este es un ejemplo de instrucción de pantalla ancha con una relación de aspecto de 16:9.

Instrucción Resultados generados
Crea un video con una vista de dron de seguimiento de un hombre que conduce un automóvil convertible rojo en Palm Springs, en la década de 1970, con luz solar cálida y sombras largas. La cascada es absolutamente hermosa.

Vertical: Relación de aspecto de 9:16

Este es un ejemplo de instrucción para un retrato con una relación de aspecto de 9:16.

Instrucción Resultados generados
Crea un video con el movimiento fluido de una majestuosa cascada hawaiana en una exuberante selva tropical. Enfócate en el flujo de agua realista, el follaje detallado y la iluminación natural para transmitir tranquilidad. Captura el agua que fluye, la atmósfera brumosa y la luz del sol que se filtra a través del denso dosel. Usa movimientos de cámara cinematográficos y fluidos para mostrar la cascada y sus alrededores. Busca un tono tranquilo y realista que transporte al usuario a la serena belleza de la selva tropical hawaiana. La cascada es absolutamente hermosa.