En esta guía, se brindan ejemplos de los tipos de videos que puedes crear con Veo y se muestra cómo modificar partes específicas de una instrucción para producir resultados diferentes.
Solicita acceso: Funciones avanzadas y lista de espera de Veo
Descripción general de la guía de instrucciones
Vertex AI Veo es un modelo de generación de video a partir de texto y de video a partir de imágenes. Para usar Veo, debes proporcionar una instrucción, que es una descripción de texto de lo que quieres que genere tu modelo de IA generativa.
Filtros de seguridad
Veo aplica filtros de seguridad en Vertex AI para garantizar que los videos generados y las fotos subidas no contengan contenido ofensivo. Por ejemplo, se bloquean las instrucciones que incumplen los lineamientos de IA responsable.
Si sospechas que se está abusando de Veo o de cualquier resultado generado que contenga material inapropiado o información imprecisa, usa el formulario para denunciar sospechas de abuso enGoogle Cloud.
Conceptos básicos para escribir instrucciones
Las buenas instrucciones son descriptivas y claras. Para que el video generado se acerque más a lo que deseas, primero identifica tu idea principal y, luego, defínela mejor agregando palabras clave y modificadores.
Los siguientes elementos deben incluirse en la instrucción:
- Sujeto: El objeto, la persona, el animal o el paisaje que quieres que aparezca en tu video.
- Contexto: Es el fondo o el contexto en el que se coloca el sujeto.
- Acción: Lo que hace el sujeto (por ejemplo, caminar, correr o girar la cabeza).
- Estilo: Puede ser general o muy específico. Considera usar palabras clave específicas del estilo de la película, como película de terror, cine negro o estilos animados como la renderización de estilo dibujos animados.
- Movimiento de la cámara: Opcional: Lo que hace la cámara, como vista aérea, a la altura de los ojos, toma desde arriba o toma desde un ángulo bajo.
- Composición: Opcional: Cómo se encuadra la toma, por ejemplo, toma general, primer plano o primer plano extremo.
- Ambiente: Opcional: Cómo el color y la luz contribuyen a la escena, como tonos azules, noche o tonos cálidos.
Ejemplos de instrucciones y resultados generados
En esta sección, se presentan varias instrucciones y cómo el nivel de detalle proporcionado en cada una te permite acercarte a lo que quieres en tu video.
Hielos
En este video, se muestra cómo puedes usar cada uno de los elementos de tu instrucción.
Instrucción | Resultados generados |
---|---|
Primer plano (composición) de carámbanos que se derriten (sujeto) en una pared de roca congelada (contexto) con tonos azules fríos (ambiente), con zoom (movimiento de la cámara) que mantiene el detalle en primer plano de las gotas de agua (acción). |
![]() |
Hombre hablando por teléfono
En estos videos, se muestra cómo puedes revisar tu instrucción con detalles más específicos sobre el video que quieres que genere Veo.
Instrucción | Resultados generados | Análisis |
---|---|---|
La cámara se desplaza para mostrar un primer plano de un hombre desesperado con un abrigo verde que está haciendo una llamada en un teléfono de pared de disco con una luz verde de neón y una escena de película. |
![]() |
Este es el primer video generado a partir de la instrucción. |
Una toma cinematográfica en primer plano sigue a un hombre desesperado con un abrigo verde desgastado mientras marca un número en un teléfono de disco montado en una pared de ladrillos arenosa, bañada por el resplandor inquietante de un letrero de neón verde. La cámara se acerca y revela la tensión en su mandíbula y la desesperación grabada en su rostro mientras lucha por hacer la llamada. La profundidad de campo superficial se enfoca en su frente arrugada y el teléfono rotatorio negro, y desenfoca el fondo en un mar de colores neón y sombras indistintas, lo que crea una sensación de urgencia y aislamiento. |
![]() |
Una instrucción más detallada da como resultado un video más enfocado con un entorno más enriquecido. |
Un video con movimiento fluido que se acerca a un hombre desesperado con un abrigo verde, usando un teléfono de disco antiguo contra una pared bañada en un inquietante resplandor verde neón. La cámara comienza a una distancia media y se acerca lentamente al rostro del hombre, lo que revela su expresión frenética y el sudor en su frente mientras marca el teléfono con urgencia. El enfoque está en las manos del hombre, sus dedos torpes con el dial mientras intenta desesperadamente conectarse. La luz de neón verde proyecta largas sombras en la pared, lo que aumenta la atmósfera tensa. La escena está enmarcada para enfatizar el aislamiento y la desesperación del hombre, y destaca el marcado contraste entre el brillo vibrante del neón y la sombría determinación del hombre. |
![]() |
Agregar más detalles le dio al sujeto una expresión realista y creó una escena intensa y vibrante. |
Leopardo de las nieves
Esta instrucción muestra el resultado que podría generar Veo.
Instrucción | Resultados generados |
---|---|
Una criatura adorable con pelaje similar al de un leopardo de nieve camina por un bosque invernal, renderizado en estilo de dibujos animados en 3D. |
![]() |
Leopardo de las nieves corriendo
Esta instrucción incluye más detalles y muestra un resultado generado que podría acercarse más a lo que quieres en tu video.
Instrucción | Resultados generados |
---|---|
Crea una escena animada en 3D breve con un estilo de dibujos animados alegre. Una criatura tierna con pelaje similar al de un leopardo de las nieves, ojos grandes y expresivos, y una forma redondeada y amigable se pavonea felizmente por un bosque invernal caprichoso. La escena debe incluir árboles redondeados cubiertos de nieve, copos de nieve que caen suavemente y luz solar cálida que se filtra entre las ramas. Los movimientos elásticos y la sonrisa amplia de la criatura deben transmitir pura alegría. Intenta usar un tono alegre y conmovedor con colores brillantes y alegres, y animaciones divertidas. Considera agregar efectos de sonido sutiles y caprichosos para mejorar el ambiente invernal alegre. |
![]() |
Más sugerencias para escribir instrucciones
Las siguientes sugerencias te ayudarán a escribir instrucciones que generen tus videos:
- Usa lenguaje descriptivo: Usa adjetivos y adverbios para que Veo tenga una idea clara.
- Proporciona contexto: Si es necesario, incluye información general para ayudar al modelo a comprender lo que quieres.
- Haz referencia a estilos artísticos específicos: Si tienes una estética particular en mente, haz referencia a estilos artísticos o movimientos artísticos específicos.
- Utiliza herramientas de ingeniería de instrucciones: Considera explorar herramientas o recursos de ingeniería de instrucciones para ayudarte a definir mejor tus instrucciones y lograr resultados óptimos. Para obtener más información, consulta Introducción a la generación de instrucciones.
- Mejora los detalles faciales en tus imágenes personales y grupales: Especifica los detalles faciales como el enfoque de la foto, por ejemplo, usando la palabra retrato en la instrucción.
Agrega más detalles a las instrucciones
En estos ejemplos, se muestra cómo definir mejor tus instrucciones para generar videos.
Descripción del asunto
En este ejemplo, se muestra cómo especificar una descripción del tema.
Descripción del asunto | Instrucción | Resultados generados |
---|---|---|
Esta descripción puede incluir un sujeto, varios sujetos y acciones, como "edificio de departamentos de hormigón blanco". | Render arquitectónico de un edificio de departamentos de hormigón blanco con formas orgánicas fluidas, que se fusiona a la perfección con la vegetación exuberante y los elementos futuristas |
![]() |
Contexto
En este ejemplo, se muestra cómo especificar el contexto.
Contexto | Instrucción | Resultados generados |
---|---|---|
El fondo o el contexto en el que se colocará el asunto es muy importante. Intenta ubicar al sujeto en diferentes fondos, como en una calle concurrida o en el espacio exterior. | Un satélite flotando en el espacio exterior con la Luna y algunas estrellas de fondo. |
![]() |
Acción
En este ejemplo, se muestra cómo especificar la acción.
Acción | Instrucción | Resultados generados |
---|---|---|
Qué está haciendo el sujeto, como caminar, correr o girar la cabeza | Toma panorámica de una mujer caminando por la playa, con una expresión de satisfacción y relajación, y mirando el horizonte al atardecer. |
![]() |
Estilo
En este ejemplo, se muestra cómo especificar el estilo.
Estilo | Instrucción | Resultados generados |
---|---|---|
Puedes agregar palabras clave para mejorar la calidad de la generación y orientarla hacia el estilo deseado, como profundidad de campo superficial, fotograma de película, minimalista, surrealista, vintage, futurista o doble exposición. | Estilo de cine negro, hombre y mujer caminando por la calle, misterio, cinematográfico, blanco y negro. |
![]() |
Movimiento de la cámara
En este ejemplo, se muestra cómo especificar el movimiento de la cámara.
Movimiento de la cámara | Instrucción | Resultados generados |
---|---|---|
Toma en primera persona, vista aérea, vista de seguimiento con dron, toma de seguimiento | Toma en primera persona desde un automóvil antiguo que conduce bajo la lluvia, Canadá de noche, cinematográfica. |
![]() |
Composición
En este ejemplo, se muestra cómo especificar la composición.
Composición | Instrucción | Resultados generados |
---|---|---|
Cómo se encuadra la toma (toma general, primer plano, ángulo bajo) | Primer plano extremo de un ojo con la ciudad reflejada en él. |
![]() |
Cómo se encuadra la toma (toma general, primer plano, ángulo bajo) | Crea un video de un plano general de un surfista caminando por una playa con una tabla de surf, un hermoso atardecer y un estilo cinematográfico. |
![]() |
Atmósfera
En este ejemplo, se muestra cómo especificar el ambiente.
Ambiente | Instrucción | Resultados generados |
---|---|---|
Agregar colores ayudó a que la imagen se viera única y transmitiera las emociones deseadas: "tonos cálidos naranja apagados", "luz natural", "amanecer o atardecer". Las paletas de colores desempeñan un papel fundamental en la fotografía, ya que influyen en el estado de ánimo y el impacto emocional de una imagen, y hacen que el estilo de la imagen sea coherente. Por ejemplo, una paleta cálida y dorada puede darle a una fotografía un toque romántico y atmosférico. Ejemplo de paletas de colores: "tonos pastel azules y rosas", "iluminación ambiental tenue", "tonos fríos y apagados" | Primer plano de una niña sosteniendo un adorable cachorro de golden retriever en el parque, con luz solar. |
![]() |
Agregar colores ayudó a que la imagen se viera única y transmitiera las emociones deseadas: "tonos cálidos naranja apagados", "luz natural", "amanecer o atardecer". Las paletas de colores desempeñan un papel fundamental en la fotografía, ya que influyen en el estado de ánimo y el impacto emocional de una imagen, y hacen que el estilo de la imagen sea coherente. Por ejemplo, una paleta cálida y dorada puede darle a una fotografía un toque romántico y atmosférico. Ejemplo de paletas de colores: "tonos pastel azules y rosas", "iluminación ambiental tenue", "tonos fríos y apagados" | Primer plano cinematográfico de una mujer triste que viaja en autobús bajo la lluvia, con tonos azules fríos y un ambiente melancólico. |
![]() |
Audio
veo-3.0-generate-preview
admite audio en Preview.
Especifica claramente si quieres audio. Te recomendamos que uses oraciones separadas en tu instrucción para describir el audio. A continuación, se muestran ejemplos de audio descrito como parte de una instrucción:
Efectos de sonido:
- En el audio, se escucha el sonido del agua salpicando de fondo.
- Agrega música suave de fondo.
Voz:
- El hombre del sombrero rojo dice: "¿Dónde está el conejo?". Luego, la mujer del vestido verde que está a su lado responde: "Allí, en el bosque".
Usa imágenes de referencia para generar videos
Puedes dar vida a las imágenes con la función de imagen a video que tiene Veo y usar tus recursos existentes o Imagen para generar algo nuevo.
Instrucción | Resultados generados |
---|---|
Conejo con una barra de chocolate. |
![]() |
El conejo huye. |
![]() |
Cuando uses la función de imagen a video, te recomendamos que hagas lo siguiente:
Asegúrate de que las acciones y las descripciones de voz se alineen con cada sujeto presente en la imagen de entrada.
Cuando haya varios sujetos en la imagen de entrada, especifica claramente qué personaje está realizando una acción o hablando. Para diferenciar entre varios caracteres en una imagen de entrada, usa los detalles descriptivos más distintivos disponibles. Por ejemplo:
- El hombre del sombrero rojo.
- La mujer del vestido azul.
Mensajes negativos
Los mensajes negativos pueden ser una herramienta potente que ayuda a especificar qué elementos no deben aparecer en el video. Describe lo que quieres que el modelo evite generar describiendo lo que quieres que genere. Sigue estas sugerencias:
❌ No uses lenguaje instructivo ni palabras como no o no. Por ejemplo, "No paredes" o "No mostrar paredes".
✅ Describe lo que no quieres ver. Por ejemplo, "pared, marco", lo que significa que no quieres una pared ni un marco en el video.
Instrucción | Resultados generados |
---|---|
Genera una animación corta y estilizada de un roble grande y solitario con hojas que se agitan vigorosamente con un fuerte viento. El árbol debe tener una forma ligeramente exagerada y caprichosa, con ramas dinámicas y fluidas. Las hojas deben mostrar una variedad de colores otoñales, girando y bailando con el viento. La animación debe incluir una banda sonora suave y atmosférica, y usar una paleta de colores cálidos y atractivos. |
![]() |
Genera una animación corta y estilizada de un roble grande y solitario con hojas que se agitan vigorosamente con un fuerte viento. El árbol debe tener una forma ligeramente exagerada y caprichosa, con ramas dinámicas y fluidas. Las hojas deben mostrar una variedad de colores otoñales, girando y bailando con el viento. La animación debe incluir una banda sonora suave y atmosférica, y usar una paleta de colores cálida y atractiva. Con instrucciones negativas: Fondo urbano, estructuras artificiales, atmósfera oscura, tormentosa o amenazante. |
![]() |
Relaciones de aspecto
La generación de videos de Vertex AI Veo admite las siguientes dos relaciones de aspecto:
Relación de aspecto | Descripción |
---|---|
Pantalla ancha o 16:9 | La relación de aspecto de 16:9 es la más común para televisores, monitores y pantallas de teléfonos celulares (horizontal). Usa esta opción cuando quieras capturar más del fondo, como paisajes panorámicos. |
Vertical o 9:16 |
Pantalla panorámica rotada. Esta relación de aspecto se popularizó en las aplicaciones de video de formato corto, como YouTube Shorts. Usa esta relación de aspecto para retratos o objetos altos con orientaciones verticales sólidas, como edificios, árboles, cascadas o edificios. |
Pantalla ancha: Relación de aspecto de 16:9
Este es un ejemplo de instrucción de pantalla ancha con una relación de aspecto de 16:9.
Instrucción | Resultados generados |
---|---|
Crea un video con una vista de dron de seguimiento de un hombre que conduce un automóvil convertible rojo en Palm Springs, en la década de 1970, con luz solar cálida y sombras largas. |
![]() |
Vertical: Relación de aspecto de 9:16
Este es un ejemplo de instrucción para un retrato con una relación de aspecto de 9:16.
Instrucción | Resultados generados |
---|---|
Crea un video con el movimiento fluido de una majestuosa cascada hawaiana en una exuberante selva tropical. Enfócate en el flujo de agua realista, el follaje detallado y la iluminación natural para transmitir tranquilidad. Captura el agua que fluye, la atmósfera brumosa y la luz del sol que se filtra a través del denso dosel. Usa movimientos de cámara cinematográficos y fluidos para mostrar la cascada y sus alrededores. Busca un tono tranquilo y realista que transporte al usuario a la serena belleza de la selva tropical hawaiana. |
![]() |