Guia de comandos de geração de vídeos da Vertex AI

Este guia oferece exemplos dos tipos de vídeos que você pode criar usando o Veo e mostra como modificar partes específicas de um comando para produzir resultados diferentes.

Solicitar acesso: recursos avançados e lista de espera do Veo

Visão geral do guia de comandos

O Veo da Vertex AI é um modelo de geração de texto para vídeo e de imagem para vídeo. Para usar o Veo, você precisa fornecer um comando, que é uma descrição em texto do que quer que seu modelo de IA generativa crie.

Filtros de segurança

O Veo aplica filtros de segurança na Vertex AI para garantir que os vídeos gerados e as fotos enviadas não contenham conteúdo ofensivo. Por exemplo, comandos que violam as diretrizes de IA responsável são bloqueados.

Se você suspeitar de abuso do Veo ou de qualquer saída gerada que contenha material inadequado ou informações imprecisas, use o formulário de denúncia de suspeita de abuso noGoogle Cloud.

Noções básicas para escrever comandos

Os bons comandos são descritivos e claros. Para que o vídeo gerado fique mais parecido com o que você quer, comece identificando sua ideia principal e depois a refine adicionando palavras-chave e modificadores.

Inclua os seguintes elementos no comando:

  1. Assunto: o objeto, a pessoa, o animal ou o cenário que você quer no seu vídeo.
  2. Contexto: o plano de fundo ou o contexto em que o assunto é colocado.
  3. Ação: o que o sujeito está fazendo (por exemplo, caminhando, correndo ou virando a cabeça).
  4. Estilo: pode ser geral ou muito específico. Use palavras-chave específicas de estilo de filme, como filme de terror, filme noir ou estilos animados, como renderização no estilo desenho animado.
  5. Movimento da câmera: opcional. O que a câmera está fazendo, como visão aérea, na altura dos olhos, de cima para baixo ou de baixo para cima.
  6. Composição: opcional. Como a cena é enquadrada, por exemplo, plano geral, close-up ou close-up extremo.
  7. Ambiente: opcional: como a cor e a luz contribuem para a cena, como tons azuis, noite ou tons quentes.

Exemplos de comandos e saídas geradas

Esta seção apresenta vários comandos e como o nível de detalhes fornecido em cada comando permite que você se aproxime do que quer no seu vídeo.

Sinos

Este vídeo demonstra como usar cada um dos elementos no seu comando.

Comando Saída gerada
Close-up (composição) de estalactites derretendo (assunto) em uma parede de rocha congelada (contexto) com tons azuis frios (ambiente), com zoom (movimento da câmera) mantendo o detalhe em close de gotejamento de água (ação). Pingentes de gelo com um fundo azul.

Homem no telefone

Esses vídeos mostram como revisar o comando com detalhes mais específicos sobre o vídeo que você quer que o Veo gere.

Comando Saída gerada Análise
A câmera faz um movimento de dolly para mostrar um close-up de um homem desesperado usando um sobretudo verde, fazendo uma ligação em um telefone de disco fixado na parede com uma luz verde neon e uma cena de filme. Homem falando ao telefone. Este é o primeiro vídeo gerado com base no comando.
Um close cinematográfico mostra um homem desesperado usando um sobretudo verde desbotado enquanto disca um telefone de disco montado em uma parede de tijolos suja, banhada pelo brilho sinistro de um neon verde. A câmera se aproxima, revelando a tensão no maxilar e o desespero gravado no rosto enquanto ele tenta fazer a ligação. A profundidade de campo rasa foca na testa franzida e no telefone preto de disco, desfocando o fundo em um mar de cores neon e sombras indistintas, criando uma sensação de urgência e isolamento. Homem falando ao telefone Um comando mais detalhado resulta em um vídeo mais focado e com um ambiente mais rico.
Um vídeo com movimento suave que se aproxima de um homem desesperado usando um sobretudo verde, usando um telefone de disco vintage contra uma parede banhada em um brilho verde neon assustador. A câmera começa a uma distância média, aproximando-se lentamente do rosto do homem, revelando sua expressão frenética e o suor na testa enquanto ele disca o número com urgência. O foco está nas mãos do homem, nos dedos tateando o disco enquanto ele tenta desesperadamente se conectar. A luz neon verde projeta longas sombras na parede, aumentando a atmosfera tensa. A cena é enquadrada para enfatizar o isolamento e o desespero do homem, destacando o contraste entre o brilho vibrante do neon e a determinação sombria do homem. Homem falando ao telefone. Adicionar mais detalhes deu ao assunto uma expressão realista e criou uma cena intensa e vibrante.

Leopardo-das-neves

Este comando demonstra a saída que o Veo pode gerar.

Comando Saída gerada
Uma criatura fofa com pelo de leopardo-das-neves está caminhando em uma floresta de inverno, renderização em estilo desenho animado 3D. O leopardo-das-neves está letárgico.

Leopardo-das-neves correndo

Esse comando tem mais detalhes e mostra uma saída gerada que pode ser mais próxima do que você quer no seu vídeo.

Comando Saída gerada
Crie uma cena animada em 3D curta em um estilo de desenho animado alegre. Uma criatura fofa com pelo parecido com o de um leopardo-das-neves, olhos grandes e expressivos e uma forma arredondada e amigável pula feliz em uma floresta de inverno fantástica. A cena precisa ter árvores arredondadas cobertas de neve, flocos de neve caindo suavemente e luz solar quente filtrada pelos galhos. Os movimentos saltitantes e o sorriso largo da criatura precisam transmitir alegria pura. Use um tom alegre e emocionante com cores brilhantes e alegres e animação divertida. Considere adicionar efeitos sonoros sutis e divertidos para melhorar a atmosfera alegre do inverno. O leopardo-das-neves está correndo mais rápido.

Mais dicas para escrever comandos

As dicas a seguir ajudam você a escrever comandos que geram seus vídeos:

  • Use uma linguagem descritiva: use adjetivos e advérbios para dar uma ideia clara ao Veo.
  • Forneça contexto: se necessário, inclua informações básicas para ajudar o modelo a entender o que você quer.
  • Referencie estilos artísticos específicos: se você tiver uma estética específica em mente, faça referência a estilos ou movimentos artísticos específicos.
  • Use ferramentas de engenharia de comando: considere usar ferramentas ou recursos de engenharia de comando para refinar seus comandos e alcançar os melhores resultados. Para mais informações, consulte Introdução aos comandos.
  • Melhore os detalhes faciais nas suas imagens pessoais e em grupo: especifique os detalhes faciais como foco da foto, por exemplo, usando a palavra retrato no comando.

Adicionar mais detalhes aos comandos

Estes exemplos mostram como refinar seus comandos para gerar vídeos.

Descrição do assunto

Este exemplo mostra como especificar uma descrição do assunto.

Descrição do assunto Comando Saída gerada
Essa descrição pode incluir um ou vários temas e ações, como "prédio de apartamentos de concreto branco". Uma renderização arquitetônica de um prédio de apartamentos de concreto branco com formas orgânicas fluidas, combinando perfeitamente com vegetação exuberante e elementos futuristas Marcador.

Contexto

Este exemplo mostra como especificar o contexto.

Contexto Comando Saída gerada
O plano de fundo ou o contexto em que o assunto será colocado é muito importante. Tente colocar o objeto em vários planos de fundo, como uma rua movimentada ou o espaço sideral. Um satélite flutuando pelo espaço sideral com a lua e algumas estrelas ao fundo. Satélite flutuando na atmosfera.

Ação

Este exemplo mostra como especificar uma ação.

Ação Comando Saída gerada
O que o sujeito está fazendo, como andar, correr ou virar a cabeça. Uma foto ampla de uma mulher caminhando pela praia, parecendo satisfeita e relaxada, olhando para o horizonte ao pôr do sol. O pôr do sol é absolutamente lindo.

Estilo

Este exemplo mostra como especificar o estilo.

Estilo Comando Saída gerada
Você pode adicionar palavras-chave para melhorar a qualidade da geração e direcioná-la para um estilo mais próximo do desejado, como profundidade de campo rasa, cena de filme, minimalista, surreal, vintage, futurista, dupla exposição. Estilo filme noir, homem e mulher caminhando na rua, mistério, cinematográfico, preto e branco. O estilo filme noir é absolutamente lindo.

Movimento da câmera

Este exemplo mostra como especificar o movimento da câmera.

Movimento da câmera Comando Saída gerada
Tomada em primeira pessoa, vista aérea, vista de drone com rastreamento, tomada com seguimento Uma foto em primeira pessoa de um carro antigo dirigindo na chuva, Canadá à noite, cinematográfica. O pôr do sol é absolutamente lindo.

Composição

Este exemplo mostra como especificar a composição.

Composição Comando Saída gerada
Como a cena é enquadrada (tomada ampla, close-up, ângulo baixo) Close extremo de um olho com a cidade refletida nele. O pôr do sol é absolutamente lindo.
Como a cena é enquadrada (tomada ampla, close-up, ângulo baixo) Crie um vídeo de um surfista caminhando em uma praia com uma prancha, um belo pôr do sol, cinematográfico. O pôr do sol é absolutamente lindo.

Atmosfera

Este exemplo mostra como especificar o ambiente.

Ambiente Comando Saída gerada
A adição de cores ajudou a tornar a imagem única e transmitir as emoções desejadas: "tons quentes de laranja suave", "luz natural", "nascer / pôr do sol". As paletas de cores são muito importantes na fotografia, influenciando o clima e o impacto emocional de uma imagem, além de tornar o estilo consistente. Por exemplo, uma paleta quente e dourada pode dar um toque romântico e atmosférico a uma fotografia. Exemplos de paletas de cores: "tons pastel de azul e rosa", "iluminação ambiente fraca", "tons frios e suaves" Um close de uma menina segurando um filhote de golden retriever adorável no parque, luz do sol. Um filhote de cachorro nos braços de uma menina.
A adição de cores ajudou a tornar a imagem única e transmitir as emoções desejadas: "tons quentes de laranja suave", "luz natural", "nascer / pôr do sol". As paletas de cores são muito importantes na fotografia, influenciando o clima e o impacto emocional de uma imagem, além de tornar o estilo consistente. Por exemplo, uma paleta quente e dourada pode dar um toque romântico e atmosférico a uma fotografia. Exemplos de paletas de cores: "tons pastel de azul e rosa", "iluminação ambiente fraca", "tons frios e suaves" Close cinematográfico de uma mulher triste andando de ônibus na chuva, tons azuis frios, clima triste. Uma mulher andando de ônibus e se sentindo triste.

Áudio

O áudio é compatível com o veo-3.0-generate-preview no pré-lançamento.

Especifique claramente se você quer áudio. Recomendamos que você use frases separadas no comando para descrever o áudio. Confira a seguir exemplos de áudio descrito como parte de um comando:

  • Efeitos sonoros:

    • O áudio apresenta água espirrando ao fundo.
    • Adicione uma música suave em segundo plano.
  • Voz:

    • O homem de chapéu vermelho diz: "Onde está o coelho?" Então, a mulher de vestido verde ao lado dele responde: "Ali, na floresta".

Usar imagens de referência para gerar vídeos

Você pode dar vida às imagens usando o recurso de imagem para vídeo do Veo e usar seus recursos atuais ou o Imagen para gerar algo novo.

Comando Saída gerada
Coelho com uma barra de chocolate. O coelho está fugindo.
O coelho foge. O coelho está fugindo.

Ao usar a conversão de imagem em vídeo, recomendamos o seguinte:

  • Verifique se as ações e as descrições de fala estão alinhadas com cada assunto presente na imagem de entrada.

  • Quando houver vários assuntos na imagem de entrada, especifique claramente qual personagem está realizando uma ação ou falando. Para diferenciar vários caracteres em uma imagem de entrada, use os detalhes descritivos mais distintos disponíveis. Exemplo:

    • O homem de chapéu vermelho.
    • A mulher de vestido azul.

Solicitações negativas

As solicitações negativas podem ser uma ferramenta poderosa que ajuda a especificar quais elementos manter fora do vídeo. Descreva o que você quer que o modelo não gere, descrevendo o que você quer que ele gere. Siga estas dicas:

  • ❌ Não use linguagem instrutiva ou palavras como não. Por exemplo, "Sem paredes" ou "Não mostrar paredes".

  • ✅ Descreva o que você não quer ver. Por exemplo, "parede, moldura", que significa que você não quer uma parede ou uma moldura no vídeo.

Comando Saída gerada
Gere uma animação curta e estilizada de um carvalho grande e solitário com folhas balançando vigorosamente em um vento forte. A árvore deve ter uma forma um pouco exagerada e fantasiosa, com galhos dinâmicos e fluidos. As folhas precisam ter uma variedade de cores de outono, girando e dançando ao vento. A animação deve ter uma trilha sonora suave e atmosférica e usar uma paleta de cores quentes e convidativas. Árvore com palavras.
Gere uma animação curta e estilizada de um carvalho grande e solitário com folhas balançando vigorosamente em um vento forte. A árvore deve ter uma forma um pouco exagerada e fantasiosa, com galhos dinâmicos e fluidos. As folhas precisam ter uma variedade de cores de outono, girando e dançando ao vento. A animação precisa ter uma trilha sonora suave e atmosférica e usar uma paleta de cores quentes e convidativas.

Com o comando negativo: plano de fundo urbano, estruturas feitas pelo homem, atmosfera escura, tempestuosa ou ameaçadora.
Árvore sem palavras negativas.

Proporções

A geração de vídeo da Vertex AI Veo é compatível com as seguintes proporções:

Proporção Descrição
Widescreen ou 16:9 A proporção de 16:9 é a mais comum para televisores, monitores e telas de smartphones (paisagem). Use essa opção quando quiser capturar mais do plano de fundo, como paisagens panorâmicas.
Retrato ou 9:16

Widescreen girado. Essa proporção ficou conhecida por aplicativos de vídeos mais curtos, como o YouTube Shorts. Use essa proporção para retratos ou objetos altos com fortes orientações verticais, como edifícios, árvores, cachoeiras ou edifícios.

Widescreen: proporção de 16:9

Este é um exemplo de comando da tela widescreen com uma proporção de 16:9.

Comando Saída gerada
Crie um vídeo com uma visão de drone de um homem dirigindo um carro conversível vermelho em Palm Springs, anos 1970, luz solar quente, sombras longas. A cachoeira é absolutamente linda.

Retrato: proporção de 9:16

Este é um exemplo de comando de retrato com uma proporção de 9:16.

Comando Saída gerada
Crie um vídeo com um movimento suave de uma majestosa cachoeira havaiana em uma floresta tropical exuberante. Foque no fluxo de água realista, na folhagem detalhada e na iluminação natural para transmitir tranquilidade. Capture a água corrente, a atmosfera enevoada e a luz do sol filtrada pela densa copa das árvores. Use movimentos suaves e cinematográficos da câmera para mostrar a cachoeira e a área ao redor. Procure um tom tranquilo e realista, transportando o espectador para a beleza serena da floresta tropical havaiana. A cachoeira é absolutamente linda.