Este guia apresenta os conceitos básicos da IA generativa e o fluxo de trabalho para criar aplicativos na Vertex AI, abordando os seguintes tópicos:
Este guia para iniciantes apresenta as principais tecnologias da IA generativa
e explica como eles se complementam para potencializar chatbots e aplicativos.
A IA generativa, também conhecida como genAI ou IA generativa, é um campo de machine learning
(ML) que desenvolve e usa modelos de ML para gerar conteúdo novo. Os modelos de IA generativa são frequentemente chamados de modelos de linguagem grandes (LLMs) devido ao tamanho grande e a capacidade de entender e gerar linguagem natural.
No entanto, dependendo dos dados com os quais os modelos são treinados, eles podem
entender e gerar conteúdo em diversas modalidades, incluindo texto,
imagens, vídeos e áudio. Modelos que funcionam com várias modalidades de dados
chamados modelos multimodais. O Google oferece a família de modelos de IA generativa do Gemini projetada para casos de uso multimodais, capaz de processar informações de várias modalidades, incluindo imagens, vídeos e texto. Para que os modelos de IA generativa gerem conteúdo útil em
aplicativos reais, eles precisam ter os seguintes recursos: O diagrama a seguir resume o fluxo de trabalho geral: O fluxo de trabalho da IA generativa geralmente começa com solicitações. Um comando é uma solicitação em linguagem natural enviada a um modelo de IA generativa para receber uma resposta. Dependendo do modelo, um comando pode conter texto, imagens, vídeos, áudio, documentos ou várias modalidades (multimodal). Por exemplo, um comando de texto simples pode ser: Criar um comando para receber a resposta desejada do modelo é uma prática chamada design de comandos. Embora o design de comandos seja um processo de tentativa e erro, há princípios e estratégias que podem ser usados para fazer com que o modelo se comporte da maneira desejada. O Vertex AI Studio oferece uma ferramenta de gestão de comandos para ajudar você a gerenciá-los. Os comandos são enviados a um modelo de IA generativa para geração de respostas. A Vertex AI tem vários modelos de fundação de IA generativa acessíveis por uma API gerenciada. Os modelos diferem em tamanho, modalidade e custo. A tabela a seguir fornece uma visão geral: Conheça os modelos do Google, bem como os de código aberto e de parceiros do Google, no Model Garden. É possível personalizar o comportamento padrão dos modelos de fundação do Google para que eles gerem os resultados desejados de maneira consistente e sem usar comandos complexos. Esse processo de personalização é chamado de ajuste do modelo. O ajuste de modelo ajuda a reduzir o custo e a latência das solicitações, o que simplifica os comandos. A Vertex AI também oferece ferramentas de avaliação de modelos para ajudar você a avaliar o desempenho do modelo ajustado. Depois que o modelo ajustado estiver pronto para produção, será possível implantá-lo em um endpoint e monitorar o desempenho como em fluxos de trabalho MLOps padrão. A Vertex AI oferece várias maneiras de dar ao modelo acesso a APIs externas e informações em tempo real. Depois que a resposta é gerada, a Vertex AI verifica se as citações precisam ser incluídas nela. Se uma parte significativa do texto na resposta vier de uma fonte específica, essa fonte será adicionada aos metadados de citação na resposta. A última camada de verificações que a solicitação e a resposta passam antes de serem retornadas são os filtros de segurança. A Vertex AI verifica a solicitação e a resposta para saber quanto ela pertence a uma categoria de segurança. Se o limite for excedido para uma ou mais categorias, a resposta será bloqueada e a Vertex AI vai retornar uma resposta alternativa. Se a solicitação e a resposta forem aprovadas nas verificações do filtro de segurança, a resposta será retornada. Normalmente, a resposta é retornada de uma só vez. No entanto, com a Vertex AI, você também pode receber respostas progressivamente à medida que são geradas, ativando o streaming. Confira um destes guias de início rápido para começar a usar a IA generativa na Vertex AI.
Use o SDK para enviar solicitações à API Gemini da Vertex AI.
Teste comandos sem precisar configurar nada.
Crie uma imagem com marca d'água usando o Imagen na Vertex AI.
Conceitos
Geração de conteúdo
Comando
"Summarize the following article in three bullet points: [article text]"
Modelos de fundação
Família do modelo
Caso de uso principal
API Gemini
Raciocínio avançado, chat com vários turnos, geração de código e comandos multimodais (texto, imagens, vídeo, áudio).
API Imagen
Geração, edição e legenda visual de imagens de alta qualidade.
MedLM (descontinuado)
Respostas a perguntas e resumos médicos.
Personalização de modelo
Acessar informações externas
Opção
Descrição
Caso de uso
Embasamento
Conecta as respostas do modelo a uma fonte de verdade, como seus próprios dados ou a pesquisa na Web.
Reduza as alucinações e melhore a precisão factual vinculando as respostas a dados específicos.
Geração aumentada de recuperação (RAG)
Conecta modelos a fontes de conhecimento externas, como documentos e bancos de dados.
Gerar respostas mais precisas e informativas recuperando informações relevantes de grandes bases de conhecimento.
Chamada de função
Permite que o modelo interaja com APIs externas.
Receber informações em tempo real (por exemplo, clima, preços de ações) ou realizar tarefas do mundo real (por exemplo, reservar um voo, enviar um e-mail).
Verificação de citação
IA e segurança responsáveis
Resposta
Primeiros passos
Guia para iniciantes sobre IA generativa
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-08-19 UTC.