A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estarão disponíveis em projetos que não os usaram antes, incluindo novos projetos. Para mais detalhes, consulte Versões e ciclo de vida do modelo.

Esta página foi traduzida pela API Cloud Translation.

Visão geral do Vertex AI Agent Engine

O Vertex AI Agent Engine (antes conhecido como LangChain na Vertex AI ou Vertex AI Reasoning Engine) é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e dimensionar agentes de IA em produção. O Agent Engine cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O Vertex AI Agent Engine oferece os seguintes serviços que podem ser usados individualmente ou em combinação:

Ambiente de execução gerenciado:
- Implante e dimensione agentes com um ambiente de execução gerenciado e recursos de gerenciamento de ponta a ponta.
- Personalize a imagem do contêiner do agente com scripts de instalação no momento da build para dependências do sistema.
- Use recursos de segurança, incluindo compliance com VPC-SC e configuração de autenticação e IAM.
- Acessar modelos e ferramentas, como a chamada de função.
- Implante agentes criados usando diferentes frameworks Python:
Gerenciamento de contexto:
- Sessões (prévia): com as sessões do Agent Engine, é possível armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.
- Banco de memória (prévia): com o banco de memória do Agent Engine, é possível armazenar e recuperar informações de sessões para personalizar as interações do agente.
- Exemplo de repositório (prévia): o exemplo de repositório permite armazenar e recuperar dinamicamente exemplos few-shot.
Qualidade e avaliação (versão prévia):
- Avalie a qualidade do agente com o serviço de avaliação de IA generativa integrado.
- Melhore a performance do agente com a Loja de exemplo.
- Otimize agentes com execuções treinamento de modelo do Gemini.
Observabilidade:
- Entenda o comportamento do agente com o Google Cloud Trace (compatível com o OpenTelemetry), o Cloud Monitoring e o Cloud Logging.

Visão geral conceitual do Vertex AI Agent Engine

O Vertex AI Agent Engine faz parte do Vertex AI Agent Builder, um conjunto de recursos para descobrir, criar e implantar agentes de IA.

Criar e implantar no Vertex AI Agent Engine

Observação:para uma experiência simplificada de desenvolvimento e implantação baseada em IDE com o Vertex AI Agent Engine, considere o agent-starter-pack. Ele oferece modelos prontos para uso, uma UI integrada para experimentação e simplifica a implantação, as operações, a avaliação, a personalização e a capacidade de observação.

O fluxo de trabalho para criar um agente no Vertex AI Agent Engine é:

Etapas	Descrição
1. configurar o ambiente	Configure o projeto do Google e instale a versão mais recente do SDK da Vertex AI para Python.
2. Desenvolver um agente	Desenvolver um agente que possa ser implantado no Vertex AI Agent Engine.
3. Implantar o agente	Implante o agente no ambiente de execução gerenciado do Vertex AI Agent Engine.
4. Usar o agente	Envie uma consulta ao agente enviando uma solicitação de API.
5. Gerenciar o agente implantado	Gerencie e exclua os agentes que você implantou no Vertex AI Agent Engine.

As etapas estão ilustradas no diagrama a seguir:

Criar e implantar um agente

Frameworks compatíveis

A tabela a seguir descreve o nível de suporte que o Vertex AI Agent Engine oferece para várias estruturas de agente:

Nível de suporte	Frameworks de agentes
Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte à implantação no Vertex AI Agent Engine do seu framework.	CrewAI, estruturas personalizadas
Integração do SDK da Vertex AI: o Vertex AI Agent Engine oferece modelos gerenciados por framework no SDK e na documentação da Vertex AI.	AG2, LlamaIndex
Integração total: os recursos são integrados para funcionar em todo o framework, no Vertex AI Agent Engine e no ecossistema Google Cloud mais amplo.	Agent Development Kit (ADK), LangChain, LangGraph

Implantar na produção com o pacote inicial de agentes

O Pacote inicial de agentes é uma coleção de modelos de agentes de IA generativa prontos para produção criados para o Vertex AI Agent Engine. O pacote inicial do agente oferece o seguinte:

Modelos de agentes pré-criados:ReAct, RAG, multiagente e outros modelos.
Playground interativo: teste e interaja com seu agente.
Infraestrutura automatizada: usa o Terraform para um gerenciamento de recursos simplificado.
Pipelines de CI/CD: fluxos de trabalho de implantação automatizada que usam o Cloud Build.
Observabilidade: suporte integrado para o Cloud Trace e o Cloud Logging.

Para começar, consulte o Guia de início rápido.

Casos de uso

Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:

Caso de uso	Descrição	Links
Crie agentes conectando-se a APIs públicas	Converta entre moedas. Criar uma função que se conecta a um app de câmbio de moedas, permitindo ao modelo fornecer respostas precisas a consultas como "Qual é a taxa de câmbio de reais para dólares hoje?"	Notebook do SDK da Vertex AI para Python: introdução à criação e implantação de um agente com o Vertex AI Agent Engine
Crie agentes conectando-se a APIs públicas	Projetando um projeto solar comunitário. Identifique locais potenciais, procure escritórios e fornecedores governamentais relevantes e analise imagens de satélite e o potencial solar de regiões e edifícios para encontrar o local ideal para instalar os painéis solares.	Notebook do SDK da Vertex AI para Python: como criar e implantar um agente da API Google Maps com o mecanismo de agente da Vertex AI
Crie agentes conectando-se a bancos de dados	Integração com o AlloyDB e o Cloud SQL para PostgreSQL.	Postagem do blog: anúncio do LangChain na Vertex AI para AlloyDB e Cloud SQL para PostgreSQL Notebook do SDK da Vertex AI para Python: implantação de um aplicativo RAG com o Cloud SQL para PostgreSQL no Vertex AI Agent Engine Notebook do SDK da Vertex AI para Python: implantação de um aplicativo RAG com o AlloyDB para PostgreSQL no Vertex AI Agent Engine
	Crie agentes com ferramentas que acessam dados no seu banco de dados.	Notebook do SDK da Vertex AI para Python: como implantar um agente com o Agent Engine da Vertex AI e a caixa de ferramentas MCP para bancos de dados
	Consultar e entender repositórios de dados estruturados usando linguagem natural.	Notebook do SDK da Vertex AI para Python: como criar um agente de pesquisa de conversação com o Agent Engine da Vertex AI e a RAG na Vertex AI para Pesquisa
	Consulte e entenda bancos de dados de gráficos usando linguagem natural	Postagem do blog: GenAI GraphRAG e agentes de IA usando o Vertex AI Agent Engine com o LangChain e o Neo4j
	Consultar e entender repositórios de vetores usando linguagem natural	Postagem do blog: simplificar a RAG da IA generativa com o MongoDB Atlas e o Vertex AI Agent Engine
Criar agentes com o Agent Development Kit (prévia)	Crie e implante agentes usando o Agent Development Kit.	Kit de desenvolvimento de agentes: implantação no Vertex AI Agent Engine
Criar agentes com o Agent Development Kit (prévia)	Gerenciar o contexto com sessões do Vertex AI Agent Engine e o Memory Bank no modo expresso da Vertex AI sem faturamento.	Kit de desenvolvimento de agentes: sessões do Vertex AI Agent Engine e Memory Bank no modo expresso da Vertex AI.
Criar agentes com frameworks de OSS	Crie e implante agentes usando o framework de código aberto OneTwo.	Postagem do blog: OneTwo e Vertex AI Agent Engine: explorando o desenvolvimento avançado de agentes de IA no Google Cloud
Criar agentes com frameworks de OSS	Crie e implante agentes usando o framework de código aberto LangGraph.	Notebook do SDK da Vertex AI para Python: como criar e implantar um aplicativo LangGraph com o Agent Engine da Vertex AI
Depuração e otimização de agentes	Crie e rastreie agentes usando o OpenTelemetry e o Cloud Trace.	Notebook do SDK da Vertex AI para Python: depuração e otimização de agentes: um guia de rastreamento no mecanismo de agentes da Vertex AI

Segurança corporativa

O Vertex AI Agent Engine é compatível com os VPC Service Controls para reforçar a segurança de dados e reduzir os riscos de exfiltração de dados. Quando o VPC Service Controls está configurado, o agente implantado mantém o acesso seguro a APIs e serviços do Google, como a API BigQuery, API Cloud SQL Admin e Vertex AI, verificando a operação perfeita dentro do perímetro definido. O mais importante é que o VPC Service Controls bloqueia todo o acesso público à Internet, confinando a movimentação de dados aos limites da rede autorizada e melhorando significativamente a postura de segurança da empresa.

Regiões compatíveis

O Vertex AI Agent Engine está disponível nas seguintes regiões:

Região	Local	Versões compatíveis
`us-central1`	Iowa	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`us-east4`	Norte da Virgínia	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`us-west1`	Oregon	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`europe-west1`	Bélgica	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`europe-west2`	Londres	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`europe-west3`	Frankfurt	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`europe-west4`	Países Baixos	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`europe-southwest1`	Madri	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`asia-east1`	Taiwan	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`asia-northeast1`	Tóquio	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`asia-south1`	Mumbai	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`asia-southeast1`	Singapura	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`australia-southeast2`	Melbourne	O `v1` é compatível com recursos de GA. O `v1beta1` é compatível com recursos de pré-lançamento.

Para o Banco de memória do mecanismo de agente (prévia), as seguintes regiões são compatíveis:

Região	Local	Versões compatíveis
`us-central1`	Iowa	A versão `v1beta1` é compatível.

Cota

Os limites a seguir se aplicam ao Vertex AI Agent Engine para um determinado projeto em cada região:

Descrição	Limite
Criar, excluir ou atualizar o Vertex AI Agent Engine por minuto	10
Criar, excluir ou atualizar sessões do Vertex AI Agent Engine por minuto	100
Criar, excluir ou atualizar sessões do Vertex AI Agent Engine por minuto	100
`Query` ou `StreamQuery` Vertex AI Agent Engine por minuto	60
Adicionar evento às sessões por minuto do Vertex AI Agent Engine	100
Número máximo de recursos do Vertex AI Agent Engine	100
Criar, excluir ou atualizar recursos de memória do Vertex AI Agent Engine por minuto	100
Receber, listar ou extrair do banco de memória do Vertex AI Agent Engine por minuto	300

Preços

Os preços são baseados nos recursos de computação (horas de vCPU) e memória (horas de GiB) usados pelos agentes implantados no ambiente de execução gerenciado do Vertex AI Agent Engine.

Produto	Código SKU	Preço
vCPU do ReasoningEngine	8A55-0B95-B7DC	US$ 0,0994/vCPU-h
Memória do ReasoningEngine	0B45-6103-6EC1	US$ 0,0105/GiB-h

Para saber mais informações, consulte Preços.