Esta página foi traduzida pela API Cloud Translation.

Visão geral do Vertex AI Agent Engine

O Vertex AI Agent Engine, que faz parte da plataforma Vertex AI, é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e dimensionar agentes de IA em produção. O Agent Engine cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O Vertex AI Agent Engine oferece os seguintes serviços que podem ser usados individualmente ou em combinação:

Ambiente de execução:
- Implante e dimensione agentes com um ambiente de execução gerenciado e recursos de gerenciamento de ponta a ponta.
- Personalize a imagem do contêiner do agente com scripts de instalação no momento da build para dependências do sistema.
- Use recursos de segurança, incluindo o compliance com o VPC-SC, configuração de autenticação e o IAM.
- Acesse modelos e ferramentas, como chamada de função.
- Implante agentes criados usando diferentes frameworks do Python e o protocolo aberto Agent2Agent.
- Entenda o comportamento do agente com o Google Cloud Trace (compatível com o OpenTelemetry), o Cloud Monitoring e o Cloud Logging.
Qualidade e avaliação (prévia): avalie a qualidade do agente com o serviço de avaliação de IA generativa integrado e otimize os agentes com execuções treinamento de modelo Gemini.
Exemplo de repositório (prévia): armazene e recupere dinamicamente exemplos few-shot para melhorar a performance do agente.
Sessões (prévia): com as sessões do Agent Engine, é possível armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.
Banco de memória (prévia): com o banco de memória do Agent Engine, é possível armazenar e recuperar informações de sessões para personalizar as interações do agente.
Execução de código (prévia): com a execução de código do Agent Engine, seu agente pode executar código em um ambiente de sandbox seguro, isolado e gerenciado.

Visão geral conceitual do Vertex AI Agent Engine

O Vertex AI Agent Engine faz parte do Vertex AI Agent Builder, um conjunto de recursos para descobrir, criar e implantar agentes de IA.

Criar e implantar no Vertex AI Agent Engine

Observação:para uma experiência simplificada de desenvolvimento e implantação baseada em IDE com o Vertex AI Agent Engine, considere o agent-starter-pack. Ele oferece modelos prontos para uso, uma UI integrada para testes e simplifica a implantação, as operações, a avaliação, a personalização e a capacidade de observação.

O fluxo de trabalho para criar um agente no Vertex AI Agent Engine é:

Etapas	Descrição
1. configurar o ambiente	Configure o projeto do Google e instale a versão mais recente do SDK da Vertex AI para Python.
2. Desenvolver um agente	Desenvolver um agente que possa ser implantado no Vertex AI Agent Engine.
3. Implantar o agente	Implante o agente no ambiente de execução gerenciado do Vertex AI Agent Engine.
4. Usar o agente	Envie uma consulta ao agente enviando uma solicitação de API.
5. Gerenciar o agente implantado	Gerencie e exclua os agentes que você implantou no Vertex AI Agent Engine.

As etapas estão ilustradas no diagrama a seguir:

Criar e implantar um agente

Frameworks compatíveis

A tabela a seguir descreve o nível de suporte que o Vertex AI Agent Engine oferece para várias estruturas de agente:

Nível de suporte	Frameworks de agentes
Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte à implantação no Vertex AI Agent Engine do seu framework.	CrewAI, estruturas personalizadas
Integração do SDK da Vertex AI: o Vertex AI Agent Engine oferece modelos gerenciados por framework no SDK e na documentação da Vertex AI.	AG2, LlamaIndex
Integração total: os recursos são integrados para funcionar em toda a estrutura, no Vertex AI Agent Engine e no ecossistema Google Cloud mais amplo.	Agent Development Kit (ADK), LangChain, LangGraph

Implantar na produção com o pacote inicial de agentes

O Pacote inicial de agentes é uma coleção de modelos de agentes de IA generativa prontos para produção criados para o Vertex AI Agent Engine. O pacote inicial do agente oferece o seguinte:

Modelos de agentes pré-criados:ReAct, RAG, multiagente e outros modelos.
Playground interativo: teste e interaja com seu agente.
Infraestrutura automatizada: usa o Terraform para um gerenciamento de recursos simplificado.
Pipelines de CI/CD: fluxos de trabalho de implantação automatizada que usam o Cloud Build.
Observabilidade: suporte integrado para o Cloud Trace e o Cloud Logging.

Para começar, consulte o Guia de início rápido.

Casos de uso

Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:

Caso de uso	Descrição	Links
Crie agentes conectando-se a APIs públicas	Converta entre moedas. Criar uma função que se conecta a um app de câmbio de moedas, permitindo ao modelo fornecer respostas precisas a consultas como "Qual é a taxa de câmbio de reais para dólares hoje?"	Notebook do SDK da Vertex AI para Python: introdução à criação e implantação de um agente com o Vertex AI Agent Engine
Crie agentes conectando-se a APIs públicas	Projetando um projeto solar comunitário. Identifique locais potenciais, procure escritórios e fornecedores governamentais relevantes e analise imagens de satélite e o potencial solar de regiões e edifícios para encontrar o local ideal para instalar os painéis solares.	Notebook do SDK da Vertex AI para Python: como criar e implantar um agente da API Google Maps com o mecanismo de agente da Vertex AI
Crie agentes conectando-se a bancos de dados	Integração com o AlloyDB e o Cloud SQL para PostgreSQL.	Postagem do blog: anúncio do LangChain na Vertex AI para AlloyDB e Cloud SQL para PostgreSQL Notebook do SDK da Vertex AI para Python: implantação de um aplicativo RAG com o Cloud SQL para PostgreSQL no Vertex AI Agent Engine Notebook do SDK da Vertex AI para Python: implantação de um aplicativo RAG com o AlloyDB para PostgreSQL no Vertex AI Agent Engine
	Crie agentes com ferramentas que acessam dados no seu banco de dados.	Notebook do SDK da Vertex AI para Python: como implantar um agente com o Agent Engine da Vertex AI e a caixa de ferramentas MCP para bancos de dados
	Consultar e entender repositórios de dados estruturados usando linguagem natural.	Notebook do SDK da Vertex AI para Python: como criar um agente de pesquisa de conversação com o Agent Engine da Vertex AI e a RAG na Vertex AI para Pesquisa
	Consulte e entenda bancos de dados de gráficos usando linguagem natural	Postagem do blog: GenAI GraphRAG e agentes de IA usando o Vertex AI Agent Engine com o LangChain e o Neo4j
	Consultar e entender repositórios de vetores usando linguagem natural	Postagem do blog: simplificar a RAG da IA generativa com o MongoDB Atlas e o Vertex AI Agent Engine
Criar agentes com o Kit de Desenvolvimento de Agente	Crie e implante agentes usando o Kit de Desenvolvimento de Agente.	Kit de desenvolvimento de agente: implantação no Vertex AI Agent Engine
Criar agentes com o Kit de Desenvolvimento de Agente	Gerenciar o contexto com sessões do Vertex AI Agent Engine e Memory Bank no modo express da Vertex AI sem faturamento.	Kit de desenvolvimento de agente: sessões do Vertex AI Agent Engine e Memory Bank no modo expresso da Vertex AI.
Criar agentes com frameworks de OSS	Crie e implante agentes usando o framework de código aberto OneTwo.	Postagem do blog: OneTwo e Vertex AI Agent Engine: explorando o desenvolvimento avançado de agentes de IA no Google Cloud
Criar agentes com frameworks de OSS	Crie e implante agentes usando o framework de código aberto LangGraph.	Notebook do SDK da Vertex AI para Python: como criar e implantar um aplicativo LangGraph com o Agent Engine da Vertex AI
Depuração e otimização de agentes	Crie e rastreie agentes usando o OpenTelemetry e o Cloud Trace.	Notebook do SDK da Vertex AI para Python: depuração e otimização de agentes: um guia de rastreamento no Agent Engine da Vertex AI
Criar sistemas multiagente com o protocolo A2A (prévia)	Crie agentes interoperáveis que se comunicam e colaboram com outros agentes, independente da estrutura deles.	Para mais informações, consulte a documentação do protocolo A2A.

Segurança corporativa

O Vertex AI Agent Engine oferece suporte a vários recursos para ajudar você a atender aos requisitos de segurança corporativa, aderir às políticas de segurança da sua organização e seguir as práticas recomendadas de segurança. Há suporte para os seguintes recursos:

VPC Service Controls: o Vertex AI Agent Engine é compatível com os VPC Service Controls para reforçar a segurança dos dados e reduzir os riscos de exfiltração de dados. Quando o VPC Service Controls é configurado, o agente implantado mantém o acesso seguro a APIs e serviços do Google, como a API BigQuery, API Cloud SQL Admin e Vertex AI, verificando a operação perfeita dentro do perímetro definido. O VPC Service Controls bloqueia todo o acesso à Internet pública, confinando a movimentação de dados aos limites da rede autorizada e melhorando significativamente a postura de segurança da empresa.

Observação: se você usa o Vertex AI Agent Engine em um ambiente VPC-SC, crie uma regra de entrada no perímetro para permitir a entrada do agente de serviço do Reasoning Engine (service-PROJECT_NUMBER@gcp-sa-aiplatform-re.iam.gserviceaccount.com) no serviço storage.googleapis.com e no serviço artifactregistry.googleapis.com.
Interface do Private Service Connect: para o ambiente de execução do Vertex AI Agent Engine, o PSC-I permite que seus agentes interajam com serviços hospedados de maneira particular na VPC de um usuário. Para mais informações, consulte Como usar a interface do Private Service Connect com o Vertex AI Agent Engine.
Chaves de criptografia gerenciadas pelo cliente (CMEK): o Vertex AI Agent Engine aceita CMEK para proteger seus dados com suas próprias chaves de criptografia, o que dá a você a propriedade e o controle total das chaves que protegem seus dados em repouso no Google Cloud. Para mais informações, consulte CMEK do Agent Engine.
Residência de dados (DRZ): o Vertex AI Agent Engine oferece suporte à residência de dados (DRZ) para garantir que todos os dados em repouso e em uso sejam armazenados na região especificada.
HIPAA: como parte da plataforma Vertex AI, o Vertex AI Agent Engine é compatível com cargas de trabalho da HIPAA.
Transparência no acesso: a Transparência no acesso fornece registros que capturam as ações realizadas pela equipe do Google ao acessar seu conteúdo. Para mais informações sobre como ativar a Transparência no acesso para o Vertex AI Agent Engine, consulte Transparência no acesso na Vertex AI.

A tabela a seguir mostra quais recursos de segurança empresarial são compatíveis com cada serviço do Agent Engine:

Recurso de segurança	Ambiente de execução	Sessões	Banco de memória	Exemplo de repositório	execução de código
VPC Service Controls	Sim	Sim	Sim	Não	Não
Chaves de criptografia gerenciadas pelo cliente	Sim	Sim	Sim	Não	Não
Residência dos dados (DRZ) em repouso	Sim	Sim	Sim	Não	Não
Residência de dados (DRZ) em uso	Não	Sim	Sim^*	Não	Sim
HIPAA	Sim	Sim	Sim	Sim	Não
Transparência no acesso	Sim	Sim	Sim	Não	Não

^* Somente ao usar um endpoint regional do Gemini.

Regiões compatíveis

O ambiente de execução do Vertex AI Agent Engine, as sessões do Agent Engine e o Memory Bank do Vertex AI Agent Engine estão disponíveis nas seguintes regiões:

Região	Local	Versões compatíveis
`us-central1`	Iowa	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`us-east4`	Norte da Virgínia	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`us-west1`	Oregon	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`europe-west1`	Bélgica	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`europe-west2`	Londres	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`europe-west3`	Frankfurt	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`europe-west4`	Países Baixos	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`europe-southwest1`	Madri	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`asia-east1`	Taiwan	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`asia-northeast1`	Tóquio	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`asia-south1`	Mumbai	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`asia-southeast1`	Singapura	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.
`australia-southeast2`	Melbourne	O `v1` é compatível com recursos do GA. O `v1beta1` é compatível com recursos de pré-lançamento.

Para a execução de código do Agent Engine (prévia), as seguintes regiões são compatíveis.

Região	Local	Versões compatíveis
`us-central1`	Iowa	A versão `v1beta1` é compatível.

Cota

Os limites a seguir se aplicam ao Vertex AI Agent Engine para um determinado projeto em cada região:

Descrição	Limite
Criar, excluir ou atualizar o Vertex AI Agent Engine por minuto	10
Criar, excluir ou atualizar sessões do Vertex AI Agent Engine por minuto	100
`Query` ou `StreamQuery` Vertex AI Agent Engine por minuto	90
Adicionar evento às sessões por minuto do Vertex AI Agent Engine	300
Número máximo de recursos do Vertex AI Agent Engine	100
Criar, excluir ou atualizar recursos de memória do Vertex AI Agent Engine por minuto	100
Receber, listar ou extrair do Memory Bank do Vertex AI Agent Engine por minuto	300
Solicitações de execução por minuto no ambiente de sandbox (execução de código)	1000
Entidades do ambiente de sandbox (execução de código) por região	1000
Solicitações de postagem do agente A2A, como `sendMessage` e `cancelTask` por minuto	60
Solicitações GET do agente A2A, como `getTask` e `getCard`, por minuto	600
Conexões bidirecionais simultâneas em tempo real usando a API `BidiStreamQuery` por minuto	10

Preços

Para informações sobre preços do tempo de execução do Agent Engine, consulte Preços da Vertex AI.

Migração para o SDK baseado em cliente

O módulo agent_engines no SDK da Vertex AI para Python está sendo refatorado para um design baseado em cliente pelos seguintes motivos principais:

Para se alinhar ao ADK do Google e ao SDK da IA generativa do Google em representações de tipo canônico. Isso garante uma maneira consistente e padronizada de representar tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz a sobrecarga de conversão.
Para escopo no nível do cliente de parâmetros Google Cloud em aplicativos de vários projetos e locais. Isso permite que um aplicativo gerencie interações com recursos em diferentes projetos e locais geográficos Google Cloud configurando cada instância de cliente com as configurações específicas de projeto e local.
Para melhorar a capacidade de descoberta e a coesão dos serviços do Vertex AI Agent Engine.