Visão geral do Vertex AI Agent Engine

O Vertex AI Agent Engine (antes conhecido como LangChain na Vertex AI ou Vertex AI Reasoning Engine) é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e dimensionar agentes de IA em produção. O Agent Engine cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O Vertex AI Agent Engine oferece os seguintes serviços que podem ser usados individualmente ou em combinação:

  • Ambiente de execução gerenciado:

    • Implante e dimensione agentes com um ambiente de execução gerenciado e recursos de gerenciamento de ponta a ponta.
    • Personalize a imagem do contêiner do agente com scripts de instalação no momento da build para dependências do sistema.
    • Use recursos de segurança, incluindo compliance com VPC-SC e configuração de autenticação e IAM.
    • Acessar modelos e ferramentas, como a chamada de função.
    • Implante agentes criados usando diferentes frameworks Python:
  • Gerenciamento de contexto:

    • Sessões (prévia): com as sessões do Agent Engine, é possível armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.

    • Banco de memória (prévia): com o banco de memória do Agent Engine, é possível armazenar e recuperar informações de sessões para personalizar as interações do agente.

    • Exemplo de repositório (prévia): o exemplo de repositório permite armazenar e recuperar dinamicamente exemplos few-shot.

  • Qualidade e avaliação (versão prévia):

  • Observabilidade:

Visão geral conceitual do Vertex AI Agent Engine

O Vertex AI Agent Engine faz parte do Vertex AI Agent Builder, um conjunto de recursos para descobrir, criar e implantar agentes de IA.

Criar e implantar no Vertex AI Agent Engine

Observação:para uma experiência simplificada de desenvolvimento e implantação baseada em IDE com o Vertex AI Agent Engine, considere o agent-starter-pack. Ele oferece modelos prontos para uso, uma UI integrada para experimentação e simplifica a implantação, as operações, a avaliação, a personalização e a capacidade de observação.

O fluxo de trabalho para criar um agente no Vertex AI Agent Engine é:

Etapas Descrição
1. configurar o ambiente Configure o projeto do Google e instale a versão mais recente do SDK da Vertex AI para Python.
2. Desenvolver um agente Desenvolver um agente que possa ser implantado no Vertex AI Agent Engine.
3. Implantar o agente Implante o agente no ambiente de execução gerenciado do Vertex AI Agent Engine.
4. Usar o agente Envie uma consulta ao agente enviando uma solicitação de API.
5. Gerenciar o agente implantado Gerencie e exclua os agentes que você implantou no Vertex AI Agent Engine.

As etapas estão ilustradas no diagrama a seguir:

Criar e implantar um agente 

Frameworks compatíveis

A tabela a seguir descreve o nível de suporte que o Vertex AI Agent Engine oferece para várias estruturas de agente:

Nível de suporte Frameworks de agentes
Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte à implantação no Vertex AI Agent Engine do seu framework. CrewAI, estruturas personalizadas
Integração do SDK da Vertex AI: o Vertex AI Agent Engine oferece modelos gerenciados por framework no SDK e na documentação da Vertex AI. AG2, LlamaIndex
Integração total: os recursos são integrados para funcionar em todo o framework, no Vertex AI Agent Engine e no ecossistema Google Cloud mais amplo. Agent Development Kit (ADK), LangChain, LangGraph

Implantar na produção com o pacote inicial de agentes

O Pacote inicial de agentes é uma coleção de modelos de agentes de IA generativa prontos para produção criados para o Vertex AI Agent Engine. O pacote inicial do agente oferece o seguinte:

  • Modelos de agentes pré-criados:ReAct, RAG, multiagente e outros modelos.
  • Playground interativo: teste e interaja com seu agente.
  • Infraestrutura automatizada: usa o Terraform para um gerenciamento de recursos simplificado.
  • Pipelines de CI/CD: fluxos de trabalho de implantação automatizada que usam o Cloud Build.
  • Observabilidade: suporte integrado para o Cloud Trace e o Cloud Logging.

Para começar, consulte o Guia de início rápido.

Casos de uso

Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:

Caso de uso Descrição Links
Crie agentes conectando-se a APIs públicas Converta entre moedas.

Criar uma função que se conecta a um app de câmbio de moedas, permitindo ao modelo fornecer respostas precisas a consultas como "Qual é a taxa de câmbio de reais para dólares hoje?"
Notebook do SDK da Vertex AI para Python: introdução à criação e implantação de um agente com o Vertex AI Agent Engine
Projetando um projeto solar comunitário.

Identifique locais potenciais, procure escritórios e fornecedores governamentais relevantes e analise imagens de satélite e o potencial solar de regiões e edifícios para encontrar o local ideal para instalar os painéis solares.
Notebook do SDK da Vertex AI para Python: como criar e implantar um agente da API Google Maps com o mecanismo de agente da Vertex AI
Crie agentes conectando-se a bancos de dados Integração com o AlloyDB e o Cloud SQL para PostgreSQL. Postagem do blog: anúncio do LangChain na Vertex AI para AlloyDB e Cloud SQL para PostgreSQL

Notebook do SDK da Vertex AI para Python: implantação de um aplicativo RAG com o Cloud SQL para PostgreSQL no Vertex AI Agent Engine

Notebook do SDK da Vertex AI para Python: implantação de um aplicativo RAG com o AlloyDB para PostgreSQL no Vertex AI Agent Engine
Crie agentes com ferramentas que acessam dados no seu banco de dados. Notebook do SDK da Vertex AI para Python: como implantar um agente com o Agent Engine da Vertex AI e a caixa de ferramentas MCP para bancos de dados
Consultar e entender repositórios de dados estruturados usando linguagem natural. Notebook do SDK da Vertex AI para Python: como criar um agente de pesquisa de conversação com o Agent Engine da Vertex AI e a RAG na Vertex AI para Pesquisa
Consulte e entenda bancos de dados de gráficos usando linguagem natural Postagem do blog: GenAI GraphRAG e agentes de IA usando o Vertex AI Agent Engine com o LangChain e o Neo4j
Consultar e entender repositórios de vetores usando linguagem natural Postagem do blog: simplificar a RAG da IA generativa com o MongoDB Atlas e o Vertex AI Agent Engine
Criar agentes com o Agent Development Kit (prévia) Crie e implante agentes usando o Agent Development Kit. Kit de desenvolvimento de agentes: implantação no Vertex AI Agent Engine
Gerenciar o contexto com sessões do Vertex AI Agent Engine e o Memory Bank no modo expresso da Vertex AI sem faturamento. Kit de desenvolvimento de agentes: sessões do Vertex AI Agent Engine e Memory Bank no modo expresso da Vertex AI.
Criar agentes com frameworks de OSS Crie e implante agentes usando o framework de código aberto OneTwo. Postagem do blog: OneTwo e Vertex AI Agent Engine: explorando o desenvolvimento avançado de agentes de IA no Google Cloud
Crie e implante agentes usando o framework de código aberto LangGraph. Notebook do SDK da Vertex AI para Python: como criar e implantar um aplicativo LangGraph com o Agent Engine da Vertex AI
Depuração e otimização de agentes Crie e rastreie agentes usando o OpenTelemetry e o Cloud Trace. Notebook do SDK da Vertex AI para Python: depuração e otimização de agentes: um guia de rastreamento no mecanismo de agentes da Vertex AI

Segurança corporativa

O Vertex AI Agent Engine é compatível com os VPC Service Controls para reforçar a segurança de dados e reduzir os riscos de exfiltração de dados. Quando o VPC Service Controls está configurado, o agente implantado mantém o acesso seguro a APIs e serviços do Google, como a API BigQuery, API Cloud SQL Admin e Vertex AI, verificando a operação perfeita dentro do perímetro definido. O mais importante é que o VPC Service Controls bloqueia todo o acesso público à Internet, confinando a movimentação de dados aos limites da rede autorizada e melhorando significativamente a postura de segurança da empresa.

Regiões compatíveis

O Vertex AI Agent Engine está disponível nas seguintes regiões:

Região Local Versões compatíveis
us-central1 Iowa O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
us-east4 Norte da Virgínia O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
us-west1 Oregon O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
europe-west1 Bélgica O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
europe-west2 Londres O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
europe-west3 Frankfurt O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
europe-west4 Países Baixos O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
europe-southwest1 Madri O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
asia-east1 Taiwan O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
asia-northeast1 Tóquio O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
asia-south1 Mumbai O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
asia-southeast1 Singapura O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.
australia-southeast2 Melbourne O v1 é compatível com recursos de GA. O v1beta1 é compatível com recursos de pré-lançamento.

Para o Banco de memória do mecanismo de agente (prévia), as seguintes regiões são compatíveis:

Região Local Versões compatíveis
us-central1 Iowa A versão v1beta1 é compatível.

Cota

Os limites a seguir se aplicam ao Vertex AI Agent Engine para um determinado projeto em cada região:
Descrição Limite
Criar, excluir ou atualizar o Vertex AI Agent Engine por minuto 10
Criar, excluir ou atualizar sessões do Vertex AI Agent Engine por minuto 100
Criar, excluir ou atualizar sessões do Vertex AI Agent Engine por minuto 100
Query ou StreamQuery Vertex AI Agent Engine por minuto 60
Adicionar evento às sessões por minuto do Vertex AI Agent Engine 100
Número máximo de recursos do Vertex AI Agent Engine 100
Criar, excluir ou atualizar recursos de memória do Vertex AI Agent Engine por minuto 100
Receber, listar ou extrair do banco de memória do Vertex AI Agent Engine por minuto 300

Preços

Os preços são baseados nos recursos de computação (horas de vCPU) e memória (horas de GiB) usados pelos agentes implantados no ambiente de execução gerenciado do Vertex AI Agent Engine.

Produto Código SKU Preço
vCPU do ReasoningEngine 8A55-0B95-B7DC US$ 0,0994/vCPU-h
Memória do ReasoningEngine 0B45-6103-6EC1 US$ 0,0105/GiB-h

Para saber mais informações, consulte Preços.

A seguir