Visão geral do Vertex AI Agent Engine

O Vertex AI Agent Engine (antes conhecido como LangChain na Vertex AI ou Vertex AI Reasoning Engine) é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e dimensionar agentes de IA em produção. O Agent Engine cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O Vertex AI Agent Engine oferece os seguintes serviços que podem ser usados individualmente ou em conjunto:

  • Ambiente de execução gerenciado (GA):

    • Implante e dimensione agentes com um ambiente de execução gerenciado e recursos de gerenciamento de ponta a ponta.
    • Use recursos de segurança, incluindo compliance com o VPC-SC e configuração de autenticação e IAM.
    • Acesse modelos e ferramentas, como a chamada de função.
    • Implante agentes criados usando diferentes frameworks do Python:
  • Gerenciamento de contexto:

    • Sessões (pré-lançamento): as sessões do mecanismo do agente permitem armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.

    • Exemplo de repositório (pré-lançamento): o exemplo de repositório permite armazenar e recuperar dinamicamente exemplos few-shot.

  • Qualidade e avaliação (versão prévia):

  • Observabilidade (GA):

Visão geral conceitual do Vertex AI Agent Engine

O Vertex AI Agent Engine faz parte do Vertex AI Agent Builder, um conjunto de recursos para descobrir, criar e implantar agentes de IA.

Criar e implantar no Vertex AI Agent Engine

Observação:para uma experiência de desenvolvimento e implantação simplificada baseada em IDE com o Vertex AI Agent Engine, considere o agent-starter-pack. Ele oferece modelos prontos para uso, uma UI integrada para experimentação e simplifica a implantação, as operações, a avaliação, a personalização e a observabilidade.

O fluxo de trabalho para criar um agente no Vertex AI Agent Engine é o seguinte:

Etapas Descrição
1. configurar o ambiente Configure o projeto do Google e instale a versão mais recente do SDK da Vertex AI para Python.
2. Desenvolver um agente Desenvolva um agente que possa ser implantado no Vertex AI Agent Engine.
3. Implantar o agente Implante o agente no ambiente de execução gerenciado do Vertex AI Agent Engine.
4. Usar o agente Faça uma consulta ao agente enviando uma solicitação de API.
5. Gerenciar o agente implantado Gerencie e exclua os agentes implantados no Vertex AI Agent Engine.

As etapas estão ilustradas no diagrama a seguir:

Criar e implantar um agente 

Frameworks compatíveis

A tabela a seguir descreve o nível de suporte que o Vertex AI Agent Engine oferece para vários frameworks de agentes:

Nível de suporte Frameworks de agentes
Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte à implantação no Vertex AI Agent Engine usando seu framework. CrewAI, frameworks personalizados
Integração do SDK da Vertex AI: o mecanismo de agente da Vertex AI fornece modelos gerenciados por framework no SDK e na documentação da Vertex AI. AG2, LlamaIndex
Integração total: os recursos são integrados para funcionar em todo o framework, no Vertex AI Agent Engine e no ecossistema Google Cloud mais amplo. Agent Development Kit (ADK), LangChain, LangGraph

Implantar na produção com o pacote inicial do agente

O Agent Starter Pack é uma coleção de modelos de agentes de IA generativa prontos para produção criados para o Vertex AI Agent Engine. O pacote básico para agentes oferece o seguinte:

  • Modelos de agentes pré-criados:ReAct, RAG, multiagente e outros modelos.
  • Ambiente interativo: teste e interaja com seu agente.
  • Infraestrutura automatizada: usa o Terraform para simplificar o gerenciamento de recursos.
  • Pipelines de CI/CD: fluxos de trabalho de implantação automatizada que usam o Cloud Build.
  • Observabilidade: suporte integrado ao Cloud Trace e ao Cloud Logging.

Para começar, consulte o Guia de início rápido.

Casos de uso

Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:

Caso de uso Descrição Links
Criar agentes ao se conectar a APIs públicas Converta entre moedas.

Criar uma função que se conecta a um app de câmbio de moedas, permitindo ao modelo fornecer respostas precisas a consultas como "Qual é a taxa de câmbio de reais para dólares hoje?"
Notebook do SDK da Vertex AI para Python: introdução à criação e implantação de um agente com o mecanismo de agente da Vertex AI
Projetando um projeto solar comunitário.

Identifique locais potenciais, procure escritórios e fornecedores governamentais relevantes e analise imagens de satélite e o potencial solar de regiões e edifícios para encontrar o local ideal para instalar os painéis solares.
Notebook do SDK da Vertex AI para Python: como criar e implantar um agente da API Google Maps com o mecanismo de agente da Vertex AI
Criar agentes conectando-se a bancos de dados Integração com o AlloyDB e o Cloud SQL para PostgreSQL. Postagem do blog: anúncio do LangChain na Vertex AI para AlloyDB e Cloud SQL para PostgreSQL

Notebook do SDK da Vertex AI para Python: como implantar um aplicativo RAG com o Cloud SQL para PostgreSQL no mecanismo de agente da Vertex AI

Notebook do SDK da Vertex AI para Python: como implantar um aplicativo RAG com o AlloyDB para PostgreSQL no mecanismo de agente da Vertex AI
Crie agentes com ferramentas que acessam dados no seu banco de dados. Notebook do SDK da Vertex AI para Python: como implantar um agente com o mecanismo de agente da Vertex AI e a Toolbox do MCP para bancos de dados
Consultar e entender repositórios de dados estruturados usando linguagem natural. Notebook do SDK da Vertex AI para Python: como criar um agente de pesquisa de conversação com o mecanismo de agente da Vertex AI e a RAG na Vertex AI para Pesquisa
Consulte e entenda bancos de dados de gráficos usando linguagem natural Postagem do blog: GenAI GraphRAG e agentes de IA usando o Vertex AI Agent Engine com o LangChain e o Neo4j
Consultar e entender repositórios de vetores usando linguagem natural Postagem do blog: simplificar a RAG da IA generativa com o MongoDB Atlas e o Vertex AI Agent Engine
Criar agentes com o Agent Development Kit (pré-lançamento) Crie e implante agentes usando o Agent Development Kit. Kit de desenvolvimento de agentes: implantação no mecanismo de agentes da Vertex AI
Criar agentes com frameworks de OSS Crie e implante agentes usando o framework de código aberto OneTwo. Postagem do blog: OneTwo e Vertex AI Agent Engine: explorando o desenvolvimento avançado de agentes de IA no Google Cloud
Crie e implante agentes usando o framework de código aberto LangGraph. Notebook do SDK da Vertex AI para Python: como criar e implantar um aplicativo LangGraph com o mecanismo de agente da Vertex AI
Depuração e otimização de agentes Crie e rastreie agentes usando o OpenTelemetry e o Cloud Trace. Notebook do SDK da Vertex AI para Python: depuração e otimização de agentes: um guia de rastreamento no mecanismo de agentes da Vertex AI

Segurança corporativa

O Vertex AI Agent Engine oferece suporte a VPC Service Controls para fortalecer a segurança de dados e reduzir os riscos de exfiltração de dados. Quando o VPC Service Controls está configurado, o agente implantado mantém o acesso seguro a APIs e serviços do Google, como a API BigQuery, a API Cloud SQL Admin e a API Vertex AI, garantindo a operação perfeita no perímetro definido. Os VPC Service Controls bloqueiam de forma eficaz todo o acesso público à Internet, confinando o movimento de dados aos limites da rede autorizada e melhorando significativamente a postura de segurança da sua empresa.

Regiões compatíveis

O Vertex AI Agent Engine tem suporte nas seguintes regiões:

Região Local Versões compatíveis
us-central1 Iowa O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
us-east4 Norte da Virgínia O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
us-west1 Oregon O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
europe-west1 Bélgica O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
europe-west2 Londres O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
europe-west3 Frankfurt O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
europe-west4 Países Baixos O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
europe-southwest1 Madri O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
asia-east1 Taiwan O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
asia-northeast1 Tóquio O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
asia-south1 Mumbai O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
asia-southeast1 Singapura O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.
australia-southeast2 Melbourne O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento.

Cota

As cotas e limites a seguir se aplicam ao Vertex AI Agent Engine para um determinado projeto em cada região.
Cota Valor
Criar/excluir/atualizar o Vertex AI Agent Engine por minuto 10
Consulta/StreamQuery Vertex AI Agent Engine por minuto 60
Número máximo de recursos do Vertex AI Agent Engine 100

Preços

Os preços são baseados nos recursos de computação (horas de vCPU) e memória (horas de GiB) usados pelos agentes implantados no runtime gerenciado do Vertex AI Agent Engine.

Produto Código SKU Preço
vCPU do ReasoningEngine 8A55-0B95-B7DC US$ 0,0994/vCPU-h
Memória do ReasoningEngine 0B45-6103-6EC1 US$ 0,0105/GiB-h

Para saber mais informações, consulte Preços.

A seguir