O Vertex AI Agent Engine (antes conhecido como LangChain na Vertex AI ou Vertex AI Reasoning Engine) é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e dimensionar agentes de IA em produção. O Agent Engine cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O Vertex AI Agent Engine oferece os seguintes serviços que podem ser usados individualmente ou em conjunto:
Ambiente de execução gerenciado (GA):
- Implante e dimensione agentes com um ambiente de execução gerenciado e recursos de gerenciamento de ponta a ponta.
- Use recursos de segurança, incluindo compliance com o VPC-SC e configuração de autenticação e IAM.
- Acesse modelos e ferramentas, como a chamada de função.
- Implante agentes criados usando diferentes frameworks do Python:
Gerenciamento de contexto:
Sessões (pré-lançamento): as sessões do mecanismo do agente permitem armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.
Exemplo de repositório (pré-lançamento): o exemplo de repositório permite armazenar e recuperar dinamicamente exemplos few-shot.
Qualidade e avaliação (versão prévia):
- Avalie a qualidade do agente com o serviço de avaliação de IA generativa integrado.
- Melhore a performance do agente com a Loja de exemplo.
- Otimize os agentes com execuções de treinamento de modelo do Gemini.
Observabilidade (GA):
- Entenda o comportamento do agente com o Google Cloud Trace (compatível com o OpenTelemetry), o Cloud Monitoring e o Cloud Logging.
O Vertex AI Agent Engine faz parte do Vertex AI Agent Builder, um conjunto de recursos para descobrir, criar e implantar agentes de IA.
Criar e implantar no Vertex AI Agent Engine
Observação:para uma experiência de desenvolvimento e implantação simplificada baseada em IDE com o Vertex AI Agent Engine, considere o agent-starter-pack. Ele oferece modelos prontos para uso, uma UI integrada para experimentação e simplifica a implantação, as operações, a avaliação, a personalização e a observabilidade.
O fluxo de trabalho para criar um agente no Vertex AI Agent Engine é o seguinte:
Etapas | Descrição |
---|---|
1. configurar o ambiente | Configure o projeto do Google e instale a versão mais recente do SDK da Vertex AI para Python. |
2. Desenvolver um agente | Desenvolva um agente que possa ser implantado no Vertex AI Agent Engine. |
3. Implantar o agente | Implante o agente no ambiente de execução gerenciado do Vertex AI Agent Engine. |
4. Usar o agente | Faça uma consulta ao agente enviando uma solicitação de API. |
5. Gerenciar o agente implantado | Gerencie e exclua os agentes implantados no Vertex AI Agent Engine. |
As etapas estão ilustradas no diagrama a seguir:
Frameworks compatíveis
A tabela a seguir descreve o nível de suporte que o Vertex AI Agent Engine oferece para vários frameworks de agentes:
Nível de suporte | Frameworks de agentes |
---|---|
Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte à implantação no Vertex AI Agent Engine usando seu framework. | CrewAI, frameworks personalizados |
Integração do SDK da Vertex AI: o mecanismo de agente da Vertex AI fornece modelos gerenciados por framework no SDK e na documentação da Vertex AI. | AG2, LlamaIndex |
Integração total: os recursos são integrados para funcionar em todo o framework, no Vertex AI Agent Engine e no ecossistema Google Cloud mais amplo. | Agent Development Kit (ADK), LangChain, LangGraph |
Implantar na produção com o pacote inicial do agente
O Agent Starter Pack é uma coleção de modelos de agentes de IA generativa prontos para produção criados para o Vertex AI Agent Engine. O pacote básico para agentes oferece o seguinte:
- Modelos de agentes pré-criados:ReAct, RAG, multiagente e outros modelos.
- Ambiente interativo: teste e interaja com seu agente.
- Infraestrutura automatizada: usa o Terraform para simplificar o gerenciamento de recursos.
- Pipelines de CI/CD: fluxos de trabalho de implantação automatizada que usam o Cloud Build.
- Observabilidade: suporte integrado ao Cloud Trace e ao Cloud Logging.
Para começar, consulte o Guia de início rápido.
Casos de uso
Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:
Segurança corporativa
O Vertex AI Agent Engine oferece suporte a VPC Service Controls para fortalecer a segurança de dados e reduzir os riscos de exfiltração de dados. Quando o VPC Service Controls está configurado, o agente implantado mantém o acesso seguro a APIs e serviços do Google, como a API BigQuery, a API Cloud SQL Admin e a API Vertex AI, garantindo a operação perfeita no perímetro definido. Os VPC Service Controls bloqueiam de forma eficaz todo o acesso público à Internet, confinando o movimento de dados aos limites da rede autorizada e melhorando significativamente a postura de segurança da sua empresa.
Regiões compatíveis
O Vertex AI Agent Engine tem suporte nas seguintes regiões:
Região | Local | Versões compatíveis |
---|---|---|
us-central1 |
Iowa | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
us-east4 |
Norte da Virgínia | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
us-west1 |
Oregon | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
europe-west1 |
Bélgica | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
europe-west2 |
Londres | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
europe-west3 |
Frankfurt | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
europe-west4 |
Países Baixos | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
europe-southwest1 |
Madri | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
asia-east1 |
Taiwan | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
asia-northeast1 |
Tóquio | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
asia-south1 |
Mumbai | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
asia-southeast1 |
Singapura | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
australia-southeast2 |
Melbourne | O v1 é compatível com os recursos do GA. O v1beta1 tem suporte para recursos de pré-lançamento. |
Cota
As cotas e limites a seguir se aplicam ao Vertex AI Agent Engine para um determinado projeto em cada região.Cota | Valor |
---|---|
Criar/excluir/atualizar o Vertex AI Agent Engine por minuto | 10 |
Consulta/StreamQuery Vertex AI Agent Engine por minuto | 60 |
Número máximo de recursos do Vertex AI Agent Engine | 100 |
Preços
Os preços são baseados nos recursos de computação (horas de vCPU) e memória (horas de GiB) usados pelos agentes implantados no runtime gerenciado do Vertex AI Agent Engine.
Produto | Código SKU | Preço |
---|---|---|
vCPU do ReasoningEngine | 8A55-0B95-B7DC | US$ 0,0994/vCPU-h |
Memória do ReasoningEngine | 0B45-6103-6EC1 | US$ 0,0105/GiB-h |
Para saber mais informações, consulte Preços.