O Vertex AI Agent Engine (antigo LangChain na Vertex AI ou Vertex AI Reasoning Engine) é um serviço Google Cloud totalmente gerenciado que permite que os desenvolvedores implantem, gerenciem e escalonem agentes de IA na produção. O Agente Engine processa a infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos inteligentes e eficazes. O Vertex AI Agent Engine oferece:
Totalmente gerenciado: implante e dimensione agentes com um ambiente de execução gerenciado que oferece recursos de segurança robustos, incluindo conformidade com o VPC-SC e recursos abrangentes de gerenciamento de ponta a ponta. Ganhe acesso CRUD a aplicativos multiagente que usam o Google Cloud Trace (com suporte ao OpenTelemetry) para monitoramento de desempenho e rastreamento. Para saber mais, consulte implantar um agente.
Qualidade e avaliação: garanta a qualidade do agente com o serviço de avaliação de IA generativa integrado.
Desenvolvimento simplificado: o Vertex AI Agent Engine abstrai tarefas de baixo nível, como desenvolvimento de servidor de aplicativos e configuração de autenticação e IAM, permitindo que você se concentre nos recursos exclusivos do agente, como comportamento, ferramentas e parâmetros de modelo. Além disso, seus agentes podem usar qualquer um dos modelos e ferramentas, como a chamada de função, na Vertex AI.
Independência de framework: tenha flexibilidade ao implantar agentes que você cria usando diferentes frameworks do Python, incluindo LangGraph, Langchain, AG2 e CrewAI. Se você já tem um agente, é possível adaptá-lo para execução no Vertex AI Agent Engine usando o modelo personalizado no nosso SDK. Caso contrário, você pode desenvolver um agente do zero usando um dos modelos específicos do framework que fornecemos.
Criar e implantar no Vertex AI Agent Engine
Observação:para uma experiência de desenvolvimento e implantação simplificada baseada em IDE com o Vertex AI Agent Engine, considere o agent-starter-pack. Ele oferece modelos prontos para uso, uma interface integrada para experimentação e simplifica a implantação, as operações, a avaliação, a personalização e a observabilidade.
O fluxo de trabalho para criar um agente na Vertex AI Agent Engine é o seguinte:
Etapas | Descrição |
---|---|
1. configurar o ambiente | Configure o projeto do Google e instale a versão mais recente do SDK da Vertex AI para Python. |
2. Desenvolver um agente | Desenvolva um agente que possa ser implantado no Vertex AI Agent Engine. |
3. Implantar o agente | Implante o agente no ambiente de execução gerenciado do Vertex AI Agent Engine. |
4. Usar o agente | Faça uma consulta ao agente enviando uma solicitação de API. |
5. Gerenciar o agente implantado | Gerencie e exclua os agentes que você implantou no Vertex AI Agent Engine. |
As etapas estão ilustradas no diagrama a seguir:
Casos de uso
Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:
Segurança corporativa
O Vertex AI Agent Engine oferece suporte a VPC Service Controls para fortalecer a segurança de dados e reduzir os riscos de exfiltração de dados. Quando o VPC Service Controls está configurado, o agente implantado mantém o acesso seguro a APIs e serviços do Google, como a API BigQuery, a API Cloud SQL Admin e a API Vertex AI, garantindo a operação perfeita no perímetro definido. Os VPC Service Controls bloqueiam de forma eficaz todo o acesso público à Internet, confinando o movimento de dados aos limites autorizados da rede e melhorando significativamente a postura de segurança da empresa.
Regiões compatíveis
O Vertex AI Agent Engine tem suporte nas seguintes regiões:
Região | Local | Descrição | Etapa do lançamento |
---|---|---|---|
us-central1 |
Iowa | As versões v1 e v1beta1 são compatíveis. |
GA |
us-west1 |
Oregon | As versões v1 e v1beta1 são compatíveis. |
GA |
europe-west1 |
Bélgica | As versões v1 e v1beta1 são compatíveis. |
GA |
europe-southwest1 |
Madri | As versões v1 e v1beta1 são compatíveis. |
GA |
asia-east1 |
Taiwan | As versões v1 e v1beta1 são compatíveis. |
GA |
asia-northeast1 |
Tóquio | As versões v1 e v1beta1 são compatíveis. |
GA |
Cota
As cotas e limites a seguir se aplicam ao Vertex AI Agent Engine para um determinado projeto em cada região.Cota | Valor |
---|---|
Criar/excluir/atualizar o Vertex AI Agent Engine por minuto | 10 |
Motor de agente da Vertex AI Query/StreamQuery por minuto | 60 |
Número máximo de recursos do Vertex AI Agent Engine | 100 |
Preços
Os preços são baseados nos recursos de computação (horas de vCPU) e memória (horas de GiB) usados pelos agentes implantados no runtime gerenciado do Vertex AI Agent Engine.
Produto | ID da SKU | Preço |
---|---|---|
vCPU do ReasoningEngine | 8A55-0B95-B7DC | US$ 0,0994/vCPU-hr |
Memória do ReasoningEngine | 0B45-6103-6EC1 | US$ 0,0105/GiB-h |
Para saber mais informações, consulte Preços.