Vertex AI Agent Engine (anteriormente conocido como LangChain en Vertex AI o Vertex AI Reasoning Engine) es un Google Cloud servicio completamente administrado que permite a los desarrolladores implementar, administrar y escalar agentes de IA en producción. Agent Engine controla la infraestructura para escalar agentes en producción, de modo que puedas enfocarte en crear aplicaciones inteligentes y eficaces. Vertex AI Agent Engine ofrece lo siguiente:
Completamente administrado: Implementa y escala agentes con un entorno de ejecución administrado que proporciona funciones de seguridad sólidas, como el cumplimiento de VPC-SC y capacidades de administración de extremo a extremo integrales. Obtén acceso de CRUD a las aplicaciones de varios agentes que usan Google Cloud Trace (compatible con OpenTelemetry) para la supervisión del rendimiento y el registro. Para obtener más información, consulta Cómo implementar un agente.
Calidad y evaluación: Garantiza la calidad de los agentes con el servicio Gen AI Evaluation integrado.
Desarrollo simplificado: Vertex AI Agent Engine abstrae las tareas de bajo nivel, como el desarrollo del servidor de aplicaciones y la configuración de la autenticación y el IAM, lo que te permite enfocarte en las capacidades únicas de tu agente, como su comportamiento, sus herramientas y los parámetros del modelo. Además, tus agentes pueden usar cualquiera de los modelos y herramientas, como las llamadas a función, en Vertex AI.
Independiente de frameworks: Disfruta de flexibilidad cuando implementes agentes que compilas con diferentes frameworks de Python, incluidos Agent Development Kit, LangGraph, Langchain, AG2 y LlamaIndex. Si ya tienes un agente existente, puedes adaptarlo para que se ejecute en Vertex AI Agent Engine con la plantilla personalizada de nuestro SDK. De lo contrario, puedes desarrollar un agente desde cero con una de las plantillas específicas del framework que proporcionamos.
Vertex AI Agent Engine forma parte de Vertex AI Agent Builder, un paquete de funciones para descubrir, crear e implementar agentes de IA.
Crea e implementa en Vertex AI Agent Engine
Nota: Para obtener una experiencia de desarrollo y de implementación optimizada y basada en IDE con Vertex AI Agent Engine, considera el kit de partida de agentes. Proporciona plantillas listas para usar, una IU integrada para la experimentación y simplifica la implementación, las operaciones, la evaluación, la personalización y la observabilidad.
El flujo de trabajo para crear un agente en Vertex AI Agent Engine es el siguiente:
Pasos | Descripción |
---|---|
1. Configura el entorno | Configura tu proyecto de Google e instala la versión más reciente del SDK de Vertex AI para Python. |
2. Desarrolla un agente | Desarrollar un agente que se pueda implementar en Vertex AI Agent Engine |
3. Implementa el agente | Implementa el agente en el entorno de ejecución administrado de Vertex AI Agent Engine. |
4. Cómo usar el agente | Envía una solicitud a la API para consultar al agente. |
5. Administra el agente implementado | Administra y borra los agentes que implementaste en Vertex AI Agent Engine. |
Los pasos se ilustran en el siguiente diagrama:
Frameworks compatibles
En la siguiente tabla, se describe el nivel de compatibilidad que proporciona Vertex AI Agent Engine para varios frameworks de agentes:
Nivel de asistencia | Frameworks de agentes |
---|---|
Plantilla personalizada: Puedes adaptar una plantilla personalizada para admitir la implementación en Vertex AI Agent Engine desde tu framework. | CrewAI, frameworks personalizados |
Integración del SDK de Vertex AI: Vertex AI Agent Engine proporciona plantillas administradas por framework en el SDK y la documentación de Vertex AI. | AG2, LlamaIndex |
Integración completa: Las funciones se integran para funcionar en todo el framework, el motor de agentes de Vertex AI y el ecosistema Google Cloud más amplio. | Kit de desarrollo de agentes (ADK), LangChain y LangGraph |
Casos de uso
Para obtener información sobre Vertex AI Agent Engine con ejemplos de extremo a extremo, consulta los siguientes recursos:
Seguridad empresarial
El motor de agentes de Vertex AI admite los Controles del servicio de VPC para fortalecer la seguridad de los datos y mitigar los riesgos de robo de datos. Cuando se configuran los Controles del servicio de VPC, el agente implementado retiene el acceso seguro a las APIs y los servicios de Google, como la API de BigQuery, la API de Administrador de Cloud SQL y la API de Vertex AI, lo que garantiza un funcionamiento sin problemas dentro del perímetro definido. De manera fundamental, los Controles del servicio de VPC bloquean de forma eficaz todo el acceso a Internet público, confinan el movimiento de datos a los límites de tu red autorizada y mejoran significativamente tu postura de seguridad empresarial.
Regiones admitidas
Vertex AI Agent Engine es compatible con las siguientes regiones:
Región | Ubicación | Descripción | Etapa de lanzamiento |
---|---|---|---|
us-central1 |
Iowa | Se admiten las versiones v1 y v1beta1 . |
DG |
us-west1 |
Oregón | Se admiten las versiones v1 y v1beta1 . |
DG |
europe-west1 |
Bélgica | Se admiten las versiones v1 y v1beta1 . |
DG |
europe-southwest1 |
Madrid | Se admiten las versiones v1 y v1beta1 . |
DG |
asia-east1 |
Taiwán | Se admiten las versiones v1 y v1beta1 . |
DG |
asia-northeast1 |
Tokio | Se admiten las versiones v1 y v1beta1 . |
DG |
Cuota
Los siguientes límites y cuotas se aplican a Vertex AI Agent Engine para un proyecto determinado en cada región.Cuota | Valor |
---|---|
Crea, borra o actualiza Vertex AI Agent Engine por minuto | 10 |
Motor de agentes de Query/StreamQuery de Vertex AI por minuto | 60 |
Cantidad máxima de recursos de Vertex AI Agent Engine | 100 |
Precios
Los precios se basan en los recursos de procesamiento (horas de CPU virtual) y memoria (horas de GiB) que usan los agentes que se implementan en el entorno de ejecución administrado de Vertex AI Agent Engine.
Producto | ID de SKU | Precio |
---|---|---|
CPU virtual de ReasoningEngine | 8A55-0B95-B7DC | USD 0.0994 por vCPU-hora |
Memoria de ReasoningEngine | 0B45-6103-6EC1 | USD 0.0105 por GiB-h |
Para obtener más información, consulta Precios.