Vertex AI Agent Engine (antes conocido como LangChain en Vertex AI o Vertex AI Reasoning Engine) es un conjunto de servicios que permite a los desarrolladores implementar, administrar y escalar agentes de IA en producción. Agent Engine administra la infraestructura para escalar agentes en producción, de modo que puedas enfocarte en crear aplicaciones. Vertex AI Agent Engine ofrece los siguientes servicios que puedes usar de forma individual o combinada:
Entorno de ejecución administrado:
- Implementa y escala agentes con un entorno de ejecución administrado y capacidades de administración de extremo a extremo.
- Personaliza la imagen del contenedor del agente con secuencias de comandos de instalación en tiempo de compilación para las dependencias del sistema.
- Usa funciones de seguridad, como el cumplimiento de VPC-SC y la configuración de la autenticación y de IAM.
- Acceder a modelos y herramientas, como la llamada a función
- Implementa agentes creados con diferentes frameworks de Python:
Administración de contexto:
Sesiones (versión preliminar): Las sesiones de Agent Engine te permiten almacenar interacciones individuales entre usuarios y agentes, lo que proporciona fuentes definitivas para el contexto de la conversación.
Banco de memoria (versión preliminar): El Banco de memoria de Agent Engine te permite almacenar y recuperar información de las sesiones para personalizar las interacciones del agente.
Example Store (vista previa): Example Store te permite almacenar y recuperar dinámicamente varios ejemplos.
Calidad y evaluación (vista previa):
- Evalúa la calidad del agente con el servicio de evaluación de IA generativa integrado.
- Mejora el rendimiento del agente con Example Store.
- Optimiza los agentes con ejecuciones de entrenamiento de modelos de Gemini.
Observabilidad:
- Comprende el comportamiento del agente con Google Cloud Trace (compatible con OpenTelemetry), Cloud Monitoring y Cloud Logging.
Vertex AI Agent Engine es parte de Vertex AI Agent Builder, un conjunto de funciones para descubrir, crear y, luego, implementar agentes de IA.
Crea e implementa en Vertex AI Agent Engine
Nota: Para una experiencia de desarrollo y de implementación basada en IDE optimizada con Vertex AI Agent Engine, considera el agent-starter-pack. Proporciona plantillas listas para usar, una IU integrada para la experimentación y simplifica la implementación, las operaciones, la evaluación, la personalización y la observabilidad.
El flujo de trabajo para compilar un agente en Vertex AI Agent Engine es el siguiente:
Pasos | Descripción |
---|---|
1. Configura el entorno | Configura tu proyecto de Google e instala la versión más reciente del SDK de Vertex AI para Python. |
2. Desarrolla un agente | Desarrolla un agente que se pueda implementar en Vertex AI Agent Engine. |
3. Implementa el agente | Implementa el agente en el entorno de ejecución administrado de Vertex AI Agent Engine. |
4. Cómo usar el agente | Envía una solicitud a la API para consultar al agente. |
5. Administra el agente implementado | Administra y borra los agentes que implementaste en Vertex AI Agent Engine. |
Los pasos se ilustran en el siguiente diagrama:
Frameworks compatibles
En la siguiente tabla, se describe el nivel de compatibilidad que proporciona Vertex AI Agent Engine para varios frameworks de agentes:
Nivel de asistencia | Frameworks de agentes |
---|---|
Plantilla personalizada: Puedes adaptar una plantilla personalizada para admitir la implementación en Vertex AI Agent Engine desde tu framework. | CrewAI, marcos personalizados |
Integración del SDK de Vertex AI: Vertex AI Agent Engine proporciona plantillas administradas por framework en el SDK y la documentación de Vertex AI. | AG2, LlamaIndex |
Integración completa: Las funciones se integran para trabajar en todo el framework, Vertex AI Agent Engine y el ecosistema Google Cloud más amplio. | Agent Development Kit (ADK), LangChain, LangGraph |
Implementa en producción con el paquete inicial de agentes
El paquete de inicio de agentes es una colección de plantillas de agentes de IA generativa listas para producción creadas para Vertex AI Agent Engine. El paquete de inicio del agente proporciona lo siguiente:
- Plantillas de agentes prediseñadas: ReAct, RAG, multiagente y otras plantillas.
- Zona de pruebas interactiva: Prueba tu agente e interactúa con él.
- Infraestructura automatizada: Usa Terraform para optimizar la administración de recursos.
- Canalizaciones de CI/CD: Flujos de trabajo de implementación automatizados que aprovechan Cloud Build.
- Observabilidad: Compatibilidad integrada con Cloud Trace y Cloud Logging.
Para comenzar, consulta la Guía de inicio rápido.
Casos de uso
Para obtener información sobre Vertex AI Agent Engine con ejemplos de extremo a extremo, consulta los siguientes recursos:
Seguridad empresarial
Vertex AI Agent Engine admite los Controles del servicio de VPC para fortalecer la seguridad de los datos y mitigar los riesgos de robo de datos. Cuando se configuran los Controles del servicio de VPC, el agente implementado conserva el acceso seguro a las APIs y los servicios de Google, como la API de BigQuery, la API de Cloud SQL Admin y la API de Vertex AI, lo que verifica el funcionamiento sin problemas dentro del perímetro definido. Fundamentalmente, los Controles del servicio de VPC bloquean de manera eficaz todo el acceso a Internet público, lo que limita el movimiento de datos a los límites de la red autorizada y mejora significativamente el nivel de seguridad de tu empresa.
Regiones admitidas
Vertex AI Agent Engine es compatible con las siguientes regiones:
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
us-east4 |
Virginia del Norte | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
us-west1 |
Oregón | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west1 |
Bélgica | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west2 |
Londres | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west3 |
Fráncfort | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west4 |
Países Bajos | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-southwest1 |
Madrid | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-east1 |
Taiwán | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-northeast1 |
Tokio | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-south1 |
Bombay | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-southeast1 |
Singapur | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
australia-southeast2 |
Melbourne | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
Para Agent Engine Memory Bank (vista previa), se admiten las siguientes regiones:
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | Se admite la versión v1beta1 . |
Cuota
Los siguientes límites se aplican a Vertex AI Agent Engine para un proyecto determinado en cada región:Descripción | Límite |
---|---|
Crear, borrar o actualizar Vertex AI Agent Engine por minuto | 10 |
Crear, borrar o actualizar sesiones de Vertex AI Agent Engine por minuto | 100 |
Crear, borrar o actualizar sesiones de Vertex AI Agent Engine por minuto | 100 |
Query o StreamQuery Vertex AI Agent Engine por minuto |
60 |
Eventos de anexión a las sesiones de Vertex AI Agent Engine por minuto | 100 |
Cantidad máxima de recursos de Vertex AI Agent Engine | 100 |
Crear, borrar o actualizar recursos de memoria de Vertex AI Agent Engine por minuto | 100 |
Obtener, enumerar o recuperar información del banco de memoria de Vertex AI Agent Engine por minuto | 300 |
Precios
Los precios se basan en los recursos de procesamiento (horas de CPU virtual) y memoria (horas de GiB) que usan los agentes implementados en el entorno de ejecución administrado de Vertex AI Agent Engine.
Producto | ID de SKU | Precio |
---|---|---|
CPU virtual de ReasoningEngine | 8A55-0B95-B7DC | USD 0.0994 por CPU virtual y hora |
Memoria de ReasoningEngine | 0B45-6103-6EC1 | USD 0.0105 por GiB-hora |
Para obtener más información, consulta Precios.