Présentation de Vertex AI Agent Engine

Vertex AI Agent Engine (anciennement LangChain sur Vertex AI ou Vertex AI Reasoning Engine) est un ensemble de services qui permet aux développeurs de déployer, de gérer et de faire évoluer des agents IA en production. Agent Engine gère l'infrastructure pour faire évoluer les agents en production, ce qui vous permet de vous concentrer sur la création d'applications. Vertex AI Agent Engine propose les services suivants, que vous pouvez utiliser individuellement ou en combinaison :

  • Environnement d'exécution géré :

    • Déployez et mettez à l'échelle des agents avec un environnement d'exécution géré et des fonctionnalités de gestion de bout en bout.
    • Personnalisez l'image de conteneur de l'agent avec des scripts d'installation au moment de la compilation pour les dépendances système.
    • Utilisez des fonctionnalités de sécurité, y compris la conformité VPC-SC et la configuration de l'authentification et d'IAM.
    • Accédez à des modèles et des outils tels que l'appel de fonction.
    • Déployez des agents créés à l'aide de différents frameworks Python :
  • Gestion du contexte :

    • Sessions (aperçu) : les sessions Agent Engine vous permettent de stocker les interactions individuelles entre les utilisateurs et les agents, ce qui fournit des sources définitives pour le contexte de la conversation.

    • Memory Bank (aperçu) : Memory Bank d'Agent Engine vous permet de stocker et de récupérer des informations à partir de sessions pour personnaliser les interactions avec les agents.

    • Example Store (aperçu) : Example Store vous permet de stocker et de récupérer dynamiquement des exemples few-shot.

  • Qualité et évaluation (aperçu) :

  • Observabilité :

Présentation conceptuelle de Vertex AI Agent Engine

Vertex AI Agent Engine fait partie de Vertex AI Agent Builder, une suite de fonctionnalités permettant de découvrir, de créer et de déployer des agents d'IA.

Créer et déployer sur Vertex AI Agent Engine

Remarque : Pour une expérience de développement et de déploiement basée sur un IDE simplifiée avec Vertex AI Agent Engine, envisagez d'utiliser le pack de démarrage d'agent. Il fournit des modèles prêts à l'emploi, une UI intégrée pour les tests et simplifie le déploiement, les opérations, l'évaluation, la personnalisation et l'observabilité.

Le workflow pour créer un agent sur Vertex AI Agent Engine est le suivant :

Étapes Description
1. Configurer l'environnement Configurez votre projet Google et installez la dernière version du SDK Vertex AI pour Python.
2. Développer un agent Développer un agent pouvant être déployé sur Vertex AI Agent Engine.
3. Déployer l'agent Déployez l'agent sur l'environnement d'exécution géré Vertex AI Agent Engine.
4. Utiliser l'agent Interrogez l'agent en envoyant une requête API.
5. Gérer l'agent déployé Gérez et supprimez les agents que vous avez déployés sur Vertex AI Agent Engine.

Les étapes sont illustrées dans le schéma suivant :

Créer et déployer un agent 

Frameworks compatibles

Le tableau suivant décrit le niveau de compatibilité de Vertex AI Agent Engine avec différents frameworks d'agents :

Niveau d'assistance Frameworks d'agent
Modèle personnalisé : vous pouvez adapter un modèle personnalisé pour prendre en charge le déploiement dans Vertex AI Agent Engine à partir de votre framework. CrewAI, frameworks personnalisés
Intégration du SDK Vertex AI : Vertex AI Agent Engine fournit des modèles gérés par framework dans le SDK Vertex AI et la documentation. AG2, LlamaIndex
Intégration complète : les fonctionnalités sont intégrées pour fonctionner dans le framework, Vertex AI Agent Engine et l'écosystème Google Cloud plus large. Agent Development Kit (ADK), LangChain, LangGraph

Déployer en production avec le Starter Pack d'agent

Le pack de démarrage d'agent est une collection de modèles d'agents d'IA générative prêts pour la production et conçus pour Vertex AI Agent Engine. Le pack de démarrage pour les agents fournit les éléments suivants :

  • Modèles d'agents prédéfinis : ReAct, RAG, multi-agents et autres modèles.
  • Playground interactif : testez votre agent et interagissez avec lui.
  • Infrastructure automatisée : utilise Terraform pour une gestion simplifiée des ressources.
  • Pipelines CI/CD : workflows de déploiement automatisés utilisant Cloud Build.
  • Observabilité : compatibilité intégrée avec Cloud Trace et Cloud Logging.

Pour commencer, consultez le guide de démarrage rapide.

Cas d'utilisation

Pour en savoir plus sur Vertex AI Agent Engine avec des exemples de bout en bout, consultez les ressources suivantes :

Cas d'utilisation Description Liens
Créer des agents en se connectant à des API publiques Convertissez des devises.

Créez une fonction qui se connecte à une application de change de devises pour permettre au modèle de fournir des réponses précises à des requêtes telles que "Quel est le taux de change entre l'euro et le dollar aujourd'hui ?"
Notebook SDK Vertex AI pour Python : présentation de la création et du déploiement d'un agent avec Vertex AI Agent Engine
Concevoir un projet d'énergie solaire communautaire.

 Identifiez des emplacements potentiels, recherchez les fournisseurs et les organismes gouvernementaux concernés, et examinez les images satellite et le potentiel solaire des régions et des bâtiments pour trouver l'emplacement optimal pour installer vos panneaux solaires.
Notebook du SDK Vertex AI pour Python : créer et déployer un agent de l'API Google Maps avec Vertex AI Agent Engine
Créer des agents en se connectant à des bases de données Intégration à AlloyDB et Cloud SQL pour PostgreSQL. Article de blog : annonce de LangChain sur Vertex AI pour AlloyDB et Cloud SQL pour PostgreSQL

Notebook SDK Vertex AI pour Python : déployer une application RAG avec Cloud SQL pour PostgreSQL sur Vertex AI Agent Engine

Notebook SDK Vertex AI pour Python : déployer une application RAG avec AlloyDB pour PostgreSQL sur Vertex AI Agent Engine
Créez des agents avec des outils qui accèdent aux données de votre base de données. Notebook SDK Vertex AI pour Python : déployer un agent avec Vertex AI Agent Engine et la boîte à outils MCP pour les bases de données
Interroger et comprendre des data stores structurés en langage naturel. Notebook SDK Vertex AI pour Python : créer un agent de recherche conversationnel avec Vertex AI Agent Engine et le RAG dans Vertex AI Search
Interroger et comprendre des bases de données orientées graphe en langage naturel Article de blog : GraphRAG GenAI et agents d'IA utilisant Vertex AI Agent Engine avec LangChain et Neo4j
Interroger et comprendre des magasins de vecteurs en langage naturel Article de blog : Simplifier le RAG GenAI avec MongoDB Atlas et Vertex AI Agent Engine
Créer des agents avec Agent Development Kit (preview) Créez et déployez des agents à l'aide d'Agent Development Kit. Kit de développement d'agents : déployer sur Vertex AI Agent Engine
Gérez le contexte avec les sessions Vertex AI Agent Engine et la banque de mémoire en mode Express Vertex AI sans facturation. Kit de développement d'agents : sessions Vertex AI Agent Engine et Memory Bank en mode Express Vertex AI
Créer des agents avec des frameworks OSS Créez et déployez des agents à l'aide du framework Open Source Onetwo. Article de blog : OneTwo et Vertex AI Agent Engine : explorer le développement d'agents d'IA avancée sur Google Cloud
Créer et déployer des agents à l'aide du framework Open Source LangGraph. Notebook SDK Vertex AI pour Python : créer et déployer une application LangGraph avec Vertex AI Agent Engine
Déboguer et optimiser les agents Créer et tracer des agents à l'aide d'OpenTelemetry et de Cloud Trace Notebook SDK Vertex AI pour Python : débogage et optimisation des agents : guide de traçage dans Vertex AI Agent Engine

Sécurité d'entreprise

Vertex AI Agent Engine est compatible avec VPC Service Controls pour renforcer la sécurité des données et limiter les risques d'exfiltration de données. Lorsque VPC Service Controls est configuré, l'agent déployé conserve un accès sécurisé aux API et services Google, tels que les API BigQuery, API Cloud SQL Admin et Vertex AI, ce qui garantit un fonctionnement fluide dans le périmètre que vous avez défini. De manière essentielle, VPC Service Controls bloque efficacement tout accès à l'Internet public, limitant le transfert de données aux limites de votre réseau autorisé et améliorant considérablement la sécurité de votre entreprise.

Régions où le service est disponible

Vertex AI Agent Engine est disponible dans les régions suivantes :

Région Emplacement Versions compatibles
us-central1 Iowa v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
us-east4 Virginie du Nord v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
us-west1 Oregon v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
europe-west1 Belgique v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
europe-west2 Londres v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
europe-west3 Francfort v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
europe-west4 Pays-Bas v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
europe-southwest1 Madrid v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
asia-east1 Taïwan v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
asia-northeast1 Tokyo v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
asia-south1 Mumbai v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
asia-southeast1 Singapour v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.
australia-southeast2 Melbourne v1 est accepté pour les fonctionnalités en disponibilité générale. v1beta1 est compatible avec les fonctionnalités en version preview.

Pour la mémoire Agent Engine (aperçu), les régions suivantes sont acceptées :

Région Emplacement Versions compatibles
us-central1 Iowa La version v1beta1 est compatible.

Quota

Les limites suivantes s'appliquent à Vertex AI Agent Engine pour un projet donné dans chaque région :
Description Limite
Créer, supprimer ou mettre à jour Vertex AI Agent Engine par minute 10
Créer, supprimer ou mettre à jour des sessions Vertex AI Agent Engine par minute 100
Créer, supprimer ou mettre à jour des sessions Vertex AI Agent Engine par minute 100
Query ou StreamQuery Vertex AI Agent Engine par minute 60
Ajouter un événement aux sessions Vertex AI Agent Engine par minute 100
Nombre maximal de ressources Vertex AI Agent Engine 100
Créer, supprimer ou mettre à jour des ressources de mémoire Vertex AI Agent Engine par minute 100
Obtenir, lister ou récupérer des données de la Memory Bank Vertex AI Agent Engine par minute 300

Tarifs

Les tarifs sont basés sur les ressources de calcul (heures de vCPU) et de mémoire (heures de GiB) utilisées par les agents déployés dans l'environnement d'exécution géré Vertex AI Agent Engine.

Produit ID du SKU Prix
vCPU ReasoningEngine 8A55-0B95-B7DC 0,0994 $/vCPU-H
Mémoire ReasoningEngine 0B45-6103-6EC1 0,0105 $ par Gio/h

Pour en savoir plus, reportez-vous à la page Tarifs.

Étapes suivantes