Comprendre RagManagedDb

Cette page vous présente RagManagedDb, sa technologie sous-jacente et son utilisation dans le moteur RAG Vertex AI.RagManagedDb Cette page décrit également les différents niveaux disponibles pour ajuster les performances, ce qui peut avoir un impact sur vos coûts. Elle fournit également des instructions pour supprimer vos données Vertex AI RAG Engine, ce qui arrête la facturation.

Présentation

Le moteur RAG Vertex AI utilise RagManagedDb, une instance Google Spanner entièrement gérée et adaptée aux entreprises, qui est utilisée pour le stockage des ressources par le moteur RAG Vertex AI et qui peut éventuellement être utilisée comme base de données vectorielle de votre choix pour vos corpus RAG.

Grâce à Spanner, le moteur RAG Vertex AI offre une base de données cohérente, disponibilité élevée et évolutive pour prendre en charge votre application. Pour en savoir plus sur Google Spanner, consultez Spanner.

Le moteur RAG Vertex AI stocke les métadonnées de votre corpus RAG et de votre ressource de fichier RAG dans RagManagedDb, quel que soit votre choix de base de données vectorielle. Les bases de données vectorielles ne sont utilisées que pour le stockage et la récupération des embeddings. En plus du stockage des ressources, RagManagedDb peut également être utilisé pour stocker et gérer les représentations vectorielles de vos documents. La base de données vectorielle est ensuite utilisée pour récupérer les documents pertinents en fonction de leur similarité sémantique avec une requête donnée.

Gérer les niveaux

Le moteur RAG Vertex AI vous permet de faire évoluer votre instance RagManagedDb en fonction de vos besoins en termes d'utilisation et de performances en choisissant l'un des deux niveaux. Il vous permet également de supprimer vos données de moteur RAG Vertex AI à l'aide d'un troisième niveau.

Le niveau est un paramètre au niveau du projet disponible dans la ressource RagEngineConfig qui a un impact sur les corpus RAG utilisant RagManagedDb. Les niveaux suivants sont disponibles dans RagEngineConfig :

  • Niveau avec scaling : ce niveau offre des performances à l'échelle de la production ainsi qu'une fonctionnalité d'autoscaling. Il convient aux clients disposant de grandes quantités de données ou de charges de travail sensibles aux performances. En interne, ce niveau définit l'instance Spanner sur une configuration d'autoscaling avec un minimum de 1 nœud (1 000 unités de traitement) et un maximum de 10 nœuds (10 000 unités de traitement).

  • Niveau de base (par défaut) : ce niveau est économique et offre une faible puissance de calcul. Il peut convenir dans les cas suivants :

    • Tester RagManagedDb
    • Taille des données réduite.
    • Charge de travail insensible à la latence.
    • Utilisez le moteur RAG Vertex AI uniquement avec d'autres bases de données vectorielles.

    Pour proposer le niveau de base, RagManagedDb définit l'instance Spanner sous-jacente sur une configuration fixe de 100 unités de traitement, ce qui équivaut à 0,1 nœud.

  • Niveau non provisionné : ce niveau supprime le RagManagedDb et son instance Spanner sous-jacente. Le niveau "Non provisionné" désactive le service Vertex AI RAG Engine et supprime les données qu'il contient, quelle que soit la base de données vectorielle utilisée pour votre RagCorpora. La facturation du service est alors interrompue. Pour en savoir plus sur la facturation, consultez Facturation du moteur RAG de Vertex AI.

    Une fois les données supprimées, vous ne pourrez plus les récupérer. Pour recommencer à utiliser le moteur RAG Vertex AI, vous devez modifier le niveau en appelant l'API UpdateRagEngineConfig.

Obtenir la configuration du projet

Les exemples de code suivants montrent comment utiliser l'API GetRagEngineConfig pour chaque type de niveau :

Mettre à jour la configuration du projet

Les exemples de code suivants montrent comment utiliser l'API UpdateRagEngineConfig pour chaque type de niveau :

Étapes suivantes