Cette page vous présente RagManagedDb
, sa technologie sous-jacente et son utilisation dans le moteur RAG Vertex AI.RagManagedDb
Cette page décrit également les différents niveaux disponibles pour ajuster les performances, ce qui peut avoir un impact sur vos coûts. Elle fournit également des instructions pour supprimer vos données Vertex AI RAG Engine, ce qui arrête la facturation.
Présentation
Le moteur RAG Vertex AI utilise RagManagedDb
, une instance Google Spanner entièrement gérée et adaptée aux entreprises, qui est utilisée pour le stockage des ressources par le moteur RAG Vertex AI et qui peut éventuellement être utilisée comme base de données vectorielle de votre choix pour vos corpus RAG.
Grâce à Spanner, le moteur RAG Vertex AI offre une base de données cohérente, disponibilité élevée et évolutive pour prendre en charge votre application. Pour en savoir plus sur Google Spanner, consultez Spanner.
Le moteur RAG Vertex AI stocke les métadonnées de votre corpus RAG et de votre ressource de fichier RAG dans RagManagedDb
, quel que soit votre choix de base de données vectorielle. Les bases de données vectorielles ne sont utilisées que pour le stockage et la récupération des embeddings. En plus du stockage des ressources, RagManagedDb
peut également être utilisé pour stocker et gérer les représentations vectorielles de vos documents. La base de données vectorielle est ensuite utilisée pour récupérer les documents pertinents en fonction de leur similarité sémantique avec une requête donnée.
Gérer les niveaux
Le moteur RAG Vertex AI vous permet de faire évoluer votre instance RagManagedDb
en fonction de vos besoins en termes d'utilisation et de performances en choisissant l'un des deux niveaux. Il vous permet également de supprimer vos données de moteur RAG Vertex AI à l'aide d'un troisième niveau.
Le niveau est un paramètre au niveau du projet disponible dans la ressource RagEngineConfig
qui a un impact sur les corpus RAG utilisant RagManagedDb
. Les niveaux suivants sont disponibles dans RagEngineConfig
:
Niveau avec scaling : ce niveau offre des performances à l'échelle de la production ainsi qu'une fonctionnalité d'autoscaling. Il convient aux clients disposant de grandes quantités de données ou de charges de travail sensibles aux performances. En interne, ce niveau définit l'instance Spanner sur une configuration d'autoscaling avec un minimum de 1 nœud (1 000 unités de traitement) et un maximum de 10 nœuds (10 000 unités de traitement).
Niveau de base (par défaut) : ce niveau est économique et offre une faible puissance de calcul. Il peut convenir dans les cas suivants :
- Tester
RagManagedDb
- Taille des données réduite.
- Charge de travail insensible à la latence.
- Utilisez le moteur RAG Vertex AI uniquement avec d'autres bases de données vectorielles.
Pour proposer le niveau de base,
RagManagedDb
définit l'instance Spanner sous-jacente sur une configuration fixe de 100 unités de traitement, ce qui équivaut à 0,1 nœud.- Tester
Niveau non provisionné : ce niveau supprime le
RagManagedDb
et son instance Spanner sous-jacente. Le niveau "Non provisionné" désactive le service Vertex AI RAG Engine et supprime les données qu'il contient, quelle que soit la base de données vectorielle utilisée pour votreRagCorpora
. La facturation du service est alors interrompue. Pour en savoir plus sur la facturation, consultez Facturation du moteur RAG de Vertex AI.Une fois les données supprimées, vous ne pourrez plus les récupérer. Pour recommencer à utiliser le moteur RAG Vertex AI, vous devez modifier le niveau en appelant l'API
UpdateRagEngineConfig
.
Obtenir la configuration du projet
Les exemples de code suivants montrent comment utiliser l'API GetRagEngineConfig
pour chaque type de niveau :
Exemples de code de l'API version 1 (v1).
Exemples de code de l'API v1beta1.
Mettre à jour la configuration du projet
Les exemples de code suivants montrent comment utiliser l'API UpdateRagEngineConfig
pour chaque type de niveau :
Version 1 (v1) : exemples de code d'API.
Exemples de code d'API v1beta1.
Étapes suivantes
- Pour savoir comment utiliser l'API RAG v1 (par défaut), consultez API RAG v1.
- Pour savoir comment utiliser l'API RAG v1beta1, consultez API RAG v1beta1.
- Pour en savoir plus sur
RagManagedDb
et sur la façon de gérer la configuration de votre niveau ainsi que la stratégie de récupération au niveau du corpus RAG, consultez Utiliser RagManagedDb avec le moteur RAG Vertex AI.