Cette page vous présente les bases de données vectorielles compatibles avec le moteur RAG Vertex AI. Vous pouvez également découvrir comment connecter une base de données vectorielle (magasin de vecteurs) à votre corpus RAG.
Un problème courant avec les LLM est qu'ils ne comprennent pas les connaissances privées, c'est-à-dire les données de votre organisation. Avec le moteur RAG Vertex AI, vous pouvez enrichir le contexte LLM avec des informations privées supplémentaires, car le modèle peut réduire les hallucinations et répondre aux questions plus précisément.
Les bases de données vectorielles jouent un rôle crucial dans la récupération des applications RAG. Les bases de données vectorielles offrent un moyen spécialisé de stocker et d'interroger des embeddings vectoriels, qui sont des représentations mathématiques de texte ou d'autres données qui capturent la signification et les relations sémantiques. Les embeddings vectoriels permettent aux systèmes RAG de trouver rapidement et précisément les informations les plus pertinentes dans une vaste base de connaissances, même lorsqu'ils traitent des requêtes complexes ou nuancées. Lorsqu'elles sont combinées à un modèle d'embedding, les bases de données vectorielles peuvent aider à surmonter les limites des LLM et à fournir des réponses plus précises, pertinentes et complètes.
Bases de données vectorielles compatibles
Lorsque vous créez un corpus RAG, le moteur RAG Vertex AI propose RagManagedDb
comme base de données vectorielle par défaut, qui ne nécessite aucun provisionnement ni gestion supplémentaires. Pour que le moteur RAG Vertex AI crée et gère automatiquement la base de données vectorielle, consultez Créer un corpus RAG.
En plus de l'RagManagedDb
par défaut, le moteur RAG Vertex AI vous permet de provisionner et d'utiliser votre base de données vectorielle dans votre corpus RAG. Dans ce cas, vous êtes responsable du cycle de vie et de la scalabilité de votre base de données vectorielle.
Comparer les options de base de données vectorielle
Ce tableau liste les bases de données vectorielles disponibles dans le moteur RAG de Vertex AI et fournit des liens vers des pages expliquant comment les utiliser dans votre corpus RAG.
Pour identifier la base de données vectorielle qui répond à vos besoins, utilisez ce tableau pour comparer les options de base de données vectorielle:
Base de données vectorielle | Description | Avantages | Inconvénients | Métriques de distance compatibles avec le moteur RAG Vertex AI | Type de recherche | Étape de lancement dans le moteur RAG Vertex AI | Prêt pour la production | Application idéale |
---|---|---|---|---|---|---|---|---|
RagManagedDb (default) |
RagManagedDb est un service de base de données évolutif distribué à l'échelle régionale qui offre une cohérence et une haute disponibilité.RagManagedDb peut être utilisé pour une recherche vectorielle.
|
|
|
cosine |
KNN | Aperçu |
|
|
Vector Search | Vector Search est le service de base de données vectorielle de Vertex AI. Vector Search est optimisé pour les tâches de machine learning et s'intègre à d'autres Google Cloud services. |
|
|
cosine dot-product |
ANN | DG |
|
|
Vertex AI Feature Store | Vertex AI Feature Store est un service géré permettant d'organiser, de stocker et de diffuser des fonctionnalités de machine learning. Vertex AI Feature Store est optimisé pour les tâches de machine learning et s'intègre à d'autres Google Cloud services. |
|
|
cosine dot-product L2 squared |
ANN | Aperçu |
|
|
Weaviate | Weaviate est une base de données vectorielle Open Source axée sur la flexibilité et la modularité. Weaviate est compatible avec différents types de données et offre des fonctionnalités de graphiques intégrées. |
|
|
cosine dot-product L2 squared hamming manhattan |
Compatibilité avec les ANN et la recherche hybride | Aperçu |
|
|
Pignon de pin | Pinecone est une base de données vectorielle cloud native entièrement gérée, conçue pour une recherche de similarité hautes performances. |
|
|
cosine euclidean dot-product |
ANN | DG |
|