Auf dieser Seite werden die Vektordatenbanken vorgestellt, die in der Vertex AI RAG Engine unterstützt werden. Außerdem erfahren Sie, wie Sie eine Vektordatenbank (Vektorspeicher) mit Ihrem RAG-Korpus verbinden.
Vektordatenbanken spielen eine entscheidende Rolle beim Abrufen von Daten für RAG-Anwendungen. Vektordatenbanken bieten eine spezielle Möglichkeit, Vektoreinbettungen zu speichern und abzufragen. Vektoreinbettungen sind mathematische Darstellungen von Text oder anderen Daten, die semantische Bedeutung und Beziehungen erfassen. Vektoreinbettungen ermöglichen es RAG-Systemen, schnell und genau die relevantesten Informationen in einer riesigen Wissensdatenbank zu finden, selbst bei komplexen oder differenzierten Anfragen. In Kombination mit einem Einbettungsmodell können Vektordatenbanken dazu beitragen, die Einschränkungen von LLMs zu überwinden und genauere, relevantere und umfassendere Antworten zu liefern.
Unterstützte Vektordatenbanken
Beim Erstellen eines RAG-Korpus bietet die Vertex AI RAG Engine die unternehmenstaugliche RagManagedDb
als Standardvektordatenbank an, für die keine zusätzliche Bereitstellung oder Verwaltung erforderlich ist.
RagManagedDb
bietet sowohl KNN- als auch ANN-Suchoptionen und ermöglicht den Wechsel zu einem Basic-Tarif für schnelles Prototyping und Experimentieren.
Weitere Informationen zur Auswahl einer Abrufstrategie für RagManagedDb
oder zum Aktualisieren der Stufe finden Sie unter RagManagedDb
mit RAG verwenden. Wenn Sie möchten, dass die Vertex AI RAG Engine die Vektordatenbank automatisch für Sie erstellt und verwaltet, lesen Sie den Hilfeartikel RAG-Korpus erstellen.
Zusätzlich zum Standardmodell RagManagedDb
können Sie mit der Vertex AI-RAG-Engine Ihre Vektordatenbank für die Verwendung in Ihrem RAG-Korpus bereitstellen und einbinden. In diesem Fall sind Sie für den Lebenszyklus und die Skalierbarkeit Ihrer Vektordatenbank verantwortlich.
Optionen für Vektordatenbanken vergleichen
In dieser Tabelle sind die Vektordatenbanken aufgeführt, die in der Vertex AI RAG Engine unterstützt werden. Außerdem finden Sie Links zu Seiten, auf denen erklärt wird, wie Sie sie in Ihrem RAG-Corpus verwenden.
Vektordatenbank | Vorteile | Optimal für | Nachteile | Unterstützte Distanzmesswerte | Suchtyp | Startphase |
---|---|---|---|---|---|---|
RagManagedDb (Standard) ist ein regional verteilter, skalierbarer Datenbankdienst, der sehr hohe Konsistenz und Hochverfügbarkeit bietet und für die Vektorsuche verwendet werden kann.
einfach schnell |
|
|
|
cosine |
KNN (Standard) und ANN | Vorschau |
Vector Search ist der Vektordatenbankdienst in Vertex AI, der für Aufgaben im Bereich maschinelles Lernen optimiert ist. |
|
|
|
cosine dot-product |
ANN | Allgemein verfügbar |
Vertex AI Feature Store ist ein verwalteter Dienst zum Organisieren, Speichern und Bereitstellen von Features für maschinelles Lernen. |
|
|
|
cosine dot-product L2 squared |
ANN | Vorschau |
Weaviate ist eine flexible und modulare Open-Source-Vektordatenbank. |
|
|
|
cosine dot-product L2 squared hamming manhattan |
Unterstützung von ANN + Hybridsuche | Vorschau |
Pinecone ist eine vollständig verwaltete, cloudbasierte Vektordatenbank, die für eine leistungsstarke Ähnlichkeitssuche entwickelt wurde. |
|
|
|
cosine euclidean dot-product |
ANN | Allgemein verfügbar |
Nächste Schritte
- Informationen zum Erstellen eines RAG-Korpus finden Sie unter Beispiel für das Erstellen eines RAG-Korpus.
- Eine Liste aller RAG-Korpora finden Sie im Beispiel zum Auflisten von RAG-Korpora.