Diese Seite wurde von der Cloud Translation API übersetzt.

Vektordatenbanken in der Vertex AI RAG Engine

Auf dieser Seite werden die Vektordatenbanken vorgestellt, die in der Vertex AI RAG Engine unterstützt werden. Außerdem erfahren Sie, wie Sie eine Vektordatenbank (Vektorspeicher) mit Ihrem RAG-Korpus verbinden.

Vektordatenbanken spielen eine entscheidende Rolle beim Abrufen von Informationen für RAG-Anwendungen. Vektordatenbanken bieten eine spezielle Möglichkeit, Vektoreinbettungen zu speichern und abzufragen. Vektoreinbettungen sind mathematische Darstellungen von Text oder anderen Daten, die semantische Bedeutung und Beziehungen erfassen. Vektoreinbettungen ermöglichen es RAG-Systemen, schnell und genau die relevantesten Informationen in einer riesigen Wissensdatenbank zu finden, selbst bei komplexen oder differenzierten Anfragen. In Kombination mit einem Einbettungsmodell können Vektordatenbanken dazu beitragen, die Einschränkungen von LLMs zu überwinden und genauere, relevantere und umfassendere Antworten zu liefern.

Unterstützte Vektordatenbanken

Beim Erstellen eines RAG-Korpus bietet die Vertex AI RAG Engine die unternehmenstaugliche RagManagedDb als Standardvektordatenbank an, für die keine zusätzliche Bereitstellung oder Verwaltung erforderlich ist. RagManagedDb bietet sowohl KNN- als auch ANN-Suchoptionen und ermöglicht den Wechsel zu einem Basic-Tarif für schnelles Prototyping und Experimentieren. Weitere Informationen zur Auswahl einer Abrufstrategie für RagManagedDb oder zum Aktualisieren der Stufe finden Sie unter RagManagedDb mit RAG verwenden. Wenn Sie möchten, dass die Vertex AI RAG Engine die Vektordatenbank automatisch für Sie erstellt und verwaltet, lesen Sie den Hilfeartikel RAG-Korpus erstellen.

Zusätzlich zum Standardmodell RagManagedDb können Sie mit der Vertex AI RAG Engine Ihre Vektordatenbank für die Verwendung in Ihrem RAG-Korpus bereitstellen und verwenden. In diesem Fall sind Sie für den Lebenszyklus und die Skalierbarkeit Ihrer Vektordatenbank verantwortlich.

Optionen für Vektordatenbanken vergleichen

In dieser Tabelle sind die Vektordatenbanken aufgeführt, die in der Vertex AI RAG Engine unterstützt werden. Außerdem finden Sie Links zu Seiten, auf denen erklärt wird, wie Sie sie in Ihrem RAG-Korpus verwenden.

Vektordatenbank	Vorteile	Optimal für	Nachteile	Unterstützte Distanzmesswerte	Suchtyp	Startphase
`RagManagedDb` (Standard) ist ein regional verteilter, skalierbarer Datenbankdienst, der sehr hohe Konsistenz und Hochverfügbarkeit bietet und für die Vektorsuche verwendet werden kann. einfach schnell	Keine Einrichtung erforderlich. Gut geeignet für Anwendungsfälle im großen und kleinen Maßstab. Sehr hohe Konsistenz. Hochverfügbarkeit. Niedrige Latenz. Hervorragend für Transaktionsarbeitslasten geeignet. CMEK aktiviert.	Dokumente mit hohem Umfang erstellen. RAG für Unternehmen entwickeln Entwicklung eines schnellen Proof of Concept. Geringer Bereitstellungs- und Wartungsaufwand. Verwendung mit Chatbots RAG-Anwendungen erstellen	Für einen optimalen Recall muss der Index für die ANN-Funktion nach größeren Änderungen an Ihren Daten neu erstellt werden.	`cosine`	KNN (Standard) und ANN	Allgemein verfügbar
Die Vektorsuche ist der Vektordatenbankdienst in Vertex AI, der für Aufgaben im Bereich maschinelles Lernen optimiert ist.	Lässt sich in andere Google Cloud -Dienste einbinden. Skalierbarkeit und Zuverlässigkeit werden durch die Google Cloud Infrastruktur unterstützt. Es wird ein „Pay as you go“-Preismodell verwendet.	Dokumente mit hohem Umfang erstellen. RAG für Unternehmen entwickeln Verwaltung der Vektordatenbankinfrastruktur. Bestehende Google Cloud Kunden oder Nutzer, die mehrere Google Cloud Dienste verwenden möchten.	Aktualisierungen werden nicht sofort angezeigt. Anbieterabhängigkeit von Google Cloud. Je nach Anwendungsfall kann es teurer sein.	`cosine` `dot-product`	ANN	Allgemein verfügbar
Vertex AI Feature Store ist ein verwalteter Dienst zum Organisieren, Speichern und Bereitstellen von Features für maschinelles Lernen.	Integration mit Vertex AI und anderen Google Cloud -Diensten. Skalierbarkeit und Zuverlässigkeit werden durch die Google Cloud Infrastruktur unterstützt. Es wird die vorhandene BigQuery-Infrastruktur genutzt.	Dokumente mit hohem Umfang erstellen. RAG für Unternehmen entwickeln Verwaltung der Vektordatenbankinfrastruktur. Bestandskunden Google Cloud oder Kunden, die mehrere Google Cloud Dienste nutzen möchten.	Änderungen sind erst nach einer manuellen Synchronisierung im Onlineshop verfügbar. Anbieterabhängigkeit von Google Cloud.	`cosine` `dot-product` `L2 squared`	ANN	Vorschau
Weaviate ist eine flexible und modulare Open-Source-Vektordatenbank.	Unterstützt verschiedene Datentypen und bietet integrierte Diagrammfunktionen. Open Source und eine aktive Community Äußerst flexibel und anpassbar. Unterstützt verschiedene Datentypen und Module für unterschiedliche Modalitäten wie Text und Bilder. Sie können zwischen Cloud-Anbietern wie Google Cloud, AWS und Azure wählen.	Dokumente mit hohem Umfang erstellen. RAG für Unternehmen entwickeln Verwaltung der Vektordatenbankinfrastruktur. Bestandskunden von Weaviate	Aktualisierungen werden nicht sofort angezeigt. Die Einrichtung und Verwaltung kann komplexer sein. Die Leistung kann je nach Konfiguration variieren.	`cosine` `dot-product` `L2 squared` `hamming` `manhattan`	Unterstützung von ANN und Hybridsuche	Vorschau
Pinecone ist eine vollständig verwaltete, cloudbasierte Vektordatenbank, die für eine leistungsstarke Ähnlichkeitssuche entwickelt wurde.	Schneller Einstieg Hervorragende Skalierbarkeit und Leistung. Konzentrieren Sie sich auf die Vektorsuche mit erweiterten Funktionen wie Filterung und Metadatensuche. Sie können zwischen Cloud-Anbietern wie Google Cloud, AWS und Azure wählen.	Dokumente mit hohem Umfang erstellen. RAG für Unternehmen entwickeln Verwaltung der Vektordatenbankinfrastruktur. Bestehende Pinecone-Kunden.	Aktualisierungen werden nicht sofort angezeigt. Kann teurer als andere Optionen sein. Kontingente und Limits schränken die Skalierung und Leistung ein. Begrenzte Kontrolle über die zugrunde liegende Infrastruktur.	`cosine` `euclidean` `dot-product`	ANN	Allgemein verfügbar

Nächste Schritte

Informationen zum Erstellen eines RAG-Korpus finden Sie unter Beispiel für das Erstellen eines RAG-Korpus.
Eine Liste aller RAG-Korpora finden Sie im Beispiel zum Auflisten von RAG-Korpora.