Vektordatenbanken in der Vertex AI RAG Engine

Auf dieser Seite werden die Vektordatenbanken vorgestellt, die in der Vertex AI RAG Engine unterstützt werden. Außerdem erfahren Sie, wie Sie eine Vektordatenbank (Vektorspeicher) mit Ihrem RAG-Korpus verbinden.

Vektordatenbanken spielen eine entscheidende Rolle beim Abrufen von Daten für RAG-Anwendungen. Vektordatenbanken bieten eine spezielle Möglichkeit, Vektoreinbettungen zu speichern und abzufragen. Vektoreinbettungen sind mathematische Darstellungen von Text oder anderen Daten, die semantische Bedeutung und Beziehungen erfassen. Vektoreinbettungen ermöglichen es RAG-Systemen, schnell und genau die relevantesten Informationen in einer riesigen Wissensdatenbank zu finden, selbst bei komplexen oder differenzierten Anfragen. In Kombination mit einem Einbettungsmodell können Vektordatenbanken dazu beitragen, die Einschränkungen von LLMs zu überwinden und genauere, relevantere und umfassendere Antworten zu liefern.

Unterstützte Vektordatenbanken

Beim Erstellen eines RAG-Korpus bietet die Vertex AI RAG Engine die unternehmenstaugliche RagManagedDb als Standardvektordatenbank an, für die keine zusätzliche Bereitstellung oder Verwaltung erforderlich ist. RagManagedDb bietet sowohl KNN- als auch ANN-Suchoptionen und ermöglicht den Wechsel zu einem Basic-Tarif für schnelles Prototyping und Experimentieren. Weitere Informationen zur Auswahl einer Abrufstrategie für RagManagedDb oder zum Aktualisieren der Stufe finden Sie unter RagManagedDb mit RAG verwenden. Wenn Sie möchten, dass die Vertex AI RAG Engine die Vektordatenbank automatisch für Sie erstellt und verwaltet, lesen Sie den Hilfeartikel RAG-Korpus erstellen.

Zusätzlich zum Standardmodell RagManagedDb können Sie mit der Vertex AI-RAG-Engine Ihre Vektordatenbank für die Verwendung in Ihrem RAG-Korpus bereitstellen und einbinden. In diesem Fall sind Sie für den Lebenszyklus und die Skalierbarkeit Ihrer Vektordatenbank verantwortlich.

Optionen für Vektordatenbanken vergleichen

In dieser Tabelle sind die Vektordatenbanken aufgeführt, die in der Vertex AI RAG Engine unterstützt werden. Außerdem finden Sie Links zu Seiten, auf denen erklärt wird, wie Sie sie in Ihrem RAG-Corpus verwenden.

Vektordatenbank   Vorteile   Optimal für   Nachteile Unterstützte Distanzmesswerte Suchtyp Startphase
RagManagedDb (Standard) ist ein regional verteilter, skalierbarer Datenbankdienst, der sehr hohe Konsistenz und Hochverfügbarkeit bietet und für die Vektorsuche verwendet werden kann. einfach schnell
  • Keine Einrichtung erforderlich.
  • Gut geeignet für Anwendungsfälle im großen und kleinen Maßstab.
  • Sehr hohe Konsistenz.
  • Hochverfügbarkeit.
  • Niedrige Latenz.
  • Hervorragend für Transaktionsarbeitslasten geeignet.
  • CMEK ist aktiviert.
  • Dokumente mit hohem Umfang generieren.
  • RAG für Unternehmen entwickeln
  • Entwicklung eines schnellen Proof of Concept.
  • Geringer Bereitstellungs- und Wartungsaufwand.
  • Verwendung mit Chatbots
  • RAG-Anwendungen erstellen
  • Für einen optimalen Recall muss der Index nach größeren Änderungen an Ihren Daten neu erstellt werden.
cosine KNN (Standard) und ANN Vorschau
Vector Search ist der Vektordatenbankdienst in Vertex AI, der für Aufgaben im Bereich maschinelles Lernen optimiert ist.
  • Lässt sich in andere Google Cloud -Dienste einbinden.
  • Skalierbarkeit und Zuverlässigkeit werden durch die Google Cloud -Infrastruktur unterstützt.
  • Nutzungsbasierte Preisgestaltung („Pay as you go“)
  • Dokumente mit hohem Umfang generieren.
  • RAG für Unternehmen entwickeln
  • Verwaltung der Vektordatenbankinfrastruktur.
  • Bestehende Google Cloud Kunden oder Nutzer, die mehrere Google Cloud Dienste verwenden möchten.
  • Aktualisierungen werden nicht sofort übernommen.
  • Anbieterabhängigkeit von Google Cloud.
  • Je nach Anwendungsfall kann es teurer sein.
cosine

dot-product
ANN Allgemein verfügbar
Vertex AI Feature Store ist ein verwalteter Dienst zum Organisieren, Speichern und Bereitstellen von Features für maschinelles Lernen.
  • Integration mit Vertex AI und anderen Google Cloud -Diensten.
  • Skalierbarkeit und Zuverlässigkeit werden durch die Google Cloud -Infrastruktur unterstützt.
  • Es wird die vorhandene BigQuery-Infrastruktur genutzt.
  • Dokumente mit hohem Umfang generieren.
  • RAG für Unternehmen entwickeln
  • Verwaltung der Vektordatenbankinfrastruktur.
  • Bestandskunden Google Cloud oder Kunden, die mehrere Google Cloud Dienste nutzen möchten.
  • Änderungen sind erst nach einer manuellen Synchronisierung im Onlineshop verfügbar.
  • Anbieterabhängigkeit von Google Cloud.
cosine

dot-product

L2 squared
ANN Vorschau
Weaviate ist eine flexible und modulare Open-Source-Vektordatenbank.
  • Unterstützt verschiedene Datentypen und bietet integrierte Diagrammfunktionen.
  • Open Source und eine aktive Community.
  • Äußerst flexibel und anpassbar.
  • Unterstützt verschiedene Datentypen und Module für unterschiedliche Modalitäten wie Text und Bilder.
  • Sie können zwischen Cloud-Anbietern wie Google Cloud, AWS und Azure wählen.
  • Dokumente mit hohem Umfang generieren.
  • RAG für Unternehmen entwickeln
  • Verwaltung der Vektordatenbankinfrastruktur.
  • Bestandskunden von Weaviate
  • Aktualisierungen werden nicht sofort übernommen.
  • Die Einrichtung und Verwaltung kann komplexer sein.
  • Die Leistung kann je nach Konfiguration variieren.
cosine

dot-product

L2 squared

hamming

manhattan
Unterstützung von ANN + Hybridsuche Vorschau
Pinecone ist eine vollständig verwaltete, cloudbasierte Vektordatenbank, die für eine leistungsstarke Ähnlichkeitssuche entwickelt wurde.
  • Schneller Einstieg
  • Hervorragende Skalierbarkeit und Leistung.
  • Konzentrieren Sie sich auf die Vektorsuche mit erweiterten Funktionen wie Filtern und Metadatensuche.
  • Sie können zwischen Cloud-Anbietern wie Google Cloud, AWS und Azure wählen.
  • Dokumente mit hohem Umfang generieren.
  • RAG für Unternehmen entwickeln
  • Verwaltung der Vektordatenbankinfrastruktur.
  • Bestehende Pinecone-Kunden.
  • Aktualisierungen werden nicht sofort übernommen.
  • Kann teurer als andere Optionen sein.
  • Kontingente und Limits schränken die Skalierung und Leistung ein.
  • Begrenzte Kontrolle über die zugrunde liegende Infrastruktur.
cosine

euclidean

dot-product
ANN Allgemein verfügbar

Nächste Schritte