Vektordatenbanken in der Vertex AI RAG Engine

Auf dieser Seite werden die Vektordatenbanken vorgestellt, die in der Vertex AI RAG Engine unterstützt werden. Außerdem erfahren Sie, wie Sie eine Vektordatenbank (Vektorspeicher) mit Ihrem RAG-Korpus verbinden.

Vektordatenbanken spielen eine entscheidende Rolle beim Abrufen von Informationen für RAG-Anwendungen. Vektordatenbanken bieten eine spezielle Möglichkeit, Vektoreinbettungen zu speichern und abzufragen. Vektoreinbettungen sind mathematische Darstellungen von Text oder anderen Daten, die semantische Bedeutung und Beziehungen erfassen. Vektoreinbettungen ermöglichen es RAG-Systemen, schnell und genau die relevantesten Informationen in einer riesigen Wissensdatenbank zu finden, selbst bei komplexen oder differenzierten Anfragen. In Kombination mit einem Einbettungsmodell können Vektordatenbanken dazu beitragen, die Einschränkungen von LLMs zu überwinden und genauere, relevantere und umfassendere Antworten zu liefern.

Unterstützte Vektordatenbanken

Beim Erstellen eines RAG-Korpus bietet die Vertex AI RAG Engine die unternehmenstaugliche RagManagedDb als Standardvektordatenbank an, für die keine zusätzliche Bereitstellung oder Verwaltung erforderlich ist. RagManagedDb bietet sowohl KNN- als auch ANN-Suchoptionen und ermöglicht den Wechsel zu einem Basic-Tarif für schnelles Prototyping und Experimentieren. Weitere Informationen zur Auswahl einer Abrufstrategie für RagManagedDb oder zum Aktualisieren der Stufe finden Sie unter RagManagedDb mit RAG verwenden. Wenn Sie möchten, dass die Vertex AI RAG Engine die Vektordatenbank automatisch für Sie erstellt und verwaltet, lesen Sie den Hilfeartikel RAG-Korpus erstellen.

Zusätzlich zum Standardmodell RagManagedDb können Sie mit der Vertex AI RAG Engine Ihre Vektordatenbank für die Verwendung in Ihrem RAG-Korpus bereitstellen und verwenden. In diesem Fall sind Sie für den Lebenszyklus und die Skalierbarkeit Ihrer Vektordatenbank verantwortlich.

Optionen für Vektordatenbanken vergleichen

In dieser Tabelle sind die Vektordatenbanken aufgeführt, die in der Vertex AI RAG Engine unterstützt werden. Außerdem finden Sie Links zu Seiten, auf denen erklärt wird, wie Sie sie in Ihrem RAG-Korpus verwenden.

Vektordatenbank   Vorteile   Optimal für   Nachteile Unterstützte Distanzmesswerte Suchtyp Startphase
RagManagedDb (Standard) ist ein regional verteilter, skalierbarer Datenbankdienst, der sehr hohe Konsistenz und Hochverfügbarkeit bietet und für die Vektorsuche verwendet werden kann. einfach schnell
  • Keine Einrichtung erforderlich.
  • Gut geeignet für Anwendungsfälle im großen und kleinen Maßstab.
  • Sehr hohe Konsistenz.
  • Hochverfügbarkeit.
  • Niedrige Latenz.
  • Hervorragend für Transaktionsarbeitslasten geeignet.
  • CMEK aktiviert.
  • Dokumente mit hohem Umfang erstellen.
  • RAG für Unternehmen entwickeln
  • Entwicklung eines schnellen Proof of Concept.
  • Geringer Bereitstellungs- und Wartungsaufwand.
  • Verwendung mit Chatbots
  • RAG-Anwendungen erstellen
  • Für einen optimalen Recall muss der Index für die ANN-Funktion nach größeren Änderungen an Ihren Daten neu erstellt werden.
cosine KNN (Standard) und ANN Vorschau
Die Vektorsuche ist der Vektordatenbankdienst in Vertex AI, der für Aufgaben im Bereich maschinelles Lernen optimiert ist.
  • Lässt sich in andere Google Cloud -Dienste einbinden.
  • Skalierbarkeit und Zuverlässigkeit werden durch die Google Cloud Infrastruktur unterstützt.
  • Es wird ein „Pay as you go“-Preismodell verwendet.
  • Dokumente mit hohem Umfang erstellen.
  • RAG für Unternehmen entwickeln
  • Verwaltung der Vektordatenbankinfrastruktur.
  • Bestehende Google Cloud Kunden oder Nutzer, die mehrere Google Cloud Dienste verwenden möchten.
  • Aktualisierungen werden nicht sofort angezeigt.
  • Anbieterabhängigkeit von Google Cloud.
  • Je nach Anwendungsfall kann es teurer sein.
cosine

dot-product
ANN Allgemein verfügbar
Vertex AI Feature Store ist ein verwalteter Dienst zum Organisieren, Speichern und Bereitstellen von Features für maschinelles Lernen.
  • Integration mit Vertex AI und anderen Google Cloud -Diensten.
  • Skalierbarkeit und Zuverlässigkeit werden durch die Google Cloud Infrastruktur unterstützt.
  • Es wird die vorhandene BigQuery-Infrastruktur genutzt.
  • Dokumente mit hohem Umfang erstellen.
  • RAG für Unternehmen entwickeln
  • Verwaltung der Vektordatenbankinfrastruktur.
  • Bestandskunden Google Cloud oder Kunden, die mehrere Google Cloud Dienste nutzen möchten.
  • Änderungen sind erst nach einer manuellen Synchronisierung im Onlineshop verfügbar.
  • Anbieterabhängigkeit von Google Cloud.
cosine

dot-product

L2 squared
ANN Vorschau
Weaviate ist eine flexible und modulare Open-Source-Vektordatenbank.
  • Unterstützt verschiedene Datentypen und bietet integrierte Diagrammfunktionen.
  • Open Source und eine aktive Community
  • Äußerst flexibel und anpassbar.
  • Unterstützt verschiedene Datentypen und Module für unterschiedliche Modalitäten wie Text und Bilder.
  • Sie können zwischen Cloud-Anbietern wie Google Cloud, AWS und Azure wählen.
  • Dokumente mit hohem Umfang erstellen.
  • RAG für Unternehmen entwickeln
  • Verwaltung der Vektordatenbankinfrastruktur.
  • Bestandskunden von Weaviate
  • Aktualisierungen werden nicht sofort angezeigt.
  • Die Einrichtung und Verwaltung kann komplexer sein.
  • Die Leistung kann je nach Konfiguration variieren.
cosine

dot-product

L2 squared

hamming

manhattan
Unterstützung von ANN und Hybridsuche Vorschau
Pinecone ist eine vollständig verwaltete, cloudbasierte Vektordatenbank, die für eine leistungsstarke Ähnlichkeitssuche entwickelt wurde.
  • Schneller Einstieg
  • Hervorragende Skalierbarkeit und Leistung.
  • Konzentrieren Sie sich auf die Vektorsuche mit erweiterten Funktionen wie Filterung und Metadatensuche.
  • Sie können zwischen Cloud-Anbietern wie Google Cloud, AWS und Azure wählen.
  • Dokumente mit hohem Umfang erstellen.
  • RAG für Unternehmen entwickeln
  • Verwaltung der Vektordatenbankinfrastruktur.
  • Bestehende Pinecone-Kunden.
  • Aktualisierungen werden nicht sofort angezeigt.
  • Kann teurer als andere Optionen sein.
  • Kontingente und Limits schränken die Skalierung und Leistung ein.
  • Begrenzte Kontrolle über die zugrunde liegende Infrastruktur.
cosine

euclidean

dot-product
ANN Allgemein verfügbar

Nächste Schritte