Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Auf dieser Seite werden die Vektordatenbanken vorgestellt, die in der Vertex AI RAG Engine unterstützt werden.
Außerdem erfahren Sie, wie Sie eine Vektordatenbank (Vektorspeicher) mit Ihrem RAG-Korpus verbinden.
Vektordatenbanken spielen eine entscheidende Rolle beim Abrufen von Informationen für RAG-Anwendungen.
Vektordatenbanken bieten eine spezielle Möglichkeit, Vektoreinbettungen zu speichern und abzufragen. Vektoreinbettungen sind mathematische Darstellungen von Text oder anderen Daten, die semantische Bedeutung und Beziehungen erfassen. Vektoreinbettungen ermöglichen es RAG-Systemen, schnell und genau die relevantesten Informationen in einer riesigen Wissensdatenbank zu finden, selbst bei komplexen oder differenzierten Anfragen. In Kombination mit einem Einbettungsmodell können Vektordatenbanken dazu beitragen, die Einschränkungen von LLMs zu überwinden und genauere, relevantere und umfassendere Antworten zu liefern.
Unterstützte Vektordatenbanken
Beim Erstellen eines RAG-Korpus bietet die Vertex AI RAG Engine die unternehmenstaugliche RagManagedDb als Standardvektordatenbank an, für die keine zusätzliche Bereitstellung oder Verwaltung erforderlich ist.
RagManagedDb bietet sowohl KNN- als auch ANN-Suchoptionen und ermöglicht den Wechsel zu einem Basic-Tarif für schnelles Prototyping und Experimentieren.
Weitere Informationen zur Auswahl einer Abrufstrategie für RagManagedDb oder zum Aktualisieren der Stufe finden Sie unter RagManagedDb mit RAG verwenden. Wenn Sie möchten, dass die Vertex AI RAG Engine die Vektordatenbank automatisch für Sie erstellt und verwaltet, lesen Sie den Hilfeartikel RAG-Korpus erstellen.
Zusätzlich zum Standardmodell RagManagedDb können Sie mit der Vertex AI RAG Engine Ihre Vektordatenbank für die Verwendung in Ihrem RAG-Korpus bereitstellen und verwenden. In diesem Fall sind Sie für den Lebenszyklus und die Skalierbarkeit Ihrer Vektordatenbank verantwortlich.
Optionen für Vektordatenbanken vergleichen
In dieser Tabelle sind die Vektordatenbanken aufgeführt, die in der Vertex AI RAG Engine unterstützt werden. Außerdem finden Sie Links zu Seiten, auf denen erklärt wird, wie Sie sie in Ihrem RAG-Korpus verwenden.
Vektordatenbank
Vorteile
Optimal für
Nachteile
Unterstützte Distanzmesswerte
Suchtyp
Startphase
RagManagedDb (Standard) ist ein regional verteilter, skalierbarer Datenbankdienst, der sehr hohe Konsistenz und Hochverfügbarkeit bietet und für die Vektorsuche verwendet werden kann.
einfach schnell
Keine Einrichtung erforderlich.
Gut geeignet für Anwendungsfälle im großen und kleinen Maßstab.
Sehr hohe Konsistenz.
Hochverfügbarkeit.
Niedrige Latenz.
Hervorragend für Transaktionsarbeitslasten geeignet.
CMEK aktiviert.
Dokumente mit hohem Umfang erstellen.
RAG für Unternehmen entwickeln
Entwicklung eines schnellen Proof of Concept.
Geringer Bereitstellungs- und Wartungsaufwand.
Verwendung mit Chatbots
RAG-Anwendungen erstellen
Für einen optimalen Recall muss der Index für die ANN-Funktion nach größeren Änderungen an Ihren Daten neu erstellt werden.
cosine
KNN (Standard) und ANN
Vorschau
Die Vektorsuche ist der Vektordatenbankdienst in Vertex AI, der für Aufgaben im Bereich maschinelles Lernen optimiert ist.
Lässt sich in andere Google Cloud -Dienste einbinden.
Skalierbarkeit und Zuverlässigkeit werden durch die Google Cloud Infrastruktur unterstützt.
Es wird ein „Pay as you go“-Preismodell verwendet.
Dokumente mit hohem Umfang erstellen.
RAG für Unternehmen entwickeln
Verwaltung der Vektordatenbankinfrastruktur.
Bestehende Google Cloud Kunden oder Nutzer, die mehrere Google Cloud Dienste verwenden möchten.
Aktualisierungen werden nicht sofort angezeigt.
Anbieterabhängigkeit von Google Cloud.
Je nach Anwendungsfall kann es teurer sein.
cosine
dot-product
ANN
Allgemein verfügbar
Vertex AI Feature Store ist ein verwalteter Dienst zum Organisieren, Speichern und Bereitstellen von Features für maschinelles Lernen.
Integration mit Vertex AI und anderen Google Cloud -Diensten.
Skalierbarkeit und Zuverlässigkeit werden durch die Google Cloud Infrastruktur unterstützt.
Es wird die vorhandene BigQuery-Infrastruktur genutzt.
Dokumente mit hohem Umfang erstellen.
RAG für Unternehmen entwickeln
Verwaltung der Vektordatenbankinfrastruktur.
Bestandskunden Google Cloud oder Kunden, die mehrere Google Cloud Dienste nutzen möchten.
Änderungen sind erst nach einer manuellen Synchronisierung im Onlineshop verfügbar.
Anbieterabhängigkeit von Google Cloud.
cosine
dot-product
L2 squared
ANN
Vorschau
Weaviate ist eine flexible und modulare Open-Source-Vektordatenbank.
Unterstützt verschiedene Datentypen und bietet integrierte Diagrammfunktionen.
Open Source und eine aktive Community
Äußerst flexibel und anpassbar.
Unterstützt verschiedene Datentypen und Module für unterschiedliche Modalitäten wie Text und Bilder.
Sie können zwischen Cloud-Anbietern wie Google Cloud, AWS und Azure wählen.
Dokumente mit hohem Umfang erstellen.
RAG für Unternehmen entwickeln
Verwaltung der Vektordatenbankinfrastruktur.
Bestandskunden von Weaviate
Aktualisierungen werden nicht sofort angezeigt.
Die Einrichtung und Verwaltung kann komplexer sein.
Die Leistung kann je nach Konfiguration variieren.
cosine
dot-product
L2 squared
hamming
manhattan
Unterstützung von ANN und Hybridsuche
Vorschau
Pinecone
ist eine vollständig verwaltete, cloudbasierte Vektordatenbank, die für eine leistungsstarke Ähnlichkeitssuche entwickelt wurde.
Schneller Einstieg
Hervorragende Skalierbarkeit und Leistung.
Konzentrieren Sie sich auf die Vektorsuche mit erweiterten Funktionen wie Filterung und Metadatensuche.
Sie können zwischen Cloud-Anbietern wie Google Cloud, AWS und Azure wählen.
Dokumente mit hohem Umfang erstellen.
RAG für Unternehmen entwickeln
Verwaltung der Vektordatenbankinfrastruktur.
Bestehende Pinecone-Kunden.
Aktualisierungen werden nicht sofort angezeigt.
Kann teurer als andere Optionen sein.
Kontingente und Limits schränken die Skalierung und Leistung ein.
Begrenzte Kontrolle über die zugrunde liegende Infrastruktur.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-02 (UTC)."],[],[],null,["# Vector database choices in Vertex AI RAG Engine\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page introduces the vector databases supported on Vertex AI RAG Engine.\nYou can also see how to connect a vector database (vector store) to your RAG\ncorpus.\n\nVector databases play a crucial role in enabling retrieval for RAG applications.\nVector databases offer a specialized way to store and query vector embeddings,\nwhich are mathematical representations of text or other data that capture\nsemantic meaning and relationships. Vector embeddings allow RAG systems to\nquickly and accurately find the most relevant information within a vast\nknowledge base, even when dealing with complex or nuanced queries. When combined\nwith an embedding model, vector databases can help overcome the limitations of\nLLMs, and provide more accurate, relevant, and comprehensive responses.\n\nSupported vector databases\n--------------------------\n\nWhen creating a RAG corpus, Vertex AI RAG Engine offers the\nenterprise-ready `RagManagedDb` as the default vector database, which requires\nno additional provisioning or managing.\n`RagManagedDb` offers both KNN and ANN search options and\nallows switching to a basic tier for some quick prototyping and experimentation.\nTo learn more about choosing a retrieval strategy on `RagManagedDb` or for\nupdating the tier, see [Use `RagManagedDb` with\nRAG](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag). For\nVertex AI RAG Engine to automatically create and manage the\nvector database for you, see [Create a RAG\ncorpus](/vertex-ai/generative-ai/docs/model-reference/rag-api#create-a-rag-corpus-params-api).\n\nIn addition to the default `RagManagedDb`, Vertex AI RAG Engine\nlets you provision and use your vector database within your RAG corpus. In this\ncase, you are responsible for the lifecycle and scalability of your vector\ndatabase.\n\nCompare vector database options\n-------------------------------\n\nThis table lists your choices of vector databases that are supported within\nVertex AI RAG Engine and provides links to pages that explain how\nto use the vector databases within your RAG corpus. \n\nWhat's next\n-----------\n\n- To create a RAG corpus, see [Create a RAG corpus\n example](/vertex-ai/generative-ai/docs/model-reference/rag-api#create-a-rag-corpus-example-api).\n- To list all of the RAG corpora, see [List RAG corpora\n example](/vertex-ai/generative-ai/docs/model-reference/rag-api#list-rag-corpora-example-api)."]]