Auf dieser Seite erfahren Sie mehr über RagManagedDb
, die zugrunde liegende Technologie und wie RagManagedDb
in der Vertex AI RAG Engine verwendet wird. Außerdem werden auf dieser Seite die verschiedenen Stufen beschrieben, die zur Leistungsoptimierung verfügbar sind und sich auf Ihre Kosten auswirken können. Außerdem finden Sie hier eine Anleitung zum Löschen Ihrer Vertex AI RAG Engine-Daten, wodurch die Abrechnung beendet wird.
Übersicht
Die Vertex AI-RAG-Engine verwendet RagManagedDb
, eine für Unternehmen geeignete, vollständig verwaltete Google Spanner-Instanz, die von der Vertex AI-RAG-Engine zum Speichern von Ressourcen verwendet wird und optional als Vektordatenbank Ihrer Wahl für Ihre RAG-Korpora verwendet werden kann.
Mit Spanner bietet die Vertex AI-RAG-Engine eine konsistente, hochverfügbare und hochgradig skalierbare Datenbank zur Unterstützung Ihrer Anwendung. Weitere Informationen zu Google Spanner finden Sie unter Spanner.
In der Vertex AI-RAG-Engine werden die Metadaten Ihres RAG-Korpus und Ihrer RAG-Dateiressource in RagManagedDb
gespeichert, unabhängig davon, welche Vektordatenbank Sie auswählen. Vektordatenbanken werden nur zum Speichern und Abrufen von Einbettungen verwendet. Neben der Speicherung von Ressourcen kann RagManagedDb
auch zum Speichern und Verwalten von Vektordarstellungen Ihrer Dokumente verwendet werden. Die Vektordatenbank wird dann verwendet, um relevante Dokumente basierend auf der semantischen Ähnlichkeit des Dokuments mit einer bestimmten Anfrage abzurufen.
Stufen verwalten
Mit der Vertex AI-RAG-Engine können Sie Ihre RagManagedDb
-Instanz basierend auf Ihren Nutzungs- und Leistungsanforderungen mit zwei Stufen skalieren. Optional können Sie Ihre Vertex AI-RAG-Engine-Daten mit einer dritten Stufe löschen.
Die Stufe ist eine Einstellung auf Projektebene, die in der RagEngineConfig
-Ressource verfügbar ist und sich auf RAG-Korpora mit RagManagedDb
auswirkt. Die folgenden Stufen sind in RagEngineConfig
verfügbar:
Skalierte Stufe: Diese Stufe bietet Leistung auf Produktionsniveau sowie Autoscaling-Funktionen. Es eignet sich für Kunden mit großen Datenmengen oder leistungsempfindlichen Arbeitslasten. Intern wird in dieser Stufe die Spanner-Instanz auf die Autoscaling-Konfiguration mit mindestens einem Knoten (1.000 Verarbeitungseinheiten) und maximal zehn Knoten (10.000 Verarbeitungseinheiten) festgelegt.
Basis-Stufe (Standard): Diese Stufe ist kostengünstig und erfordert wenig Rechenleistung. Sie eignet sich möglicherweise für einige der folgenden Fälle:
- Wird getestet mit
RagManagedDb
. - Geringe Datengröße.
- Arbeitslast, die nicht auf Latenz reagiert.
- Verwenden Sie die Vertex AI RAG Engine nur mit anderen Vektordatenbanken.
Um die Basisstufe anbieten zu können, legt
RagManagedDb
die zugrunde liegende Spanner-Instanz auf eine feste Konfiguration von 100 Verarbeitungseinheiten fest, was 0,1 Knoten entspricht.- Wird getestet mit
Nicht bereitgestellte Stufe: In dieser Stufe werden die
RagManagedDb
und die zugrunde liegende Spanner-Instanz gelöscht. Im Tarif „Nicht bereitgestellt“ wird der Dienst „Vertex AI RAG Engine“ deaktiviert und Ihre in diesem Dienst gespeicherten Daten werden gelöscht, unabhängig von der Vektordatenbank, die für IhrRagCorpora
verwendet wird. Dadurch wird die Abrechnung des Dienstes beendet. Weitere Informationen zur Abrechnung finden Sie unter Abrechnung für die Vertex AI RAG Engine.Nach dem Löschen können die Daten nicht wiederhergestellt werden. Wenn Sie die Vertex AI RAG Engine wieder verwenden möchten, müssen Sie das Tier aktualisieren, indem Sie die
UpdateRagEngineConfig
API aufrufen.
Projektkonfiguration abrufen
Die folgenden Codebeispiele zeigen, wie die GetRagEngineConfig
API für die einzelnen Stufen verwendet wird:
Version 1 (v1) – API-Codebeispiele.
v1beta1-API-Codebeispiele.
Projektkonfiguration aktualisieren
Die folgenden Codebeispiele zeigen, wie die UpdateRagEngineConfig
-API für die einzelnen Stufen verwendet wird:
Version 1 (v1) API-Codebeispiele.
v1beta1-API-Codebeispiele.
Nächste Schritte
- Informationen zur Verwendung der RAG API v1 (Standard) finden Sie unter RAG API v1.
- Informationen zur Verwendung der RAG API v1beta1 finden Sie unter RAG API v1beta1.
- Weitere Informationen zu
RagManagedDb
und zum Verwalten der Tier-Konfiguration sowie der Abrufstrategie auf RAG-Korpus-Ebene finden Sie unter RagManagedDb mit Vertex AI RAG Engine verwenden.