RagManagedDb

Auf dieser Seite erfahren Sie mehr über RagManagedDb, die zugrunde liegende Technologie und wie RagManagedDb in der Vertex AI RAG Engine verwendet wird. Außerdem werden auf dieser Seite die verschiedenen Stufen beschrieben, die zur Leistungsoptimierung verfügbar sind und sich auf Ihre Kosten auswirken können. Außerdem finden Sie hier eine Anleitung zum Löschen Ihrer Vertex AI RAG Engine-Daten, wodurch die Abrechnung beendet wird.

Übersicht

Die Vertex AI-RAG-Engine verwendet RagManagedDb, eine für Unternehmen geeignete, vollständig verwaltete Google Spanner-Instanz, die von der Vertex AI-RAG-Engine zum Speichern von Ressourcen verwendet wird und optional als Vektordatenbank Ihrer Wahl für Ihre RAG-Korpora verwendet werden kann.

Mit Spanner bietet die Vertex AI-RAG-Engine eine konsistente, hochverfügbare und hochgradig skalierbare Datenbank zur Unterstützung Ihrer Anwendung. Weitere Informationen zu Google Spanner finden Sie unter Spanner.

In der Vertex AI-RAG-Engine werden die Metadaten Ihres RAG-Korpus und Ihrer RAG-Dateiressource in RagManagedDb gespeichert, unabhängig davon, welche Vektordatenbank Sie auswählen. Vektordatenbanken werden nur zum Speichern und Abrufen von Einbettungen verwendet. Neben der Speicherung von Ressourcen kann RagManagedDb auch zum Speichern und Verwalten von Vektordarstellungen Ihrer Dokumente verwendet werden. Die Vektordatenbank wird dann verwendet, um relevante Dokumente basierend auf der semantischen Ähnlichkeit des Dokuments mit einer bestimmten Anfrage abzurufen.

Stufen verwalten

Mit der Vertex AI-RAG-Engine können Sie Ihre RagManagedDb-Instanz basierend auf Ihren Nutzungs- und Leistungsanforderungen mit zwei Stufen skalieren. Optional können Sie Ihre Vertex AI-RAG-Engine-Daten mit einer dritten Stufe löschen.

Die Stufe ist eine Einstellung auf Projektebene, die in der RagEngineConfig-Ressource verfügbar ist und sich auf RAG-Korpora mit RagManagedDb auswirkt. Die folgenden Stufen sind in RagEngineConfig verfügbar:

  • Skalierte Stufe: Diese Stufe bietet Leistung auf Produktionsniveau sowie Autoscaling-Funktionen. Es eignet sich für Kunden mit großen Datenmengen oder leistungsempfindlichen Arbeitslasten. Intern wird in dieser Stufe die Spanner-Instanz auf die Autoscaling-Konfiguration mit mindestens einem Knoten (1.000 Verarbeitungseinheiten) und maximal zehn Knoten (10.000 Verarbeitungseinheiten) festgelegt.

  • Basis-Stufe (Standard): Diese Stufe ist kostengünstig und erfordert wenig Rechenleistung. Sie eignet sich möglicherweise für einige der folgenden Fälle:

    • Wird getestet mit RagManagedDb.
    • Geringe Datengröße.
    • Arbeitslast, die nicht auf Latenz reagiert.
    • Verwenden Sie die Vertex AI RAG Engine nur mit anderen Vektordatenbanken.

    Um die Basisstufe anbieten zu können, legt RagManagedDb die zugrunde liegende Spanner-Instanz auf eine feste Konfiguration von 100 Verarbeitungseinheiten fest, was 0,1 Knoten entspricht.

  • Nicht bereitgestellte Stufe: In dieser Stufe werden die RagManagedDb und die zugrunde liegende Spanner-Instanz gelöscht. Im Tarif „Nicht bereitgestellt“ wird der Dienst „Vertex AI RAG Engine“ deaktiviert und Ihre in diesem Dienst gespeicherten Daten werden gelöscht, unabhängig von der Vektordatenbank, die für Ihr RagCorpora verwendet wird. Dadurch wird die Abrechnung des Dienstes beendet. Weitere Informationen zur Abrechnung finden Sie unter Abrechnung für die Vertex AI RAG Engine.

    Nach dem Löschen können die Daten nicht wiederhergestellt werden. Wenn Sie die Vertex AI RAG Engine wieder verwenden möchten, müssen Sie das Tier aktualisieren, indem Sie die UpdateRagEngineConfig API aufrufen.

Projektkonfiguration abrufen

Die folgenden Codebeispiele zeigen, wie die GetRagEngineConfig API für die einzelnen Stufen verwendet wird:

Projektkonfiguration aktualisieren

Die folgenden Codebeispiele zeigen, wie die UpdateRagEngineConfig-API für die einzelnen Stufen verwendet wird:

Nächste Schritte