Abrechnung der Vertex AI RAG Engine

Auf dieser Seite werden die Preise und die Abrechnung für die Vertex AI RAG Engine beschrieben, basierend auf den von Ihnen verwendeten Vertex AI RAG Engine-Komponenten wie Modellen, Reranking und Vektorspeicher.

Weitere Informationen finden Sie auf der Seite Vertex AI RAG Engine – Übersicht.

Preise und Abrechnung

Die Vertex AI RAG Engine ist kostenlos. Wenn Sie jedoch Vertex AI RAG Engine-Komponenten konfigurieren, kann sich dies auf die Abrechnung auswirken.

In dieser Tabelle wird erläutert, wie die Abrechnung erfolgt, wenn Sie die RAG-Komponenten verwenden.

Komponente Abrechnung bei Vertex AI RAG Engine
Datenaufnahme Die Vertex AI RAG Engine unterstützt die Aufnahme von Daten aus verschiedenen Datenquellen. Zum Beispiel lokale Dateien, Cloud Storage und Google Drive. Der Zugriff auf Dateien in diesen Datenquellen über die Vertex AI RAG Engine ist kostenlos. Für die Datenübertragung können jedoch Gebühren anfallen. Dazu gehören beispielsweise Kosten für ausgehenden Traffic.
Datentransformation (Dateianalyse)
  • Standard-Parser: Kostenlos.
  • LLM-Parser: Vertex AI RAG Engine verwendet das von Ihnen angegebene LLM-Modell zum Parsen Ihrer Datei. Die Kosten für das LLM-Modell werden direkt in Ihrem Projekt angezeigt und abgerechnet.
  • Document AI-Layoutparser: Die Vertex AI-RAG-Engine verwendet den von Ihnen angegebenen Document AI-Layoutparser, um Ihre Datei zu verarbeiten. Die Verwendung des Document AI-Layoutparsers wird Ihnen direkt in Ihrem Projekt in Rechnung gestellt.
Datentransformation (Aufteilen von Dateien in Chunks) Unterstützt das Chunking mit fester Größe, das kostenlos ist.
Generierung von Einbettungen Die Vertex AI RAG Engine orchestriert die Generierung von Einbettungen mit dem von Ihnen angegebenen Einbettungsmodell. Die mit diesem Modell verbundenen Kosten werden Ihrem Projekt in Rechnung gestellt.

Weitere Informationen zu den Preisen finden Sie unter Kosten für das Erstellen und Bereitstellen von KI-Modellen in Vertex AI.

Datenindexierung und ‑abruf Die RAG Engine unterstützt zwei Kategorien von Vektordatenbanken für die Vektorsuche:
  • Von RAG verwaltete Datenbank
  • Eigene Vektordatenbank verwenden

Eine von RAG verwaltete Datenbank hat zwei Zwecke:
  • In einer RAG-verwalteten Datenbank werden RAG-Ressourcen wie RAG-Corpora und RAG-Dateien gespeichert. Der Dateiinhalt wird nicht berücksichtigt.
  • Auf Wunsch Indexierung und Abruf von Einbettungen für die Vektorsuche.

Für eine RAG-verwaltete Datenbank wird eine Spanner-Instanz als Backend verwendet.

Für jedes Ihrer Projekte stellt die Vertex AI RAG Engine ein kundenspezifisches Google Cloud -Projekt bereit und verwaltet RAG-verwaltete Ressourcen, die in der Vertex AI RAG Engine gespeichert sind, sodass Ihre Daten physisch isoliert sind.

Wenn Sie die RagManagedDB-Version „Basic“ oder „Scaled“ auswählen, stellt die Vertex AI-RAG-Engine eine Spanner Enterprise-Instanz im entsprechenden Projekt bereit:

  • Basic-Tarif: 100 Verarbeitungseinheiten mit Sicherung
  • Skalierte Stufe: Beginnt bei 1 Knoten (1.000 Verarbeitungseinheiten) und wird automatisch auf bis zu 10 Knoten mit Sicherung skaliert.

Wenn für einen RAG-Korpus in Ihrem Projekt eine von RAG verwaltete Datenbank für die Vektorsuche verwendet wird, wird Ihnen die von RAG verwaltete Spanner-Instanz in Rechnung gestellt.

Die Vertex AI-RAG-Engine überträgt Spanner-Kosten aus Ihrem entsprechenden RAG-verwalteten Projekt in Ihr Google Cloud -Projekt, damit Sie die Kosten für die Spanner-Instanz sehen und bezahlen können.

Weitere Preisinformationen zu Spanner finden Sie unter Spanner-Preise.

Reranking für die Vertex AI-RAG-Engine Die folgenden Ranking-Tools werden nach dem Abrufen unterstützt:
  • LLM-Reranker: Vertex AI RAG Engine verwendet das von Ihnen angegebene LLM-Modell, um die Abrufergebnisse neu zu ordnen. Die Kosten für das LLM-Modell werden direkt in Ihrem Projekt angezeigt und abgerechnet.
  • Vertex AI Search Ranking API: Die Vertex AI RAG Engine verwendet die Vertex AI Search Ranking API, um die Abrufergebnisse neu zu ranken. Sie sehen und bezahlen die Ranking API direkt über Ihr Projekt.

Nächste Schritte