Diese Seite wurde von der Cloud Translation API übersetzt.

Abrechnung der Vertex AI RAG Engine

Auf dieser Seite werden die Preise und die Abrechnung für die Vertex AI RAG Engine beschrieben, die auf den von Ihnen verwendeten Komponenten der Vertex AI RAG Engine basieren, z. B. Modelle, Reranking und Vektorspeicher.

Weitere Informationen finden Sie auf der Seite Übersicht über die Vertex AI RAG Engine.

Preise und Abrechnung

Die Vertex AI RAG Engine ist kostenlos. Wenn Sie jedoch Vertex AI RAG Engine-Komponenten konfigurieren, kann sich dies auf die Abrechnung auswirken.

In dieser Tabelle wird erläutert, wie die Abrechnung erfolgt, wenn Sie die RAG-Komponenten verwenden.

Komponente	Abrechnung bei Vertex AI RAG Engine
Datenaufnahme	Die Vertex AI RAG Engine unterstützt die Aufnahme von Daten aus verschiedenen Datenquellen. Zum Beispiel lokale Dateien, Cloud Storage und Google Drive. Der Zugriff auf Dateien in diesen Datenquellen über die Vertex AI RAG Engine ist kostenlos. Für die Datenübertragung können jedoch Gebühren anfallen. Dazu gehören beispielsweise Kosten für ausgehenden Traffic.
Datentransformation (Dateianalyse)	Standard-Parser: Kostenlos. LLM-Parser: Vertex AI RAG Engine verwendet das von Ihnen angegebene LLM-Modell zum Parsen Ihrer Datei. Die Kosten für das LLM-Modell werden direkt in Ihrem Projekt angezeigt und abgerechnet. Document AI-Layoutparser: Die Vertex AI RAG Engine verwendet den von Ihnen angegebenen Document AI-Layoutparser, um Ihre Datei zu verarbeiten. Die Verwendung des Document AI-Layoutparsers wird direkt in Ihrem Projekt angezeigt und abgerechnet.
Datentransformation (Aufteilen von Dateien in Chunks)	Unterstützt das Chunking mit fester Größe, das kostenlos ist.
Generierung von Einbettungen	Die Vertex AI RAG Engine orchestriert die Einbettungserstellung mit dem von Ihnen angegebenen Einbettungsmodell. Die mit diesem Modell verbundenen Kosten werden Ihrem Projekt in Rechnung gestellt. Weitere Informationen zu den Preisen finden Sie unter Kosten für das Erstellen und Bereitstellen von KI-Modellen in Vertex AI.
Datenindexierung und ‑abruf	Die RAG Engine unterstützt zwei Kategorien von Vektordatenbanken für die Vektorsuche: Von RAG verwaltete Datenbank Eigene Vektordatenbank verwenden Eine von RAG verwaltete Datenbank hat zwei Zwecke: In einer RAG-verwalteten Datenbank werden RAG-Ressourcen wie RAG-Corpora und RAG-Dateien gespeichert. Der Dateiinhalt wird nicht berücksichtigt. Auf Wunsch Indexierung und Abruf von Einbettungen für die Vektorsuche. Für eine RAG-verwaltete Datenbank wird eine Spanner-Instanz als Backend verwendet. Für jedes Ihrer Projekte stellt die Vertex AI RAG Engine ein kundenspezifisches Google Cloud Projekt bereit und verwaltet RAG-verwaltete Ressourcen, die in der Vertex AI RAG Engine gespeichert sind, sodass Ihre Daten physisch isoliert sind. Wenn Sie die `RagManagedDB`-Version „Basic“ oder „Scaled“ auswählen, stellt die Vertex AI-RAG-Engine eine Spanner Enterprise-Instanz im entsprechenden Projekt bereit: Basic-Tarif: 100 Verarbeitungseinheiten mit Sicherung Skalierte Stufe: Beginnt bei 1 Knoten (1.000 Verarbeitungseinheiten) und wird automatisch auf bis zu 10 Knoten mit Sicherung skaliert. Wenn für einen RAG-Korpus in Ihrem Projekt eine von RAG verwaltete Datenbank für die Vektorsuche verwendet wird, wird Ihnen die von RAG verwaltete Spanner-Instanz in Rechnung gestellt. Die Vertex AI-RAG-Engine überträgt Spanner-Kosten aus Ihrem entsprechenden RAG-verwalteten Projekt in Ihr Google Cloud -Projekt, damit Sie die Kosten für die Spanner-Instanz sehen und bezahlen können. Weitere Preisinformationen zu Spanner finden Sie unter Spanner-Preise.
Reranking für die Vertex AI-RAG-Engine	Die folgenden Ranking-Tools werden nach dem Abrufen unterstützt: LLM-Reranker: Vertex AI RAG Engine verwendet das von Ihnen angegebene LLM-Modell, um die Abrufergebnisse neu zu ranken. Die Kosten für das LLM-Modell werden direkt in Ihrem Projekt angezeigt und abgerechnet. Vertex AI Search Ranking API: Die Vertex AI RAG Engine verwendet die Vertex AI Search Ranking API, um die Abrufergebnisse neu zu ordnen. Sie sehen und bezahlen die Ranking API direkt über Ihr Projekt.

Vertex AI-RAG-Engine löschen

In den folgenden Codebeispielen wird veranschaulicht, wie Sie eine Vertex AI RAG Engine für die Google Cloud -Konsole, Python und REST löschen:

Parameter und Codebeispiele für die Version 1 (v1) der API.
Parameter und Codebeispiele für die v1beta1 API

Nächste Schritte

Informationen zur Verwendung des Vertex AI SDK zum Ausführen von Vertex AI RAG Engine-Aufgaben finden Sie unter RAG-Kurzanleitung für Python.
Weitere Informationen zur Fundierung finden Sie unter Fundierungsübersicht.
Weitere Informationen zu den Antworten von RAG finden Sie unter Ausgabe von Abruf und Generierung der Vertex AI RAG Engine.
Informationen zur RAG-Architektur:
- Infrastruktur für eine RAG-fähige generative KI-Anwendung mit Vertex AI und Vector Search
- Infrastruktur für eine RAG-fähige generative KI-Anwendung mit Vertex AI und AlloyDB for PostgreSQL