Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Auf dieser Seite werden die Preise und die Abrechnung für die Vertex AI RAG Engine beschrieben, basierend auf den von Ihnen verwendeten Vertex AI RAG Engine-Komponenten wie Modellen, Reranking und Vektorspeicher.
Die Vertex AI RAG Engine unterstützt die Aufnahme von Daten aus verschiedenen Datenquellen. Zum Beispiel lokale Dateien, Cloud Storage und Google Drive. Der Zugriff auf Dateien in diesen Datenquellen über die Vertex AI RAG Engine ist kostenlos. Für die Datenübertragung können jedoch Gebühren anfallen. Dazu gehören beispielsweise Kosten für ausgehenden Traffic.
LLM-Parser: Vertex AI RAG Engine verwendet das von Ihnen angegebene LLM-Modell zum Parsen Ihrer Datei. Die Kosten für das LLM-Modell werden direkt in Ihrem Projekt angezeigt und abgerechnet.
Document AI-Layoutparser: Die Vertex AI-RAG-Engine verwendet den von Ihnen angegebenen Document AI-Layoutparser, um Ihre Datei zu verarbeiten. Die Verwendung des Document AI-Layoutparsers wird Ihnen direkt in Ihrem Projekt in Rechnung gestellt.
Die Vertex AI RAG Engine orchestriert die Generierung von Einbettungen mit dem von Ihnen angegebenen Einbettungsmodell. Die mit diesem Modell verbundenen Kosten werden Ihrem Projekt in Rechnung gestellt.
Die RAG Engine unterstützt zwei Kategorien von Vektordatenbanken für die Vektorsuche:
Von RAG verwaltete Datenbank
Eigene Vektordatenbank verwenden
Eine von RAG verwaltete Datenbank hat zwei Zwecke:
In einer RAG-verwalteten Datenbank werden RAG-Ressourcen wie RAG-Corpora und RAG-Dateien gespeichert. Der Dateiinhalt wird nicht berücksichtigt.
Auf Wunsch Indexierung und Abruf von Einbettungen für die Vektorsuche.
Für eine RAG-verwaltete Datenbank wird eine Spanner-Instanz als Backend verwendet.
Für jedes Ihrer Projekte stellt die Vertex AI RAG Engine ein kundenspezifisches Google Cloud -Projekt bereit und verwaltet RAG-verwaltete Ressourcen, die in der Vertex AI RAG Engine gespeichert sind, sodass Ihre Daten physisch isoliert sind.
Wenn Sie die RagManagedDB-Version „Basic“ oder „Scaled“ auswählen, stellt die Vertex AI-RAG-Engine eine Spanner Enterprise-Instanz im entsprechenden Projekt bereit:
Basic-Tarif: 100 Verarbeitungseinheiten mit Sicherung
Skalierte Stufe: Beginnt bei 1 Knoten (1.000 Verarbeitungseinheiten) und wird automatisch auf bis zu 10 Knoten mit Sicherung skaliert.
Wenn für einen RAG-Korpus in Ihrem Projekt eine von RAG verwaltete Datenbank für die Vektorsuche verwendet wird, wird Ihnen die von RAG verwaltete Spanner-Instanz in Rechnung gestellt.
Die Vertex AI-RAG-Engine überträgt Spanner-Kosten aus Ihrem entsprechenden RAG-verwalteten Projekt in Ihr Google Cloud -Projekt, damit Sie die Kosten für die Spanner-Instanz sehen und bezahlen können.
Weitere Preisinformationen zu Spanner finden Sie unter Spanner-Preise.
Die folgenden Ranking-Tools werden nach dem Abrufen unterstützt:
LLM-Reranker: Vertex AI RAG Engine verwendet das von Ihnen angegebene LLM-Modell, um die Abrufergebnisse neu zu ordnen. Die Kosten für das LLM-Modell werden direkt in Ihrem Projekt angezeigt und abgerechnet.
Vertex AI Search Ranking API:
Die Vertex AI RAG Engine verwendet die Vertex AI Search Ranking API, um die Abrufergebnisse neu zu ranken. Sie sehen und bezahlen die Ranking API direkt über Ihr Projekt.
Nächste Schritte
Informationen zur Verwendung des Vertex AI SDK zum Ausführen von Vertex AI RAG Engine-Aufgaben finden Sie unter RAG-Kurzanleitung für Python.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-04 (UTC)."],[],[],null,["# Vertex AI RAG Engine billing\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page describes the Vertex AI RAG Engine pricing and billing based on the Vertex AI RAG Engine components you use, such as models, reranking, and vector storage.\n\nFor more information, see the [Vertex AI RAG Engine overview](/vertex-ai/generative-ai/docs/rag-engine/rag-overview) page.\n\nPricing and billing\n-------------------\n\nVertex AI RAG Engine is free to use. However, if you configure\nVertex AI RAG Engine components, the billing might be affected.\n\nThis table explains how billing works when you use the RAG components.\n\nWhat's next\n-----------\n\n- To learn how to use the Vertex AI SDK to run Vertex AI RAG Engine tasks, see [RAG quickstart for\n Python](/vertex-ai/generative-ai/docs/rag-quickstart).\n- To learn about grounding, see [Grounding\n overview](/vertex-ai/generative-ai/docs/grounding/overview).\n- To learn more about the responses from RAG, see [Retrieval and Generation Output of Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/model-reference/rag-output-explained).\n- To learn about the RAG architecture:\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and Vector Search](/architecture/gen-ai-rag-vertex-ai-vector-search)\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and AlloyDB for PostgreSQL](/architecture/rag-capable-gen-ai-app-using-vertex-ai)."]]