Vertex AI RAG 引擎结算

本页面介绍了 Vertex AI RAG 引擎的定价和结算方式,具体取决于您使用的 Vertex AI RAG 引擎组件,例如模型、重新排名和向量存储。

如需了解详情,请参阅 Vertex AI RAG 引擎概览页面。

价格和结算

Vertex AI RAG 引擎可免费使用。不过,如果您配置 Vertex AI RAG 引擎组件,则结算可能会受到影响。

下表说明了使用 RAG 组件时的结算方式。

组件 Vertex AI RAG 引擎的结算方式
数据注入 Vertex AI RAG 引擎支持从不同的数据源注入数据。例如,上传本地文件、Cloud Storage 和 Google 云端硬盘。从 Vertex AI RAG 引擎访问这些数据源中的文件是免费的,但这些数据源可能会收取数据传输费用。例如,数据出站流量费用。
数据转换(文件解析)
  • 默认解析器:免费。
  • LLM 解析器:Vertex AI RAG 引擎使用您指定的 LLM 模型来解析文件,您将直接在项目中查看并支付 LLM 模型费用。
  • Document AI 布局解析器:Vertex AI RAG 引擎使用您指定的 Document AI 布局解析器来处理文件,您将直接在项目中查看并支付 Document AI 布局解析器的使用费用。
数据转换(文件分块) 支持免费的固定大小分块。
嵌入生成 Vertex AI RAG 引擎会使用您指定的嵌入模型来编排嵌入生成,您的项目需支付与该模型关联的费用。

如需详细了解价格信息,请参阅 Vertex AI 中构建和部署 AI 模型的费用

数据索引和检索 RAG 引擎支持以下两个类别的向量数据库来用于向量搜索:
  • RAG 管理的数据库
  • 自带向量数据库

RAG 管理的数据库有以下两个用途:
  • RAG 管理的数据库会存储 RAG 资源,例如 RAG 语料库和 RAG 文件。文件内容会被排除。
  • 根据您的选择,为向量搜索提供嵌入索引编制和检索功能。

RAG 管理的数据库使用 Spanner 实例作为后端。

对于您的每个项目,Vertex AI RAG 引擎都会预配一个特定于客户的 Google Cloud 项目,并管理存储在 Vertex AI RAG 引擎中的 RAG 管理的资源,从而以物理方式隔离数据。

如果您选择 RagManagedDB 基本层级或扩缩层级,Vertex AI RAG 引擎会在相应项目中预配 Spanner 企业版实例:

  • 基本层级:100 个处理单元,支持备份
  • 扩缩层级:从 1 个节点(1,000 个处理单元)开始,自动扩缩至最多 10 个节点,支持备份

如果项目中的任何 RAG 语料库选择使用 RAG 管理的数据库进行向量搜索,您将需要为 RAG 管理的 Spanner 实例付费。

Vertex AI RAG 引擎会将 RAG 管理的相应项目产生的 Spanner 费用显示在您的 Google Cloud 项目中,以便您可以查看和支付 Spanner 实例费用。

如需详细了解 Spanner 的价格,请参阅 Spanner 价格

Vertex AI RAG 引擎的重新排名 以下排名工具在检索后受支持:
  • LLM 重新排名器:Vertex AI RAG 引擎使用您指定的 LLM 模型对检索结果进行重新排名,您将直接在项目中查看并支付 LLM 模型费用。
  • Vertex AI Search Ranking API:Vertex AI RAG 引擎使用 Vertex AI Search Ranking API 对检索结果进行重新排名,您将直接在项目中查看并支付 Ranking API 费用。

删除 Vertex AI RAG 引擎

以下代码示例演示了如何针对 Google Cloud 控制台、Python 和 REST 删除 Vertex AI RAG 引擎:

后续步骤