适用于 MaaS 的 Vertex AI 合作伙伴模型

Vertex AI 支持一组精选的由 Google 合作伙伴开发的模型。合作伙伴模型可与 Vertex AI 搭配,作为模型即服务 (MaaS) 使用,并作为托管式 API 提供。使用合作伙伴模型时,您可以继续向 Vertex AI 端点发送请求。合作伙伴模型是无服务器服务,因此您无需预配或管理基础设施。

您可以使用 Model Garden 发现合作伙伴模型,还可以使用 Model Garden 部署模型。如需了解详情,请参阅在 Model Garden 中探索 AI 模型。您可以在 Model Garden 中的模型卡片上找到每个可用合作伙伴模型的信息,但本指南仅记录了与 Vertex AI 搭配,作为 MaaS 执行的第三方模型。

Anthropic 的 Claude 和 Mistral 模型是可在 Vertex AI 上使用的第三方托管式模型的示例。

合作伙伴模型

以下合作伙伴模型在 Vertex AI Model Garden 上以托管式 API 的形式 (MaaS) 提供:

模型名称 模态 说明 快速入门
Claude Opus 4.1 语言、视觉 编码领域的行业领导者。它在需要集中精力并执行数千个步骤的长时间运行任务中可提供持续的性能,从而显著扩展了 AI 智能体的解决能力。非常适合为前沿代理产品和功能提供支持。 模型卡片
Claude Opus 4 语言、视觉 Claude Opus 4 在需要集中精力并执行数千个步骤的长时间运行任务中可提供持续的性能,从而显著扩展了 AI 智能体可以解决的问题范围。 模型卡片
Claude Sonnet 4.5 语言、视觉 Anthropic 的中型模型,可为实际应用中的智能体提供在编码、计算机使用、网络安全和处理电子表格等办公文件方面的功能。 模型卡片
Claude Sonnet 4 语言、视觉 Anthropic 的中型模型,具有出色的智能水平,适合大批量使用,例如编码、深入研究和智能体。 模型卡片
Anthropic 的 Claude 3.7 Sonnet 语言、视觉 业界领先的编码模型,可为 AI 智能体提供支持,是首个提供扩展思考的 Claude 模型。 模型卡片
Anthropic 的 Claude 3.5 Sonnet v2 语言、视觉 升级后的 Claude 3.5 Sonnet 是用于处理实际的软件工程任务和智能体功能的先进模型。Claude 3.5 Sonnet 依靠与其前代产品相同的价格和速度实现了这些进步。 模型卡片
Anthropic 的 Claude 3.5 Haiku 语言、视觉 Claude 3.5 Haiku 是 Anthropic 最快且最具成本效益的新一代模型,非常适合速度和经济性重要的应用场景。 模型卡片
Anthropic 的 Claude 3 Haiku 语言 Anthropic 最快的视觉和文本模型,能够近乎即时地回答基本的查询,旨在打造模仿人类互动的无缝 AI 体验。 模型卡片
Anthropic 的 Claude 3.5 Sonnet 语言 Claude 3.5 Sonnet 凭借 Anthropic 的中端模型 Claude 3 Sonnet 的速度和成本,在 Anthropic 的多种评估中优于 Anthropic 的 Claude 3 Opus。 模型卡片
Jamba 1.5 Large(预览版 语言 AI21 Labs 的 Jamba 1.5 Large 旨在提供优质的回答、高吞吐量,并且价格与同类别的其他模型相比具有竞争力。 模型卡片
Jamba 1.5 Mini(预览版 语言 AI21 Labs 的 Jamba 1.5 Mini 在质量、吞吐量和低成本方面取得了良好的平衡。 模型卡片
Mistral OCR (25.05) 语言、视觉 Mistral OCR (25.05) 是一款用于文档理解的光学字符识别 API。模型能够理解文档的每个元素,例如媒体、文本、表格和方程式。 模型卡片
Mistral Small 3.1 (25.03) 语言 Mistral Small 3.1 (25.03) 是 Mistral Small 模型的最新版本,具有多模态功能和更长的上下文长度。 模型卡片
Mistral Large (24.11) 语言 Mistral Large (24.11) 是 Mistral Large (24.07) 模型的下一个版本,提高了推理和函数调用功能。 模型卡片
Codestral (25.01) 代码 一种专为代码生成(包括填充中间代码和代码补全)而设计的先进模型。 模型卡片

具有容量保证的 Vertex AI 合作伙伴模型价格

Google 为某些合作伙伴模型提供预配的吞吐量,以便以固定费用为您的模型预留吞吐量。您可以决定吞吐量容量以及在哪些区域预留该容量。由于预配吞吐量请求的优先级高于标准随用随付请求,因此预配吞吐量可提高可用性。当系统过载时,只要吞吐量保持在预留吞吐量容量范围内,您的请求仍可完成。如需了解详情或订阅此服务,请与销售人员联系

区域端点和全球端点

对于区域级端点,请求由您指定的区域提供服务。如果您有数据驻留要求,或者模型不支持全球端点,请使用区域端点。

使用全球端点时,Google 可以使用您所用模型支持的任何区域来处理和响应您的请求,这在某些情况下可能会导致延迟时间更长。全球端点有助于提高整体可用性并减少错误。

使用全球端点时,区域端点在价格上没有差异。不过,全球端点的配额和支持的模型功能可能与区域端点不同。如需了解详情,请参阅相关的第三方模型页面。

指定全球端点

如需使用全球端点,请将区域设置为 global

例如,curl 命令的请求网址采用以下格式: https://aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/global/publishers/PUBLISHER_NAME/models/MODEL_NAME

对于 Vertex AI SDK,区域端点是默认端点。将区域设置为 GLOBAL 以使用全球端点。

支持的模型

以下模型支持使用全球端点:

限制全球 API 端点用量

为了帮助强制使用区域端点,请使用 constraints/gcp.restrictEndpointUsage 组织政策限制条件来阻止对全球 API 端点的请求。如需了解详情,请参阅限制端点用量

向用户授予对合作伙伴模型的访问权限

如需启用合作伙伴模型并发出提示请求, Google Cloud管理员必须设置所需的权限,并验证组织政策是否允许使用所需的 API

设置使用合作伙伴模型所需的权限

使用合作伙伴模式需要拥有以下角色和权限:

  • 您必须拥有 Consumer Procurement Entitlement Manager Identity and Access Management (IAM) 角色。任何被授予此角色的用户都可以在 Model Garden 中启用合作伙伴模型。

  • 您必须拥有 aiplatform.endpoints.predict 权限。此权限包含在 Vertex AI User IAM 角色中。如需了解详情,请参阅 Vertex AI User访问权限控制

控制台

  1. 如需向用户授予 Consumer Procurement Entitlement Manager IAM 角色,请转到 IAM 页面。

    进入 IAM

  2. 主账号列中,找到要为其启用合作伙伴模型访问权限的用户主账号,然后在对应的行中点击  修改主账号

  3. 修改权限窗格中,点击  添加其他角色

  4. 选择角色中,选择 Consumer Procurement Entitlement Manager

  5. 修改权限窗格中,点击  添加其他角色

  6. 选择角色中,选择 Vertex AI User

  7. 点击保存

gcloud

  1. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

  2. 授予在 Model Garden 中启用合作伙伴模型所需的 Consumer Procurement Entitlement Manager 角色

    gcloud projects add-iam-policy-binding  PROJECT_ID \
    --member=PRINCIPAL --role=roles/consumerprocurement.entitlementManager
    
  3. 授予包含发出提示请求所需的 aiplatform.endpoints.predict 权限的 Vertex AI User 角色:

    gcloud projects add-iam-policy-binding  PROJECT_ID \
    --member=PRINCIPAL --role=roles/aiplatform.user
    

    PRINCIPAL 替换为主账号的标识符。标识符的格式为 user|group|serviceAccount:emaildomain:domain,例如 user:cloudysanfrancisco@gmail.comgroup:admins@example.comserviceAccount:test123@example.domain.comdomain:example.domain.com

    输出是一个政策绑定列表,其中包含以下内容:

    -   members:
      -   user:PRINCIPAL
      role: roles/roles/consumerprocurement.entitlementManager
    

    如需了解详情,请参阅授予单个角色和 gcloud projects add-iam-policy-binding

设置合作伙伴模型访问权限的组织政策

如需启用合作伙伴模型,您的组织政策必须允许以下 API:Cloud Commerce Consumer Procurement API - cloudcommerceconsumerprocurement.googleapis.com

如果您的组织将组织政策设置为限制服务的使用,则组织管理员必须通过设置组织政策来验证是否允许 cloudcommerceconsumerprocurement.googleapis.com

此外,如果您有组织政策限制 Model Garden 中的模型使用,则该政策必须允许访问合作伙伴模型。如需了解详情,请参阅控制模型访问权限

合作伙伴模型监管合规性

当合作伙伴模型作为托管式 API 通过 Vertex AI 使用时,Vertex AI 上的生成式 AI认证仍然适用。如果您需要了解模型本身的详细信息,可以在相应的模型卡片中找到更多信息,也可以与相应的模型发布者联系。

对于 Vertex AI 上的合作伙伴模型,您的数据会以静态形式存储在所选的区域或多区域内,但数据处理的区域化程度可能会有所不同。如需详细了解合作伙伴模型的数据处理承诺,请参阅合作伙伴模型的数据驻留

使用 Vertex AI API(包括合作伙伴模型)时,客户提示和模型回答不会与第三方共享。Google 仅会按照客户的指示处理客户数据,如需了解详情,请参阅我们的《云端数据处理附录》