Responsible AI

借助 Vertex AI Agent Builder,开发者可以充分利用 Google 的基础模型、搜索专业知识和对话式 AI 技术,通过 Vertex AI 智能体和 Vertex AI Search 打造企业级生成式 AI 应用。作为一项处于早期阶段的技术,其不断发展的功能和用途可能会造成误用、滥用以及意外后果。例如,Vertex AI Agent Builder 可能会生成意料之外的输出,包括令人反感、不顾他人感受或事实上不正确的文本。

鉴于这些风险和复杂情况,Vertex AI Agent Builder 在设计时考虑到了 Google 的 AI 原则。但是,开发者必须了解和测试其模型,以便以负责任的方式安全部署。为了帮助开发者,Vertex AI Agent Builder 具有内置的安全过滤条件,可帮助客户在其使用场景中阻止潜在的有害输出。如需了解详情,请参阅 Vertex AI Search 的安全设置

将 Vertex AI Agent Builder 集成到客户独特的应用场景和语境中时,可能需要考虑其他 Responsible AI 注意事项和模型限制。我们鼓励客户利用公平性、可解释性、隐私权和安全推荐做法

Vertex AI Search 提供安全搜索过滤条件,用于滤除含有露骨内容的网站搜索结果。含有露骨内容的搜索结果可能包括色情内容、暴力内容和血腥内容。安全搜索过滤功能不适用于私密内容。

摘要功能(适用于网站搜索和私密内容)会滤除诋毁性、露骨色情、恶意或暴力信息等回答。此外,摘要响应还包含安全属性,包括“有害类别”和可能被视为敏感的主题。

网站搜索

安全搜索可应用于 Vertex AI Search 编入索引的公开内容,例如网站。安全搜索功能处于开启状态时,无论客户搜索图片、视频还是网站,Vertex AI Search 都会从其搜索结果中滤除露骨内容。虽然这些过滤器并非 100% 准确,但我们会不断评估和更新过滤功能。

在某些情境和用例中,客户可能需要访问各种信息(即使其中包含露骨内容),才能从 Vertex AI Search 中获取全面的数据洞见和结果。客户可以通过将 safe_search 设置为“true”或“false”来使用 API 启用和停用安全过滤条件。

如需为 Vertex AI Search 启用安全搜索,请使用以下 API 调用:

curl -X POST\
 -H "Authorization: Bearer $(gcloud auth application-default print-access-token)"
 -H "Content-Type: application/json"\
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/servingConfigs/default_config:search"
     -d '{
      "query": { "input": "FREE_TEXT"},
  "serving_config": "SERVING_CONFIG_ID",
  "safe_search": "true",
}'

如需在 Vertex AI Search 中为“搜索(有后续跟进)”启用安全搜索功能,请使用以下 API 调用:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/conversations/CONVERSATION_ID:converse" \
-d '{
  "query": { "input": "FREE_TEXT"},
  "serving_config": "SERVING_CONFIG_ID",
  "safe_search": "true",
}'

safe_search 设置适用于搜索结果,也适用于 Vertex AI Search 输出,例如摘要(基于搜索结果)。

系统会根据安全属性列表对 Vertex AI Search 输出(例如摘要)进行评估,即使关闭 safe_search,系统也会过滤潜在有害内容。

针对不公开内容和网站搜索的摘要功能

Vertex AI Search 输出(例如摘要)会根据安全属性列表进行评估,该列表会滤除可能有害的内容,例如诋毁性、露骨色情、恶意或暴力信息,即使网站搜索的 safe_search 处于关闭状态也是如此。此外,您还可以在 Vertex AI Search API 响应中使用 safetyAttributes 滤除包含“有害类别”和可能被视为敏感的主题的回答。

后备响应

如果摘要模型对请求的回复是空字符串或通用回答,则表示输入或输出会触发安全过滤条件。在 Vertex AI Search API 响应中,如果检测到潜在的违规情况,SummarySkippedReason 会设为 BLOCKED_DUE_TO_POTENTIAL_POLICY_VIOLATION

如果您认为安全过滤器被错误地触发,请通过 Google Cloud 控制台报告此问题

Vertex AI 代理的安全设置

Chat 会对用户询问和客服人员回答使用各种安全过滤机制。过滤内容包括诋毁性、露骨色情、恶意或暴力信息等类别。这可确保聊天对不安全的询问做出适当回复,并且回复通常是安全的。您还可以针对您认为不良的内容指定其他过滤条件,并在 Dialogflow 控制台中定义在应用过滤条件时使用的回退回答。如果您认为安全过滤功能被错误地触发,请通过 Google Cloud 控制台报告此问题。

Responsible AI 最佳实践

在利用 Vertex AI 代理时,我们建议遵循以下 Responsible AI 最佳实践:

  • 确保告知最终用户他们正在与聊天机器人互动

  • 告知用户系统是否会录制他们的回答以及何时录制(如果适用)

  • 为用户提供标记有害回答的方法

限制

Vertex AI 客服人员通过多种方式履行责任,包括针对侮辱性、露骨色情、有害或暴力信息等类别设置安全过滤器。不过,正如上文所述,这些安全过滤器并非 100% 准确。我们会不断评估和更新过滤功能,因此我们鼓励客户提供模型反馈、探索能够带来社会效益的用例,并避免在安全至关重要的情境中使用 Vertex AI Agent。

Vertex AI 代理是可为主题专家提供信息的众多工具之一,不适用于在无人监督的情况下用于决策场景。在纳入未启用安全过滤器的非结构化私密数据时,我们建议在使用前加强模型评估和人工验证。

其他资源