借助 AI Applications,开发者可以充分利用 Google 的基础模型、搜索专业知识和对话式 AI 技术来创建企业级生成式 AI 应用。 作为早期技术,它的不断发展的功能和用途可能会造成误用、滥用以及意外或不可预见的后果。例如,AI 应用可能会生成意料之外的输出,包括令人反感、不顾他人感受或事实上不正确的文本。
鉴于这些风险和复杂情况,AI Applications 在设计时考虑到了 Google 的 AI 原则。但是,开发者必须了解和测试其模型,以便以负责任的方式安全部署。为了帮助开发者,AI Applications 具有内置的安全过滤条件,可帮助客户在其使用场景中阻止潜在的有害输出。如需了解详情,请参阅 Vertex AI Search 的安全设置。
将 AI Applications 集成到客户独特的应用场景和语境中时,可能需要考虑其他 Responsible AI 注意事项和模型限制。我们鼓励客户利用公平性、可解释性、隐私权和安全推荐做法。
Vertex AI Search 的安全设置
Vertex AI Search 提供安全搜索过滤器,用于过滤含有露骨内容的网站搜索结果。含有露骨内容的搜索结果可能包括色情内容、暴力内容和血腥内容。安全搜索过滤功能不适用于私密内容。
总结功能(无论是针对网站搜索还是私人内容)会过滤掉诋毁性、露骨色情、恶意或暴力信息等回答。此外,总结响应还包含安全属性,其中包括“有害类别”和可能被视为敏感的主题。
网站搜索
安全搜索可应用于 Vertex AI Search 编入索引的公开内容,例如网站。安全搜索功能处于开启状态时,无论客户是查询图片、视频还是网站,Vertex AI Search 都有助于从客户的 Vertex AI Search 搜索结果中滤除露骨内容。虽然这些过滤器的准确度并非 100%,但我们会不断评估和更新过滤功能。
在某些情境和使用情形下,客户可能需要访问各种信息(即使其中包含露骨内容),才能从 Vertex AI Search 中获得全面的数据洞见和结果。客户可以使用 API 通过将 safe_search
设置为“true”或“false”来启用和停用安全过滤条件。
如需为 Vertex AI Search 启用 SafeSearch,请使用以下 API 调用:
curl -X POST\
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)"
-H "Content-Type: application/json"\
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/servingConfigs/default_config:search"
-d '{
"query": { "input": "FREE_TEXT"},
"serving_config": "SERVING_CONFIG_ID",
"safe_search": "true",
}'
如需在 Vertex AI Search 中为“支持后续问题的搜索”功能启用 SafeSearch,请使用以下 API 调用:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/conversations/CONVERSATION_ID:converse" \
-d '{
"query": { "input": "FREE_TEXT"},
"serving_config": "SERVING_CONFIG_ID",
"safe_search": "true",
}'
safe_search
设置适用于搜索结果,也适用于 Vertex AI Search 输出(例如基于搜索结果的总结)。
Vertex AI Search 输出(例如总结)会根据安全属性列表进行评估,即使 safe_search
处于关闭状态,也会过滤掉可能有害的内容。
针对不公开的内容和网站搜索的总结功能
Vertex AI Search 输出(例如总结)会根据安全属性列表进行评估,该列表会过滤掉可能有害的内容,例如诋毁性、露骨色情、恶意或暴力信息,即使网站搜索的 safe_search
处于关闭状态也是如此。此外,您还可以在 Vertex AI Search API 响应中使用 safetyAttributes
过滤掉包含“有害类别”和可能被视为敏感的主题的回答。
后备响应
如果总结模型对请求的回答是空字符串或通用回答,则表示输入或输出会触发安全过滤条件。在 Vertex AI Search API 响应中,如果检测到潜在的违规情况,SummarySkippedReason
会设置为 BLOCKED_DUE_TO_POTENTIAL_POLICY_VIOLATION
。
如果您认为安全过滤器被错误地触发,请通过Google Cloud 控制台报告此问题。
其他资源
- 详细了解 Google 关于 Responsible AI 实践的建议
- 阅读我们的博客:Responsible AI 进度的共享日程