Vertex AI 的敏感数据发现

本页介绍了可与 Vertex AI 搭配使用的 Sensitive Data Protection 发现功能。

Sensitive Data Protection 发现功能可帮助您了解 Vertex AI 数据集中包含的训练数据。发现功能会生成数据分析文件,提供检测到的信息类型 (infoTypes) 和训练数据的敏感度级别等数据分析。

如需加入此预览版计划,请发送电子邮件至 cloud-dlp-feedback@google.com

优势

此功能具有以下优势:

  • 您可以在组织、文件夹或项目级监控 Vertex AI 数据集是否包含敏感数据,并生成报告来显示结果
  • 您可以将发现结果发送到 Security Command Center,以便在评估组织的安全状况时考虑包含潜在敏感数据的工作负载。
  • 如果发现工具检测到敏感训练数据,您可以使用数据配置文件来确定哪些资源需要进一步调查。您可以执行深度检查,并查找资源中的所有敏感实例。

支持的数据源

此功能可以分析 Vertex AI 数据集中引用的以下类型的训练数据:

  • Cloud Storage 存储分区中的训练数据。如需了解支持的文件类型,请参阅文件集群
  • BigQuery 表中的训练数据。

工作原理

当您对 Vertex AI 数据集进行性能分析时,敏感数据保护功能会生成文件存储区数据配置文件表数据配置文件,具体取决于训练数据的存储位置:Cloud Storage 存储桶或 BigQuery 表。数据分析文件可提供与数据集关联的训练数据的分析洞见和元数据。对于每个 Vertex AI 数据集,生成的数据分析文件包含以下信息。

  • 训练数据的敏感度和数据风险级别
  • 训练数据中发现的敏感信息的类型,例如驾照 ID 和电子邮件地址

如需查看每个文件存储区数据分析文件中的分析洞见和元数据的完整列表,请参阅文件存储区数据分析文件

如需查看每个表数据剖析文件中的深入分析和元数据的完整列表,请参阅表数据剖析文件

如需详细了解发现服务,请参阅数据配置文件

价格

分析 Vertex AI 数据时,您需要根据所选的发现价格模式支付 Sensitive Data Protection 费用。

此外,如果您的训练数据位于 Cloud Storage 存储桶中,则 Cloud Storage 会针对敏感数据保护功能对训练数据进行特征分析的请求向您收费。以下部分介绍了您需要支付的相关 Cloud Storage 费用。

B 类操作

您需要为 Sensitive Data Protection 在 Cloud Storage 存储分区中分析训练数据的过程中执行的 B 类 (storage.buckets.get) 操作支付费用。

如需了解 Cloud Storage 针对 B 类操作收取的费用,请参阅 Cloud Storage 文档中的操作费用

检索费用

对于采用非标准存储类别的对象,您需要支付检索费用。如需了解 Cloud Storage 的数据检索费用,请参阅 Cloud Storage 文档中的检索费用

后续步骤