Cloud Data Loss Prevention (Cloud DLP) 现已成为敏感数据保护功能的一部分。API 名称保持不变：Cloud Data Loss Prevention API (DLP API)。如需了解构成敏感数据保护的服务，请参阅敏感数据保护概览。

此页面由 Cloud Translation API 翻译。

分析单个项目中的 Vertex AI 数据

本页介绍了如何在项目一级配置 Vertex AI 数据发现。如果您想对组织或文件夹进行数据分析，请参阅对组织或文件夹中的 Vertex AI 数据进行性能分析。

如需详细了解发现服务，请参阅数据配置文件。

准备工作

确保您的项目已启用 Cloud Data Loss Prevention API：
确认您拥有在项目级别配置数据分析所需的 IAM 权限。
您必须在有要分析的数据的每个区域都提供检查模板。如果您想针对多个区域使用单个模板，可以使用存储在 global 区域中的模板。如果组织政策阻止您在 global 区域创建检查模板，则您必须为每个区域设置专用检查模板。如需了解详情，请参阅数据驻留注意事项。

在此任务中，您只能在 global 区域创建检查模板。如果您需要为一个或多个地区创建专用检查模板，则必须先创建这些模板，然后才能执行此任务。
您可以配置敏感数据保护，以便在发生特定事件（例如敏感数据保护分析新数据集时）向 Pub/Sub 发送通知。如果您想使用此功能，则必须先创建 Pub/Sub 主题。

创建扫描配置

转到创建扫描配置页面。

转到“创建扫描配置”
前往您的项目。在工具栏上，点击项目选择器，然后选择您的项目。

以下部分详细介绍了创建扫描配置页面中的步骤。在每个部分结束时，点击继续。

选择发现类型

选择 Vertex AI。

选择范围

执行下列其中一项操作：

如果您要扫描单个数据集，请选择扫描一个数据集。

对于每个数据集，您只能有一个单资源扫描配置。如需了解详情，请参阅分析单个数据资源。

填写您要分析的数据集的详细信息。
如果您要执行标准的项目级分析，请选择扫描所选项目。

管理时间表

如果默认性能分析频率符合您的需求，您可以跳过创建扫描配置页面的此部分。

配置此部分的原因如下：

对所有数据或特定数据子集的性能分析频率进行精细调整。
指定您不想分析的数据集。
指定您不希望多次分析的数据集。

如需对性能分析频率进行精细调整，请按以下步骤操作：

点击添加时间表。
在过滤条件部分，您可以定义一个或多个过滤条件，以指定哪些数据集在时间表的范围内。

指定一个项目 ID 或一个用于指定一个或多个项目的正则表达式。正则表达式必须遵循 RE2 语法。

例如，如果您希望将项目中的所有数据集包含在过滤条件中，请在项目 ID 字段中输入项目 ID。

如果您想添加更多过滤条件，请点击添加过滤条件，然后重复此步骤。
点击频次。
在频率部分，指定发现服务是否应对您选择的数据集进行性能分析，以及如果进行，则频率为何：
- 如果您不希望对数据集进行分析，请关闭对此类数据进行分析。
- 如果您希望至少对数据集进行一次性能分析，请让对此数据进行性能分析保持开启状态。
  
  在本部分的后续字段中，您可以指定系统是否应重新分析您的数据，以及哪些事件应触发重新分析操作。如需了解详情，请参阅数据配置文件生成频率。
  1. 对于按计划，请指定您希望重新分析数据集的频率。无论数据集是否发生了任何更改，系统都会重新分析这些数据集。
  2. 对于检查模板发生更改时，请指定您是否希望在关联的检查模板更新时重新分析数据，如果是，则指定重新分析的频率。
    注意：您可以在本页面的选择检查模板步骤中指定要使用的检查模板。
    
    当发生以下任一情况时，系统会检测到检查模板更改：
    - 扫描配置中的检查模板名称发生更改。
    - 检查模板的 updateTime 发生更改。
可选：点击条件。

在条件部分，您可以指定在敏感数据保护分析数据集之前，数据集（在过滤条件中定义）必须满足的任何条件。

如有必要，请设置以下内容：
- 最低条件：如果您希望在数据集达到特定年龄后再对其进行分析，请启用此选项。然后，输入最短时长。
- 时间条件：如果您不希望系统对旧数据集进行分析，请开启此选项。然后，使用日期选择器选择日期和时间。在所选时间戳当天或之前创建的所有数据集都将从性能分析中排除。
示例条件

假设您采用以下配置：
- 最低条件
  - 最短时长：24 小时
- 时间条件
  - 时间戳：2022 年 5 月 4 日晚上 11:59
在这种情况下，敏感数据保护功能会排除 2022 年 5 月 4 日晚 11:59（美国东部标准时间）当天或之前创建的所有数据集。在该日期和时间之后创建的数据集中，敏感数据保护功能仅会分析至少存在 24 小时的数据集。
点击完成。
如果您想添加更多时间表，请点击添加时间表，然后重复上述步骤。
如需指定时间表之间的优先级，请使用向上键和向下键对其重新排序。

时间表的顺序指定了如何解决时间表之间的冲突。如果某个数据集与两个不同时间表的过滤条件匹配，则时间表列表中较靠上的时间表将决定该数据集的性能分析频率。

注意：如果您的发现功能定价模式为订阅模式，Sensitive Data Protection 分析数据的速率会受到您购买的容量的影响。如需确定您的每日性能分析容量，请参阅监控利用率。如果您预配的容量不足，系统可能不会遵循您在时间表中设置的性能分析频率。如果有待分析的数据积压，则时间安排顺序不会决定 Sensitive Data Protection 分析积压数据的顺序。而是，范围内的所有数据资源都会在队列中获得随机分配的槽位。

列表中的最后一项时间表始终标记为默认时间表。此默认时间表涵盖您所选范围中与您创建的任何时间表都不匹配的数据集。此默认时间表遵循系统默认的性能分析频率。
如果您想调整默认时间表，请点击 修改时间表，然后根据需要调整设置。

选择检查模板

根据您希望提供检查配置的方式，选择以下选项之一。无论您选择哪个选项，敏感数据保护功能都会扫描数据存储区域中的数据。也就是说，您的数据不会离开其来源区域。

选项 1：创建检查模板

如果您想在 global 区域创建新的检查模板，请选择此选项。

点击创建新的检查模板。
可选：如需修改 infoType 的默认选择，请点击管理 infoType。

如需详细了解如何管理内置和自定义 infoType，请参阅通过Google Cloud 控制台管理 infoType。

您必须至少选择一种 infoType，才能继续。
可选：通过添加规则集并设置置信度阈值，进一步配置检查模板。如需了解详情，请参阅配置检测。

Sensitive Data Protection 创建扫描配置后，会将此新检查模板存储在 global 区域。

选项 2：使用现有的检查模板

如果您有要使用的现有检查模板，请选择此选项。

点击选择现有的检查模板。
输入您要使用的检查模板的完整资源名称。 Region（区域）字段会自动填充检查模板存储所在区域的名称。
您输入的检查模板必须与要剖析的数据位于同一区域。

为了遵循数据驻留要求，Sensitive Data Protection 不会在存储检查模板的区域之外使用该模板。

如需查找检查模板的完整资源名称，请按以下步骤操作：
1. 转到检查模板列表。系统会在另一个标签页中打开此页面。
  
  前往“检查模板”页面
2. 切换到包含您要使用的检查模板的项目。
3. 在模板标签页上，点击要使用的模板的 ID。
4. 在打开的页面上，复制模板的完整资源名称。完整资源名称采用以下格式：
```
projects/PROJECT_ID/locations/REGION/inspectTemplates/TEMPLATE_ID
```
5. 在创建扫描配置页面的模板名称字段中，粘贴模板的完整资源名称。
如需为其他地区添加检查模板，请点击添加检查模板，然后输入模板的完整资源名称。对您有专用检查模板的每个区域重复此操作。
可选：添加存储在 global 区域中的检查模板。敏感数据保护功能会自动针对您未指定专用检查模板的区域中的数据使用该模板。

注意：如果您未添加存储在 global 区域中的检查模板，敏感数据保护功能将无法对没有专用检查模板的区域中的数据进行性能分析。如需了解详情，请参阅数据驻留注意事项。

添加操作

在以下部分中，您可以指定敏感数据保护在生成数据配置文件后要执行的操作。

如需了解其他 Google Cloud 服务在您配置操作时可能会收取的费用，请参阅导出数据配置文件的价格。

发布到 Security Command Center

在 Security Command Center 中对漏洞和威胁发现结果进行分类并制定响应计划时，数据配置文件中的发现结果可提供背景信息。

您必须先在组织级层激活 Security Command Center，然后才能使用此操作。在组织级层启用 Security Command Center 后，您可以接收来自敏感数据保护等集成服务的发现结果。Sensitive Data Protection 可与 Security Command Center 的所有服务层级配合使用。

如果未在组织级层激活 Security Command Center，敏感数据保护发现结果将不会显示在 Security Command Center 中。如需了解详情，请参阅查看 Security Command Center 的激活级层。

如需将数据分析结果发送到 Security Command Center，请确保发布到 Security Command Center 选项处于开启状态。

如需了解详情，请参阅将数据分析文件发布到 Security Command Center。

将数据配置文件副本保存到 BigQuery

Sensitive Data Protection 会将每个生成的数据剖析文件的副本保存到 BigQuery 表中。如果您未提供首选表的详细信息，Sensitive Data Protection 会在项目中创建数据集和表。默认情况下，数据集名为 sensitive_data_protection_discovery，表名为 discovery_profiles。

通过此操作，您可以保留所有已生成配置文件的历史记录。此历史记录对于创建审核报告和可视化数据配置文件非常有用。您还可以将这些信息加载到其他系统。

此外，使用此选项，您可以在一个视图中查看所有数据剖析文件，而不考虑数据位于哪个区域。虽然您也可以通过Google Cloud 控制台查看数据配置文件，但控制台一次只能显示一个区域的配置文件。

当敏感数据保护功能无法对数据集进行分析时，它会定期重试。为了最大限度地减少导出数据中的噪声，敏感数据保护仅将成功生成的配置文件导出到 BigQuery。

从您开启此选项开始，Sensitive Data Protection 就会开始导出配置文件。在您启用导出功能之前生成的配置文件不会保存到 BigQuery。

如需了解您在分析数据配置文件时可以使用的一些查询示例，请参阅分析数据配置文件。

将发现结果示例保存到 BigQuery

敏感数据保护功能可以将示例发现结果添加到您选择的 BigQuery 表中。示例发现结果仅代表所有发现结果的一部分，可能并不代表发现的所有 infoType。通常，系统会为每个数据集生成大约 10 条示例发现结果，但每次运行发现功能时，此数量可能会有所不同。

每项发现结果都包含检测到的实际字符串（也称为引用）及其确切位置。

如果您想评估检查配置是否与您要标记为敏感的信息类型正确匹配，此操作非常有用。您可以使用导出的数据配置文件和导出的示例分析结果来运行查询，详细了解被标记的具体内容、与其匹配的 infoType、确切位置、计算出的敏感度级别和其他详细信息。

如需将发现结果示例保存到 BigQuery 表，请按以下步骤操作：

开启将发现结果示例保存到 BigQuery。
输入要保存示例发现结果的 BigQuery 表的详细信息。

您为此操作指定的表必须不同于用于将数据剖析文件副本保存到 BigQuery 操作的表。
- 对于项目 ID，请输入您要将发现结果导出到的现有项目的 ID。
- 对于 Dataset ID，输入项目中现有数据集的名称。
- 在表 ID 中，输入您要将发现结果保存到的 BigQuery 表的名称。如果此表不存在，敏感数据保护功能会使用您提供的名称自动为您创建此表。

如需了解保存在 BigQuery 表中的每项发现结果的内容，请参阅 DataProfileFinding。

发布到 Pub/Sub

开启发布到 Pub/Sub 后，您可以根据性能分析结果执行程序化操作。您可以使用 Pub/Sub 通知制定工作流，以发现和修复存在重大数据风险或敏感性的发现。

如需向 Pub/Sub 主题发送通知，请按以下步骤操作：

开启发布到 Pub/Sub。

系统会显示一个选项列表。每个选项都描述了导致敏感数据保护功能向 Pub/Sub 发送通知的事件。
选择应触发 Pub/Sub 通知的事件。

如果您选择每当更新配置文件时就发送 Pub/Sub 通知，则当配置文件中的敏感度级别、数据风险级别、检测到的 infoType、公开访问权限和其他重要指标发生变化时，敏感数据保护功能会发送通知。
对于您选择的每项事件，请按以下步骤操作：
1. 输入主题的名称。名称必须采用以下格式：
```
projects/PROJECT_ID/topics/TOPIC_ID
```
  替换以下内容：
  - PROJECT_ID：与 Pub/Sub 主题关联的项目的 ID。
  - TOPIC_ID：Pub/Sub 主题的 ID。
2. 指定是在通知中包含完整的数据集配置文件，还是仅包含所分析数据集的完整资源名称。
3. 设置必须达到的最低数据风险等级和敏感程度，以便 Sensitive Data Protection 发送通知。
4. 指定必须同时满足数据风险和敏感性条件，还是只满足其中一个条件即可。例如，如果您选择 AND，则必须同时满足数据风险和敏感性条件，Sensitive Data Protection 才会发送通知。

注意： 与您的项目关联的服务代理必须对 Pub/Sub 主题拥有发布权限。具有发布权限的角色示例包括 Pub/Sub Publisher 角色 (roles/pubsub.publisher)。如果 Pub/Sub 主题存在配置或权限问题，敏感数据保护功能最多会重试两周时间来发送 Pub/Sub 通知。两周后，系统会舍弃该通知。

以切面形式发送到 Dataplex Catalog

借助此操作，您可以根据数据分析中的洞见，将 Dataplex Catalog 方面添加到经过分析的数据集。此操作仅适用于新建和更新的个人资料。系统不会将未更新的现有配置文件发送到 Dataplex。

启用此操作后，Sensitive Data Protection 会为您分析的每个新数据集或更新后的数据集将 Sensitive Data Protection profile 方面附加到 Dataplex 条目。生成的方面包含从数据配置文件中收集的数据洞见。然后，您可以在组织和项目中搜索具有特定 Sensitive Data Protection profile 方面值的条目。

如需将数据配置文件发送到 Dataplex，请确保已启用以切面形式发送到 Dataplex Catalog 选项。

如需了解详情，请参阅根据数据分析中的洞见添加 Dataplex Catalog 方面。

为图片设置后备处理位置

通常，敏感数据保护功能会在数据存储的位置处理您的数据。不过，图片只能在多区域或 global 区域处理。如果您设置了后备位置，则敏感数据保护功能会使用您的后备位置来处理不在多区域或 global 区域内的图片。如果您跳过此部分，系统将不会处理这些图片。

如需设置图片处理的后备位置，请选择以下一个或两个选项：

回退到多区域位置：如果无法在图片的原始位置处理图片，则系统会在与图片的原始位置对应的多区域位置处理图片。如果图片的原始位置没有对应的多区域，则系统会跳过该图片。
回退到全局：如果无法在原始位置处理图片，则系统会在 global 区域处理图片。

如果您同时选择这两项，Sensitive Data Protection 会选择要用作后备位置的位置。

设置用于存储配置的位置

点击资源位置列表，然后选择要存储此扫描配置的区域。您日后创建的所有扫描配置也会存储在此位置。

您选择存储扫描配置的位置不会影响要扫描的数据。系统会扫描存储数据的同一个区域中的数据。如需了解详情，请参阅数据驻留注意事项。

检查并创建

如果您想确保在创建扫描配置后系统不会自动开始分析，请选择在暂停模式下创建扫描。
此选项适用于以下情况：
- 您已选择将数据分析文件保存到 BigQuery，并且希望确保服务代理对将保存数据分析文件副本的 BigQuery 表具有写入权限。
- 您选择将发现结果示例保存到 BigQuery，并且希望确保服务人员对将保存发现结果示例的 BigQuery 表具有写入权限。
- 您已配置 Pub/Sub 通知，并希望向服务代理授予发布权限。
检查设置，然后点击创建。
Sensitive Data Protection 会创建扫描配置并将其添加到发现扫描配置列表中。

如需查看或管理扫描配置，请参阅管理扫描配置。

后续步骤

了解如何管理数据分析文件。

了解如何管理扫描配置。

了解如何接收和解析数据性能分析器发布的 Pub/Sub 消息。

了解如何排查数据分析文件存在的问题。

分析单个项目中的 Vertex AI 数据 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

准备工作

创建扫描配置

选择发现类型

选择范围

管理时间表

示例条件

选择检查模板

选项 1：创建检查模板

选项 2：使用现有的检查模板

添加操作

发布到 Security Command Center

将数据配置文件副本保存到 BigQuery

将发现结果示例保存到 BigQuery

发布到 Pub/Sub

以切面形式发送到 Dataplex Catalog

为图片设置后备处理位置

设置用于存储配置的位置

检查并创建

后续步骤

分析单个项目中的 Vertex AI 数据