在 Gemini 的协助下分析存储的数据

本页介绍了如何通过 Gemini 使用 AI 赋能的协助功能,帮助您更好地了解 Cloud Storage 中的数据存储状况。使用 Gemini Cloud Assist 时,您可以输入有关 Cloud Storage 一般运作方式的问题;启用 Storage Intelligence 订阅后,您可以输入有关特定存储分区和对象的问题。

然后,您可以使用 Gemini Cloud Assist 提供的信息执行以下操作:

  • 分析数据使用情况模式和趋势

  • 发现节省存储费用的机会

  • 优化数据以确保安全和合规

  • 就如何管理数据做出明智决策

未经您的明确许可,Gemini 不会将您的提示或其回答作为数据来训练模型。如需详细了解 Google 如何使用您的数据,请参阅 Gemini for Google Cloud 如何使用您的数据

本页面适用于开发者、数据分析师或数据工程师、平台管理员、财务运营人员和合规官。本文假定您已了解如何使用 Cloud Storage 和查询关联的数据集

Gemini 可以回答哪些问题?

如需了解您的数据存储情况,您可以向 Gemini Cloud Assist 提供提示,即自然语言语句或问题。

如果您仅使用 Gemini Cloud Assist,而不订阅存储空间智能功能,则可以询问有关 Cloud Storage 一般运作方式的问题,例如:

  • “如何将对象从一个存储类别转换为另一个存储类别?”

  • “如何为存储分区启用软删除?”

启用 Storage Intelligence 订阅后,您还可以询问与节省费用机会、安全和合规性以及数据发现相关的问题。Gemini Cloud Assist 可以使用存储空间分析数据集中包含的元数据生成数据分析,这些数据分析是对有关存储分区和对象元数据和用量的提示的回答。您可以提出以下提示:

  • 与使用量和费用节省相关的提示:

    • “未启用对象生命周期管理的 5 个最大的存储分区”

    • “未启用 Autoclass 的 5 个存储分区中规模最大的存储分区”

  • 与安全和合规性相关的提示:

    • “未启用对象版本控制的 5 个存储分区”

    • “保留期限在未来 30 天内到期的 5 个最大对象”

  • 与数据发现相关的问题:

    • “包含大量小文件(每个小于 1 MB)的存储分区”

    • “Standard 存储类别中小于 50 MB 的对象”

准备工作

若要使用 Gemini Cloud Assist 获取与 Cloud Storage 相关的常规提示,您必须先设置 Gemini Cloud Assist,包括获取所需的角色。

如果您想输入与特定存储分区和对象相关的问题,还必须完成以下前提步骤:

  1. 启用存储空间分析情报,以便使用存储空间分析数据集。

  2. 创建一个存储空间分析数据集,Gemini Cloud Assist 将对其进行分析,以提供有关特定存储分区和对象的信息。

    或者,如果您要使用现有数据集,则可以获取访问现有数据集所需的 IAM 角色。

  3. 确保 Storage Insights 服务代理有权访问 Gemini Cloud Assist 将要分析的数据集。这样,您就可以读取和分析数据集了。

启用存储空间分析情报

确保在包含或将包含 Gemini Cloud Assist 用于回答问题的数据集的项目、文件夹或组织中启用存储空间智能

创建数据集

创建数据集将数据集关联到 BigQuery

授予访问数据集所需的角色

当用户首次创建数据集配置时,系统会创建一个 Storage Insights 服务代理。服务代理遵循命名格式 service-PROJECT_NUMBER@gcp-sa-storageinsights.iam.gserviceaccount.com,并显示在 Google Cloud 控制台的 IAM 页面上(如果您选择包含 Google 提供的角色授权复选框)。

如需使用 Gemini Cloud Assist 获取与存储分区或对象元数据相关的问题,您需要允许存储空间分析服务代理读取数据集。请让管理员向服务代理授予包含要分析的数据集的组织、文件夹或项目的 BigQuery Data Viewer 角色 (roles/bigquery.dataViewer)。

如需了解如何向服务代理授予角色,请参阅创建服务代理并授予角色

获取访问数据集所需的角色

如需获得获取存储分区和对象元数据数据分析所需的权限,请让管理员向您授予包含要分析的数据集的项目、文件夹或组织的以下 IAM 角色:

如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

您也可以通过自定义角色或其他预定义角色来获取所需的权限。

使用自然语言提示分析数据存储空间

如需向 Gemini Cloud Assist 输入提示,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Cloud Storage 的存储空间分析页面。

    前往“存储空间分析”

  2. 在工具栏中,点击 sparkGemini)以打开 Cloud Assist 聊天面板。

    系统随即会显示 Cloud Assist 聊天面板。

  3. Cloud Assist 聊天面板中,输入有关数据存储的自然语言提示。例如,您可以输入以下内容:

    Which is my largest bucket
  4. 点击 生成)。

  5. 如果系统提示,请输入 Gemini 将用于生成回答的数据集的名称,然后点击 生成)。

    如果成功,Gemini Cloud Assist 会生成类似于以下内容的响应:

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Bucket name Size
    my-bucket 39.1 TB

    系统还会返回 Gemini Cloud Assist 使用的底层 SQL 查询。生成的 SQL 查询类似于以下内容:

    SELECT bucket_id, bucket_size
    FROM buckets
    WHERE project_id = 'example-project'
    ORDER BY bucket_size DESC
    LIMIT 1;
    

(可选)您可以输入建议的提示:

  1. 在 Google Cloud 控制台中,前往 Cloud Storage 的存储空间分析页面。

    前往“存储空间分析”

  2. 建议的提示部分,选择一个建议的提示。例如,建议的提示可能如下所示:Storage size broken down by object content type

  3. 如果成功,Gemini Cloud Assist 会生成类似于以下内容的响应:

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Content type Size
    MP4 483.2 GB
    MOV 239.1 GB
    MP3 125.8 GB

    系统还会返回 Gemini Cloud Assist 使用的底层 SQL 查询。生成的 SQL 查询类似于以下内容:

    SELECT
    oa.contentType, ROUND(sum(oa.size) / (1024 * 1024 * 1024), 2) AS total_size_gb
    FROM object_attributes_latest AS oa
    GROUP BY oa.contentType
    ORDER BY sum(oa.size) DESC;

限制

  • 使用提示分析 Cloud Storage 资源时,您最多可以在提示中指定五项资源。例如:5 largest buckets without Autoclass enabled。即使您在问题中添加了超过 5 项资源,Gemini Cloud Assist 也只能返回与问题条件匹配的前 5 项资源的结果。

  • Gemini Cloud Assist 会使用存储空间分析数据集中包含的存储分区和对象元数据来回答与数据存储相关的问题。

    以下数据不包含在存储空间分析数据集中,这意味着 Gemini Cloud Assist 缺少适当的上下文来回答与这些数据相关的问题:

    • 具体费用数据,例如:“我的存储分区每月的费用是多少”。

    • 活动数据,例如:“我的对象的上次访问时间是什么”。

    • 与某些功能(例如软删除)的配置相关的数据。例如:“哪些存储分区未启用软删除”。

    Gemini Cloud Assist 还缺少回答与时间序列信息相关的提示的适当上下文。例如:“我的存储分区在过去 3 周内增长了多少”。这是因为 Gemini Cloud Assist 仅读取数据集的最新快照。

后续步骤