在 Gemini 的协助下分析存储的数据

本页面介绍如何通过 Gemini 使用 AI 赋能的辅助功能,帮助您更好地了解 Cloud Storage 中的数据存储情况。使用 Gemini Cloud Assist 时,您可以输入有关 Cloud Storage 一般工作原理的提示;启用 Storage Intelligence 订阅后,您可以输入有关特定存储分区和对象的提示。

然后,您可以使用 Gemini Cloud Assist 提供的信息执行以下操作:

  • 分析数据使用模式和趋势

  • 发现节省存储费用的机会

  • 优化数据以确保安全性和合规性

  • 就数据管理做出明智决策

未经您的明确许可,Gemini 不会将您的提示或其回答作为数据来训练模型。如需详细了解 Google 如何使用您的数据,请参阅 Gemini for Google Cloud 如何使用您的数据

本页面适用于开发者、数据分析师或数据工程师、平台管理员、财务运维人员和合规官。本文档假设您了解如何使用 Cloud Storage 和查询关联的数据集

Gemini 可以回答哪些提示?

如需了解数据存储情况,您可以向 Gemini Cloud Assist 提供提示,即自然语言陈述或问题。

如果您单独使用 Gemini Cloud Assist,而未订阅 Storage Intelligence,则可以询问有关 Cloud Storage 一般工作原理的问题,例如:

  • “如何将对象从一个存储类别转换到另一个存储类别?”

  • “如何为存储桶启用软删除?”

启用 Storage Intelligence 订阅后,您还可以提出与节省费用的机会、安全性和合规性以及数据发现相关的提示。Gemini Cloud Assist 可以使用存储空间分析数据集中包含的元数据生成数据洞见,这些数据洞见是对有关存储桶和对象元数据及用量的提示的回答。您可以提出以下提示:

  • 与用量和节省费用相关的提示:

    • “未启用对象生命周期管理功能的 5 个最大存储分区”

    • “未启用 Autoclass 的 5 个最大存储分区”

  • 与安全性和合规性相关的提示:

    • “未启用对象版本控制的 5 个最大存储分区”

    • “未来 30 天内保留政策失效日期最早的 5 个最大对象”

  • 与数据发现相关的提示:

    • “包含大量小文件(每个文件的大小均小于 1 MB)的水桶”

    • “Standard 存储类别中小于 50 MB 的对象”

准备工作

如需将 Gemini Cloud Assist 用于与 Cloud Storage 相关的常规提示,您必须先设置 Gemini Cloud Assist,包括获取所需的角色。

设置 Gemini Cloud Assist

确保已为您的 Google Cloud 项目设置了 Gemini Cloud Assist

如果您想输入与特定存储分区和对象相关的提示,还必须完成以下前提步骤:

  1. 启用存储空间分析情报,以便您能够使用存储空间分析数据集。

  2. 创建存储空间分析数据集,Gemini Cloud Assist 将对其进行分析,以提供有关特定存储分区和对象的信息。

    或者,如果您想使用现有数据集,可以获取访问该数据集所需的 IAM 角色。

  3. 确保存储空间分析服务代理有权访问 Gemini Cloud Assist 将分析的数据集。这样一来,就可以读取和分析数据集了。

启用存储空间分析情报

确保在包含或将包含以下数据集的项目、文件夹或组织中启用 Storage Intelligence:Gemini Cloud Assist 将使用这些数据集来回答提示。

创建数据集

创建数据集,然后将数据集关联到 BigQuery

授予访问数据集所需的角色

当用户首次创建数据集配置时,系统会创建存储空间分析服务代理。服务代理遵循命名格式 service-PROJECT_NUMBER@gcp-sa-storageinsights.iam.gserviceaccount.com,并显示在 Google Cloud 控制台的 IAM 页面上(如果您选择包括 Google 提供的角色授权复选框)。

如需使用 Gemini Cloud Assist 处理与存储桶或对象元数据相关的提示,您需要启用存储空间分析服务代理来读取数据集。请让管理员向服务代理授予组织、文件夹或项目(包含您要分析的数据集)的 BigQuery Data Viewer 角色 (roles/bigquery.dataViewer)。

如需了解如何向服务代理授予角色,请参阅创建服务代理并授予角色

获取访问数据集所需的角色

如需获得获取存储桶和对象元数据分析所需的权限,请让管理员为您授予包含要分析的数据集的项目、文件夹或组织的以下 IAM 角色:

如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

您也可以通过自定义角色或其他预定义角色来获取所需的权限。

使用自然语言提示分析数据存储空间

如需向 Gemini Cloud Assist 输入提示,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Cloud Storage 存储空间分析页面。

    前往“存储空间分析”

  2. 在工具栏中,点击星光图标 (Gemini) 以打开 Cloud Assist 对话面板。

    系统随即会显示 Cloud Assist 对话面板。

  3. Cloud Assist 聊天面板中,输入有关数据存储的自然语言提示。例如,您可以输入以下内容:

    Which is my largest bucket
  4. 点击 生成)。

  5. 如果系统提示,请输入 Gemini 将分析以生成回答的数据集的名称,然后点击 生成)。

    如果成功,Gemini Cloud Assist 会生成类似于以下内容的回答:

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Bucket name Size
    my-bucket 39.1 TB

    系统还会返回 Gemini Cloud Assist 使用的基础 SQL 查询。生成的 SQL 查询类似于以下内容:

    SELECT bucket_id, bucket_size
    FROM buckets
    WHERE project_id = 'example-project'
    ORDER BY bucket_size DESC
    LIMIT 1;
    

(可选)您可以输入建议的提示:

  1. 在 Google Cloud 控制台中,前往 Cloud Storage 存储空间分析页面。

    前往“存储空间分析”

  2. 建议的提示部分,选择建议的提示。例如,建议的提示可能如下所示:Storage size broken down by object content type

  3. 如果成功,Gemini Cloud Assist 会生成类似于以下内容的回答:

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Content type Size
    MP4 483.2 GB
    MOV 239.1 GB
    MP3 125.8 GB

    系统还会返回 Gemini Cloud Assist 使用的基础 SQL 查询。生成的 SQL 查询类似于以下内容:

    SELECT
    oa.contentType, ROUND(sum(oa.size) / (1024 * 1024 * 1024), 2) AS total_size_gb
    FROM object_attributes_latest AS oa
    GROUP BY oa.contentType
    ORDER BY sum(oa.size) DESC;

限制

  • 使用提示分析 Cloud Storage 资源时,您可以在提示中指定最多 5 个资源。例如:5 largest buckets without Autoclass enabled。即使您在提示中包含的资源超过 5 个,Gemini Cloud Assist 也只能返回符合提示条件的前 5 个资源的结果。

  • Gemini Cloud Assist 会使用存储空间分析数据集中包含的存储桶和对象元数据来回答有关数据存储的提示。

    以下数据在存储空间分析数据集中不可用,这意味着 Gemini Cloud Assist 缺乏适当的上下文来回答与这些数据相关的提示:

    • 具体费用数据,例如“我的存储桶每月费用是多少”。

    • 活动数据,例如:“我的对象的上次访问时间是什么时候”。

    • 有关某些功能(例如软删除)配置的数据。例如:“哪些存储分区未启用软删除功能”。

    Gemini Cloud Assist 也缺乏适当的上下文来回答与时序信息相关的提示。例如:“我的数据桶在过去 3 周内增长了多少”。这是因为 Gemini Cloud Assist 只会读取数据集的最新快照。

后续步骤