Gemini の支援機能を使用して保存されているデータを分析する

このページでは、Gemini で AI を活用したアシスト機能を使用して、Cloud Storage のデータ ストレージ ランドスケープを把握する方法について説明します。Gemini Cloud Assist を使用する場合は、Cloud Storage の一般的な動作に関するプロンプトを入力できます。Storage Intelligence サブスクリプションを有効にすると、特定のバケットとオブジェクトに関するプロンプトを入力できます。

そうして Gemini Cloud Assist から提供された情報を使用すると、次のことを行えます。

  • データ使用パターンと傾向を分析する

  • ストレージ費用を削減する機会を特定する

  • セキュリティとコンプライアンスのためにデータを最適化する

  • データの管理について十分な情報に基づいて意思決定する

Gemini が、お客様の明示的な許可なく、モデルをトレーニングするためにプロンプトやそのレスポンスをデータとして使用することはありせん。Google によるデータ使用の詳細については、Gemini for Google Cloud がデータを使用する方法をご覧ください。

このページは、開発者、データ アナリスト、データ エンジニア、プラットフォーム管理者、財務オペレーター、コンプライアンス担当者を対象としています。Cloud Storage の使用方法とリンク済みデータセットのクエリ方法を理解していることを前提としています。

Gemini が回答できるプロンプト

データ ストレージを把握するには、Gemini Cloud Assist にプロンプト(自然言語のステートメントまたは質問)を入力します。

Storage Intelligence サブスクリプションなしで Gemini Cloud Assist のみを使用する場合は、次のような Cloud Storage の一般的な動作に関するプロンプトで質問できます。

  • 「ストレージ クラス間でオブジェクトを移行するにはどうすればよいですか?」

  • 「バケットで復元可能な削除を有効にするにはどうすればよいですか?」

Storage Intelligence サブスクリプションを有効にすると、費用削減の機会、セキュリティとコンプライアンス、データ検出に関連するプロンプトで質問することも可能です。Gemini Cloud Assist は、Storage Insights データセットに含まれるメタデータを使用して、分析情報を生成できます。これは、バケットとオブジェクトのメタデータと使用状況に関するプロンプトに対する回答です。次のようなプロンプトで質問できます。

  • 使用量と費用削減に関連するプロンプト:

    • 「オブジェクトのライフサイクル管理がないバケットを大きいものから 5 つ」

    • 「Autoclass が有効になっていないバケットを大きいものから 5 つ」

  • セキュリティとコンプライアンスに関連するプロンプト:

    • 「オブジェクトのバージョニングが有効になっていないバケットを大きいものから 5 つ」

    • 「保持期間の期限が 30 日以内のオブジェクトを大きいものから 5 つ」

  • データ検出に関連するメッセージ:

    • 「1 MB 未満の小さいファイルを大量に含むバケット」

    • 「スタンダード ストレージ クラスのオブジェクトで、50 MB 未満のもの」

始める前に

Cloud Storage に関連する一般的なプロンプトに Gemini Cloud Assist を使用するには、必要なロールを取得するなど、まず Gemini Cloud Assist を設定する必要があります。

Gemini Cloud Assist を設定する

Google Cloud プロジェクト用に Gemini Cloud Assist が設定されていることを確認します。

特定のバケットとオブジェクトに関連するプロンプトを入力する場合は、次の事前準備の手順も完了する必要があります。

  1. Storage Intelligence を有効にして、Storage Insights データセットを使用できるようにします。

  2. Storage Insights データセットを作成します。Gemini Cloud Assist は、これを分析して、特定のバケットとオブジェクトに関する情報を提供します。

    別の方法として、使用する既存のデータセットがある場合は、既存のデータセットにアクセスするために必要な IAM ロールを取得することも可能です。

  3. Storage Insights サービス エージェントが、Gemini Cloud Assist の分析対象のデータセットにアクセスできることを確認します。これにより、データセットを読み取って分析できます。

Storage Intelligence を有効にする

Gemini Cloud Assist がプロンプトの回答に使用するデータセットが含まれている、または今後含まれるプロジェクト、フォルダ、または組織で、ストレージ インテリジェンスが有効になっていることを確認します。

データセットを作成する

データセットを作成し、データセットを BigQuery にリンクします。

データセットへのアクセスに必要なロールを付与する

ユーザーがデータセット構成を初めて作成すると、Storage Insights サービス エージェントが作成されます。サービス エージェントは命名形式 service-PROJECT_NUMBER@gcp-sa-storageinsights.iam.gserviceaccount.com に従い、[Google 提供のロール付与を含める] チェックボックスが選択されているときに、 Google Cloud コンソールの [IAM] ページに表示されます。

バケットまたはオブジェクトのメタデータに関連するプロンプトに Gemini Cloud Assist を使用するには、Storage Insights サービス エージェントがデータセットを読み取れるようにする必要があります。分析するデータセットを含む組織、フォルダ、またはプロジェクトに対する BigQuery データ閲覧者ロール(roles/bigquery.dataViewer)をサービス エージェントに付与するように管理者へ依頼してください。

サービス エージェントにロールを付与する手順については、ロールを作成してサービス エージェントに付与するをご覧ください。

データセットへのアクセスに必要なロールを取得する

バケットとオブジェクトのメタデータに関する分析情報を取得するために必要な権限を取得するには、分析するデータセットを含むプロジェクト、フォルダ、または組織に対する次の IAM ロールを付与するように管理者へ依頼してください。

ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

自然言語プロンプトを使用してデータ ストレージを分析する

Gemini Cloud Assist へのプロンプトを入力する手順は次のとおりです。

  1. Google Cloud コンソールで、Cloud Storage の [Storage Insights] ページに移動します。

    Storage Insights に移動

  2. ツールバーで [spark](Gemini)をクリックして、[Cloud Assist] チャットパネルを開きます。

    [Cloud Assist] チャットパネルが表示されます。

  3. [Cloud Assist] チャットパネルで、データ ストレージに関する自然言語プロンプトを入力します。たとえば、次のように入力します。

    Which is my largest bucket
  4. [生成] をクリックします。

  5. プロンプトが表示されたら、Gemini が分析してレスポンスを生成するデータセットの名前を入力し、 [生成] をクリックします。

    成功すると、Gemini Cloud Assist は次のようなレスポンスを生成します。

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Bucket name Size
    my-bucket 39.1 TB

    Gemini Cloud Assist が使用する基盤となる SQL クエリも返されます。生成された SQL クエリは次のようになります。

    SELECT bucket_id, bucket_size
    FROM buckets
    WHERE project_id = 'example-project'
    ORDER BY bucket_size DESC
    LIMIT 1;
    

必要に応じて、推奨されるプロンプトを入力します。

  1. Google Cloud コンソールで、Cloud Storage の [Storage Insights] ページに移動します。

    Storage Insights に移動

  2. [プロンプトの候補] セクションで、候補のプロンプトを選択します。たとえば、提案されたプロンプトは Storage size broken down by object content type になります。

  3. 成功すると、Gemini Cloud Assist は次のようなレスポンスを生成します。

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Content type Size
    MP4 483.2 GB
    MOV 239.1 GB
    MP3 125.8 GB

    Gemini Cloud Assist が使用する基盤となる SQL クエリも返されます。生成された SQL クエリは次のようになります。

    SELECT
    oa.contentType, ROUND(sum(oa.size) / (1024 * 1024 * 1024), 2) AS total_size_gb
    FROM object_attributes_latest AS oa
    GROUP BY oa.contentType
    ORDER BY sum(oa.size) DESC;

制限事項

  • プロンプトを使用して Cloud Storage リソースを分析する場合は、プロンプトに最大 5 つのリソースを指定できます。たとえば、「5 largest buckets without Autoclass enabled」とします。プロンプトに 5 つを超えるリソースを含めた場合でも、Gemini Cloud Assist はプロンプトの条件に一致する上位 5 つのリソースの結果のみを返します。

  • Gemini Cloud Assist は、Storage Insights データセットに含まれるバケットとオブジェクトのメタデータを使用して、データ ストレージに関するプロンプトに応答します。

    次のデータは Storage Insights データセットでは使用できません。つまり、Gemini Cloud Assist には、そのデータに関連するプロンプトに応答するための適切なコンテキストがありません。

    • 特定の費用データ(「バケットの月額費用」など)。

    • アクティビティ データ(「オブジェクトの最終アクセス日時」など)。

    • 特定の機能(ソフト削除など)の構成に関するデータ。例: 「削除(復元可能)が有効になっていないのはどのバケットですか?」

    また、Gemini Cloud Assist には、時系列情報に関連するプロンプトに応答するための適切なコンテキストがありません。例: 「過去 3 週間でバケットはどのくらい増加しているか。」これは、Gemini Cloud Assist がデータセットの最新のスナップショットのみを読み取るためです。

次のステップ