Gemini 지원으로 저장된 데이터 분석

이 페이지에서는 Cloud Storage의 데이터 스토리지 환경을 보다 효과적으로 이해하기 위해 Gemini를 통해 AI 기반 지원을 사용하는 방법을 설명합니다. Gemini Cloud Assist를 사용하면 Cloud Storage의 일반적인 작동 방법에 대한 프롬프트를 입력할 수 있으며, Storage Intelligence 구독을 사용 설정하면 특정 버킷 및 객체에 대한 프롬프트를 입력할 수 있습니다.

그런 후 Gemini Cloud Assist에서 제공된 정보를 활용해서 다음을 수행할 수 있습니다.

  • 데이터 사용 패턴 및 추세 분석

  • 스토리지 비용 절약 기회 식별

  • 보안 및 규정 준수를 위한 데이터 최적화

  • 데이터 관리에 대한 정보에 입각한 판단

Gemini는 사용자의 명시적 권한 부여 없이 사용자의 프롬프트 또는 해당 응답을 모델 학습을 위한 데이터로 사용하지 않습니다. Google에서 사용자 데이터를 사용하는 방법은 Google Cloud 용 Gemini가 사용자 데이터를 사용하는 방법을 참조하세요.

이 페이지는 개발자, 데이터 분석가 또는 데이터 엔지니어, 플랫폼 관리자, 파이낸스 운영자, 규정 준수 관리자를 대상으로 합니다. 여기에서는 사용자가 Cloud Storage를 사용하고 연결된 데이터 세트를 쿼리하는 방법을 알고 있다고 가정합니다.

Gemini가 답변할 수 있는 프롬프트는 무엇인가요?

데이터 스토리지를 이해하기 위해 Gemini Cloud Assist에 자연어 문장 또는 질문의 형태로 프롬프트를 제공할 수 있습니다.

Storage Intelligence 구독 없이 Gemini Cloud Assist만 단독으로 사용할 경우에는 다음과 같이 Cloud Storage의 일반적인 작동 방법에 대한 프롬프트를 질문할 수 있습니다.

  • "한 스토리지 클래스에서 다른 스토리지 클래스로 객체를 전환하려면 어떻게 해야 하나요?"

  • "버킷에서 소프트 삭제를 사용 설정하려면 어떻게 해야 하나요?"

Storage Intelligence 구독을 사용 설정하면 비용 절약 기회, 보안 및 규정 준수, 데이터 검색과 관련된 프롬프트도 질문할 수 있습니다. Gemini Cloud Assist는 Storage Insights 데이터 세트에 포함된 메타데이터를 사용해서 버킷 및 객체 메타데이터 및 사용과 관련된 프롬프트의 응답으로 표시되는 인사이트를 생성할 수 있습니다. 다음과 같은 프롬프트를 질문할 수 있습니다.

  • 사용 및 비용 절약 관련 프롬프트:

    • "객체 수명 주기 관리 가 없는 가장 큰 버킷 5개"

    • "Autoclass가 사용 설정되지 않은 가장 큰 버킷 5개"

  • 보안 및 규정 준수 관련 프롬프트:

    • "객체 버전 관리가 사용 설정되지 않은 가장 큰 버킷 5개"

    • "보관 만료일이 다음 30일 이내인 가장 큰 객체 5개"

  • 데이터 검색 관련 프롬프트:

    • "작은 파일(1MB 미만)이 많은 버킷"

    • "Standard Storage 클래스에서 50MB보다 작은 객체"

시작하기 전에

Cloud Storage 관련 일반 프롬프트에 Gemini Cloud Assist를 사용하려면 먼저 필요한 역할을 포함하여 Gemini Cloud Assist를 설정해야 합니다.

특정 버킷 및 객체와 관련된 프롬프트를 입력하려면 또한 다음 기본 요건 단계를 완료해야 합니다.

  1. Storage Intelligence를 사용 설정하여 Storage Insights 데이터 세트를 사용할 수 있는 액세스 권한을 부여합니다.

  2. Gemini Cloud Assist가 특정 버킷 및 객체에 대한 정보를 제공하기 위해 분석을 수행할 Storage Insights 데이터 세트를 만듭니다.

    또는 사용하려는 기존 데이터 세트가 있으면 기존 데이터 세트에 액세스하는 데 필요한 IAM 역할을 가져올 수 있습니다.

  3. Storage Insights 서비스 에이전트에 Gemini Cloud Assist가 분석할 데이터 세트에 대한 액세스 권한이 있는지 확인합니다. 이렇게 해서 데이터 세트를 읽고 분석할 수 있습니다.

Storage Intelligence 사용 설정

Gemini Cloud Assist가 프롬프트 답변을 위해 사용할 데이터 세트가 포함되었거나 포함될 예정인 프로젝트, 폴더, 조직에서 Storage Intelligence가 사용 설정되었는지 확인합니다.

데이터 세트 만들기

데이터 세트를 만들고 데이터 세트를 BigQuery에 연결합니다.

데이터 세트에 액세스하는 데 필요한 역할 부여

사용자가 먼저 데이터 세트 구성을 만들면 Storage Insights 서비스 에이전트가 생성됩니다. 서비스 에이전트는 service-PROJECT_NUMBER@gcp-sa-storageinsights.iam.gserviceaccount.com 이름 지정 형식을 사용하고 Google 제공 역할 부여 포함 체크박스를 선택할 때 Google Cloud 콘솔의 IAM 페이지에 표시됩니다.

버킷 또는 객체 메타데이터 관련 프롬프트에 Gemini Cloud Assist를 사용하려면 Storage Insights 서비스 에이전트가 데이터 세트를 읽을 수 있도록 설정해야 합니다. 관리자에게 분석하려는 데이터 세트가 포함된 조직, 폴더, 프로젝트에 대한 BigQuery 데이터 뷰어 역할(roles/bigquery.dataViewer)을 서비스 에이전트에 부여해 달라고 요청하세요.

서비스 에이전트에 역할을 부여하는 방법은 역할 만들기 및 서비스 에이전트에 부여를 참조하세요.

데이터 세트에 액세스하는 데 필요한 역할 가져오기

버킷 및 객체에 대해 인사이트를 얻는 데 필요한 권한을 가져오려면 관리자에게 분석하려는 데이터 세트가 포함된 프로젝트, 폴더, 조직에 대해 다음 IAM 역할을 부여해 달라고 요청하세요.

역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.

자연어 프롬프트를 사용하여 데이터 스토리지 분석

Gemini Cloud Assist에 프롬프트를 입력하려면 다음 단계를 따릅니다.

  1. Google Cloud 콘솔에서 Cloud Storage Storage Insights 페이지로 이동합니다.

    Storage Insights로 이동

  2. 툴바에서 spark(Gemini)를 클릭하여 Cloud Assist 채팅 패널을 엽니다.

    Cloud Assist 채팅 패널이 표시됩니다.

  3. Cloud Assist 채팅 패널에서 데이터 스토리지에 대한 자연어 프롬프트를 입력합니다. 예를 들어 다음과 같이 입력할 수 있습니다.

    Which is my largest bucket
  4. (생성)를 클릭합니다.

  5. 메시지가 표시되면 응답을 생성하기 위해 Gemini가 분석할 데이터 세트 이름을 입력한 후 (생성)를 클릭합니다.

    성공하면 Gemini Cloud Assist가 다음과 비슷한 응답을 생성합니다.

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Bucket name Size
    my-bucket 39.1 TB

    Gemini Cloud Assist가 사용하는 기본 SQL 쿼리도 반환됩니다. 생성되는 SQL 쿼리는 다음과 비슷합니다.

    SELECT bucket_id, bucket_size
    FROM buckets
    WHERE project_id = 'example-project'
    ORDER BY bucket_size DESC
    LIMIT 1;
    

선택적으로 추천 프롬프트를 입력할 수 있습니다.

  1. Google Cloud 콘솔에서 Cloud Storage Storage Insights 페이지로 이동합니다.

    Storage Insights로 이동

  2. 추천 프롬프트 섹션에서 추천 프롬프트를 선택합니다. 예를 들어 Storage size broken down by object content type과 같은 추천 프롬프트를 선택할 수 있습니다.

  3. 성공하면 Gemini Cloud Assist가 다음과 비슷한 응답을 생성합니다.

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Content type Size
    MP4 483.2 GB
    MOV 239.1 GB
    MP3 125.8 GB

    Gemini Cloud Assist가 사용하는 기본 SQL 쿼리도 반환됩니다. 생성되는 SQL 쿼리는 다음과 비슷합니다.

    SELECT
    oa.contentType, ROUND(sum(oa.size) / (1024 * 1024 * 1024), 2) AS total_size_gb
    FROM object_attributes_latest AS oa
    GROUP BY oa.contentType
    ORDER BY sum(oa.size) DESC;

제한사항

  • 프롬프트를 사용하여 Cloud Storage 리소스를 분석할 때는 프롬프트에 최대 5개까지 리소스를 지정할 수 있습니다. 예를 들면 5 largest buckets without Autoclass enabled입니다. 프롬프트에 리소스를 5개 넘게 포함하더라도 Gemini Cloud Assist는 프롬프트 기준과 일치하는 상위 5개 리소스에 대해서만 결과를 반환할 수 있습니다.

  • Gemini Cloud Assist는 Storage Insights 데이터 세트에 포함된 버킷 및 객체 메타데이터를 사용하여 데이터 스토리지에 대한 프롬프트에 응답할 수 있습니다.

    다음 데이터는 Storage Insights 데이터 세트에서 사용할 수 없습니다. 즉, Gemini Cloud Assist가 이 데이터와 관련된 프롬프트에 응답할 수 있는 적절한 컨텍스트가 부족합니다.

    • 특정 비용 데이터, 예시: "내 월별 버킷 비용은 얼마인가요?"

    • 활동 데이터, 예시: "내 프로젝트를 마지막으로 액세스한 시간은 언제인가요?"

    • 소프트 삭제와 같은 특정 기능의 구성에 대한 데이터. 예시: "소프트 삭제가 사용 설정되지 않은 버킷은 무엇인가요?"

    Gemini Cloud Assist는 또한 시계열 정보와 관련된 프롬프트에 응답하기 위한 적절한 컨텍스트가 부족합니다. 예시: "지난 3주 동안 내 버킷이 얼마나 증가했나요?" 이것은 Gemini Cloud Assist가 데이터 세트의 최신 스냅샷만 읽기 때문입니다.

다음 단계