Analiza tus datos almacenados con la ayuda de Gemini

En esta página, se describe cómo usar la asistencia potenciada por IA a través de Gemini para comprender mejor el panorama del almacenamiento de datos en Cloud Storage. Cuando usas Gemini Cloud Assist, puedes ingresar instrucciones sobre cómo funciona Cloud Storage en general y, cuando habilitas una suscripción a Storage Intelligence, puedes ingresar instrucciones sobre buckets y objetos específicos.

Luego, puedes usar la información que proporciona Gemini Cloud Assist para hacer lo siguiente:

  • Analizar los patrones y las tendencias de uso de datos

  • Identifica oportunidades para ahorrar en costos de almacenamiento

  • Optimiza tus datos para la seguridad y el cumplimiento

  • Toma decisiones fundamentadas sobre la administración de tus datos

Gemini no usa tus instrucciones ni sus respuestas como datos para entrenar sus modelos sin tu permiso explícito. Para obtener más información sobre cómo Google usa tus datos, consulta Cómo Gemini para Google Cloud usa tus datos.

Esta página está dirigida a desarrolladores, analistas o ingenieros de datos, administradores de plataformas, operadores financieros y oficiales de cumplimiento. Se supone que sabes cómo usar Cloud Storage y consultar conjuntos de datos vinculados.

¿Qué instrucciones puede responder Gemini?

Para comprender tu almacenamiento de datos, puedes proporcionar a Gemini Cloud Assist una instrucción, que es una instrucción o pregunta en lenguaje natural.

Cuando usas Gemini Cloud Assist sin una suscripción a Storage Intelligence, puedes hacer preguntas sobre cómo funciona Cloud Storage en general, como las siguientes:

  • "¿Cómo transfiero objetos de una clase de almacenamiento a otra?"

  • "¿Cómo habilito la eliminación no definitiva en un bucket?"

Cuando habilitas una suscripción a Storage Intelligence, también puedes hacer preguntas relacionadas con oportunidades de ahorro de costos, seguridad y cumplimiento, y descubrimiento de datos. Gemini Cloud Assist puede usar los metadatos incluidos en los conjuntos de datos de Storage Insights para generar estadísticas, que son respuestas a instrucciones sobre los metadatos y el uso de tus bucket y objetos. Puedes hacer preguntas como las siguientes:

  • Instrucciones relacionadas con el uso y el ahorro de costos:

    • "Los 5 buckets más grandes sin administración del ciclo de vida de los objetos"

    • "5 buckets más grandes sin Autoclass habilitado"

  • Instrucciones relacionadas con la seguridad y el cumplimiento:

    • "Los 5 buckets más grandes sin el control de versiones de objetos habilitado"

    • "Los 5 objetos más grandes con una fecha de vencimiento de la retención dentro de los próximos 30 días"

  • Instrucciones relacionadas con el descubrimiento de datos:

    • "Buckets con un gran volumen de archivos pequeños (cada uno de menos de 1 MB)"

    • "Objetos en la clase de almacenamiento Estándar de menos de 50 MB"

Antes de comenzar

Para usar Gemini Cloud Assist con instrucciones generales relacionadas con Cloud Storage, primero debes configurarlo, lo que incluye obtener los roles necesarios.

Configura Gemini Cloud Assist

Asegúrate de que Gemini Cloud Assist esté configurado para tu Google Cloud proyecto.

Si deseas ingresar instrucciones relacionadas con buckets y objetos específicos, también debes completar los siguientes pasos previos:

  1. Habilita Storage Intelligence, que te brinda acceso a los conjuntos de datos de Storage Insights.

  2. Crea un conjunto de datos de Storage Insights, que Gemini Cloud Assist analizará para proporcionar información sobre buckets y objetos específicos.

    Como alternativa, si hay un conjunto de datos existente que deseas usar, puedes obtener los roles de IAM necesarios para acceder a él.

  3. Asegúrate de que el agente de servicio de Storage Insights tenga acceso al conjunto de datos que analizará Gemini Cloud Assist. Esto permite que el conjunto de datos se lea y analice.

Habilita Storage Intelligence

Asegúrate de que Storage Intelligence esté habilitado en el proyecto, la carpeta o la organización que contiene o contendrá los conjuntos de datos que Gemini Cloud Assist usará para responder las instrucciones.

Crea un conjunto de datos

Crea un conjunto de datos y vínculalo a BigQuery.

Otorga los roles necesarios para acceder a los conjuntos de datos

Cuando un usuario crea una configuración de conjunto de datos por primera vez, se crea un agente de servicio de Storage Insights. El agente de servicio sigue el formato de nombres service-PROJECT_NUMBER@gcp-sa-storageinsights.iam.gserviceaccount.com y aparece en la página de IAM de la consola de Google Cloud cuando seleccionas la casilla de verificación Incluir asignaciones de roles proporcionadas por Google.

Para usar Gemini Cloud Assist en instrucciones relacionadas con los metadatos de bucket o de objetos, debes habilitar el agente de servicio de Storage Insights para que lea conjuntos de datos. Pídele a tu administrador que le otorgue al agente de servicio el rol de visualizador de datos de BigQuery (roles/bigquery.dataViewer) en la organización, la carpeta o el proyecto que contiene el conjunto de datos que deseas analizar.

Para obtener instrucciones sobre cómo otorgar roles a los agentes de servicio, consulta Crea y otorga roles a los agentes de servicio.

Obtén los roles necesarios para acceder a los conjuntos de datos

Para obtener los permisos que necesitas para obtener estadísticas sobre los metadatos de bucket y objetos, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto, la carpeta o la organización que contiene los conjuntos de datos que deseas analizar:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Analiza tu almacenamiento de datos con instrucciones en lenguaje natural

Para ingresar instrucciones en Gemini Cloud Assist, sigue estos pasos:

  1. En la consola de Google Cloud , ve a la página Storage Insights de Cloud Storage.

    Ir a Storage Insights

  2. En la barra de herramientas, haz clic en spark (Gemini) para abrir el panel de chat de Cloud Assist.

    Aparecerá el panel de chat de Cloud Assist.

  3. En el panel de chat de Cloud Assist, ingresa una instrucción en lenguaje natural sobre el almacenamiento de tus datos. Por ejemplo, puedes ingresar lo siguiente:

    Which is my largest bucket
  4. Haz clic en (Generar).

  5. Si se te solicita, ingresa el nombre del conjunto de datos que Gemini analizará para generar la respuesta y, luego, haz clic en (Generar).

    Si se ejecuta correctamente, Gemini Cloud Assist genera una respuesta similar a la siguiente:

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Bucket name Size
    my-bucket 39.1 TB

    También se devuelve la consulta en SQL subyacente que usa Gemini Cloud Assist. La consulta en SQL generada es similar a la siguiente:

    SELECT bucket_id, bucket_size
    FROM buckets
    WHERE project_id = 'example-project'
    ORDER BY bucket_size DESC
    LIMIT 1;
    

De manera opcional, puedes ingresar instrucciones sugeridas:

  1. En la consola de Google Cloud , ve a la página Storage Insights de Cloud Storage.

    Ir a Storage Insights

  2. En la sección Instrucciones sugeridas, selecciona una instrucción sugerida. Por ejemplo, una instrucción sugerida podría decir: Storage size broken down by object content type.

  3. Si se ejecuta correctamente, Gemini Cloud Assist genera una respuesta similar a la siguiente:

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Content type Size
    MP4 483.2 GB
    MOV 239.1 GB
    MP3 125.8 GB

    También se devuelve la consulta en SQL subyacente que usa Gemini Cloud Assist. La consulta en SQL generada es similar a la siguiente:

    SELECT
    oa.contentType, ROUND(sum(oa.size) / (1024 * 1024 * 1024), 2) AS total_size_gb
    FROM object_attributes_latest AS oa
    GROUP BY oa.contentType
    ORDER BY sum(oa.size) DESC;

Limitaciones

  • Cuando usas instrucciones para analizar recursos de Cloud Storage, puedes especificar hasta cinco recursos en la instrucción. Por ejemplo: 5 largest buckets without Autoclass enabled Incluso si incluyes más de cinco recursos en la instrucción, Gemini Cloud Assist solo puede devolver resultados para los cinco recursos principales que coinciden con los criterios de la instrucción.

  • Gemini Cloud Assist usa los metadatos del bucket y del objeto que se incluyen en los conjuntos de datos de Storage Insights para responder a las instrucciones sobre tu almacenamiento de datos.

    Los siguientes datos no están disponibles en los conjuntos de datos de Storage Insights, lo que significa que Gemini Cloud Assist no tiene el contexto adecuado para responder a las instrucciones relacionadas con esos datos:

    • Datos de costos específicos, por ejemplo, "¿cuánto cuesta mi bucket por mes?".

    • Datos de actividad, por ejemplo, "¿cuál es la última hora de acceso a mi objeto?".

    • Datos sobre la configuración de ciertas funciones, como el borrado temporal Por ejemplo, "qué buckets no tienen habilitada la eliminación reversible".

    Gemini Cloud Assist tampoco tiene el contexto adecuado para responder a las instrucciones relacionadas con la información de series temporales. Por ejemplo, "¿Cuánto creció mi bucket en las últimas 3 semanas?". Esto se debe a que Gemini Cloud Assist solo lee la instantánea más reciente de un conjunto de datos.

¿Qué sigue?