Analizar los datos almacenados con Gemini Cloud Assist

En esta página se describe cómo usar la asistencia basada en IA a través de Gemini para comprender mejor el panorama del almacenamiento de datos en Cloud Storage. Cuando usas Gemini Cloud Assist, puedes introducir peticiones sobre cómo funciona Cloud Storage en general. Además, si habilitas una suscripción a Storage Intelligence, puedes introducir peticiones sobre segmentos y objetos específicos.

Después, puedes usar la información proporcionada por Gemini Cloud Assist para hacer lo siguiente:

  • Analizar patrones y tendencias de uso de datos

  • Identificar oportunidades para ahorrar en costes de almacenamiento

  • Optimizar los datos para mejorar la seguridad y el cumplimiento

  • Tomar decisiones fundamentadas sobre la gestión de tus datos

Gemini no usa tus peticiones ni sus respuestas como datos para entrenar sus modelos sin tu permiso expreso. Para obtener más información sobre cómo usa Google tus datos, consulta Cómo usa Gemini for Google Cloud tus datos.

Esta página está dirigida a desarrolladores, analistas de datos, ingenieros de datos, administradores de plataformas, operadores financieros y responsables de cumplimiento. Se presupone que sabes cómo usar Cloud Storage y consultar conjuntos de datos vinculados.

¿Qué peticiones puede responder Gemini?

Para entender el almacenamiento de datos, puedes proporcionar a Gemini Cloud Assist una petición, que es una afirmación o una pregunta en lenguaje natural.

Si usas Gemini Cloud Assist sin una suscripción a Storage Intelligence, puedes hacer preguntas sobre cómo funciona Cloud Storage en general, como las siguientes:

  • "¿Cómo puedo cambiar objetos de una clase de almacenamiento a otra?"

  • "¿Cómo habilito la eliminación no definitiva en un contenedor?"

Cuando habilitas una suscripción a Storage Intelligence, también puedes hacer peticiones relacionadas con oportunidades de ahorro de costes, seguridad y cumplimiento, y descubrimiento de datos. Gemini Cloud Assist puede usar los metadatos incluidos en los conjuntos de datos de Storage Insights para generar estadísticas, que son respuestas a peticiones sobre los metadatos y el uso de tus segmentos y objetos. Puedes hacer peticiones como las siguientes:

  • Peticiones relacionadas con el uso y el ahorro de costes:

    • "5 mayores cubos sin gestión del ciclo de vida de los objetos"

    • "5 mayores segmentos sin Autoclass habilitado"

  • Peticiones relacionadas con la seguridad y el cumplimiento:

    • "5 segmentos más grandes sin la gestión de versiones de objetos habilitada"

    • "5 objetos más grandes con una fecha de vencimiento de retención en los próximos 30 días"

  • Peticiones relacionadas con el descubrimiento de datos:

    • "Contenedores con un gran volumen de archivos pequeños (cada uno de ellos tiene un tamaño inferior a 1 MB)"

    • "Objetos de la clase de almacenamiento Estándar con un tamaño inferior a 50 MB"

Antes de empezar

Para usar Gemini Cloud Assist con peticiones generales relacionadas con Cloud Storage, primero debes configurarlo, lo que incluye obtener los roles necesarios.

Configurar Gemini Cloud Assist

Asegúrate de que Gemini Cloud Assist esté configurado en tu Google Cloud proyecto.

Si quieres introducir peticiones relacionadas con objetos y contenedores específicos, también debes completar los siguientes pasos:

  1. Habilita Storage Intelligence para acceder a los conjuntos de datos de Storage Insights.

  2. Crea un conjunto de datos de Storage Insights, que Gemini Cloud Assist analizará para proporcionar información sobre segmentos y objetos específicos.

    Si quieres usar un conjunto de datos que ya tengas, puedes obtener los roles de gestión de identidades y accesos necesarios para acceder a él.

  3. Asegúrate de que el agente de servicio de Storage Insights tenga acceso al conjunto de datos que va a analizar Gemini Cloud Assist. De esta forma, se puede leer y analizar el conjunto de datos.

Habilitar Storage Intelligence

Asegúrate de que Storage Intelligence esté habilitado en el proyecto, la carpeta o la organización que contenga o vaya a contener los conjuntos de datos que Gemini Cloud Assist usará para responder a las peticiones.

Crear conjunto de datos

Crea un conjunto de datos y vincúlalo a BigQuery.

Conceder los roles necesarios para acceder a los conjuntos de datos

Cuando un usuario crea una configuración de conjunto de datos por primera vez, se crea un agente de servicio de Storage Insights. El agente de servicio sigue el formato de nomenclatura service-PROJECT_NUMBER@gcp-sa-storageinsights.iam.gserviceaccount.com y aparece en la página Gestión de identidades y accesos de la consola Google Cloud cuando seleccionas la casilla Incluir asignaciones de roles proporcionadas por Google.

Para usar Gemini Cloud Assist en las peticiones relacionadas con los metadatos de segmentos u objetos, debes habilitar el agente de servicio de Storage Insights para que pueda leer conjuntos de datos. Pide a tu administrador que conceda al agente de servicio el rol Lector de datos de BigQuery (roles/bigquery.dataViewer) en la organización, la carpeta o el proyecto que contenga el conjunto de datos que quieras analizar.

Para obtener instrucciones sobre cómo conceder roles a agentes de servicio, consulta el artículo sobre cómo crear y conceder roles a agentes de servicio.

Obtener los roles necesarios para acceder a conjuntos de datos

Para obtener los permisos que necesitas para obtener estadísticas sobre los metadatos de los segmentos y los objetos, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos en el proyecto, la carpeta o la organización que contenga los conjuntos de datos que quieras analizar:

Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.

También puedes conseguir los permisos necesarios a través de roles personalizados u otros roles predefinidos.

Analizar el almacenamiento de datos con peticiones en lenguaje natural

Para introducir peticiones en Gemini Cloud Assist, sigue estos pasos:

  1. En la Google Cloud consola, ve a la página Storage Insights de Cloud Storage.

    Ir a Estadísticas de almacenamiento

  2. En la barra de herramientas, haz clic en chispa (Gemini) para abrir el panel de chat de Cloud Assist.

    Aparecerá el panel de chat Asistencia en la nube.

  3. En el panel de chat Cloud Assist, introduce una petición en lenguaje natural sobre tu almacenamiento de datos. Por ejemplo, puedes introducir lo siguiente:

    Which is my largest bucket
  4. Haz clic en (Generar).

  5. Si se te pide, introduce el nombre del conjunto de datos que Gemini analizará para generar la respuesta y, a continuación, haz clic en (Generar).

    Si se realiza correctamente, Gemini Cloud Assist genera una respuesta similar a la siguiente:

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Bucket name Size
    my-bucket 39.1 TB

    También se devuelve la consulta SQL subyacente que usa Gemini Cloud Assist. La consulta SQL generada es similar a la siguiente:

    SELECT bucket_id, bucket_size
    FROM buckets
    WHERE project_id = 'example-project'
    ORDER BY bucket_size DESC
    LIMIT 1;
    

También puedes introducir las peticiones sugeridas:

  1. En la Google Cloud consola, ve a la página Storage Insights de Cloud Storage.

    Ir a Estadísticas de almacenamiento

  2. En la sección Peticiones sugeridas, selecciona una petición sugerida. Por ejemplo, una sugerencia de petición podría decir: Storage size broken down by object content type.

  3. Si se realiza correctamente, Gemini Cloud Assist genera una respuesta similar a la siguiente:

    Here's what I found by analyzing the data in EXAMPLE_DATASET:
    
    Content type Size
    MP4 483.2 GB
    MOV 239.1 GB
    MP3 125.8 GB

    También se devuelve la consulta SQL subyacente que usa Gemini Cloud Assist. La consulta SQL generada es similar a la siguiente:

    SELECT
    oa.contentType, ROUND(sum(oa.size) / (1024 * 1024 * 1024), 2) AS total_size_gb
    FROM object_attributes_latest AS oa
    GROUP BY oa.contentType
    ORDER BY sum(oa.size) DESC;

Limitaciones

  • Cuando usas peticiones para analizar recursos de Cloud Storage, puedes especificar hasta cinco recursos en la petición. Por ejemplo: 5 largest buckets without Autoclass enabled. Aunque incluyas más de cinco recursos en la petición, Gemini Cloud Assist solo puede devolver resultados de los cinco recursos principales que coincidan con los criterios de la petición.

  • Gemini Cloud Assist usa los metadatos de los segmentos y los objetos incluidos en los conjuntos de datos de estadísticas de Storage para responder a las peticiones sobre tu almacenamiento de datos.

    Los siguientes datos no están disponibles en los conjuntos de datos de Estadísticas de almacenamiento, lo que significa que Gemini Cloud Assist no tiene el contexto adecuado para responder a las peticiones relacionadas con esos datos:

    • Datos de costes específicos, como "cuánto cuesta mi segmento al mes".

    • Datos de actividad, por ejemplo: "¿cuál es la última hora de acceso a mi objeto?".

    • Datos sobre la configuración de determinadas funciones, como la eliminación lógica. Por ejemplo, "qué segmentos no tienen habilitada la eliminación suave".

    Gemini Cloud Assist tampoco tiene el contexto adecuado para responder a peticiones relacionadas con información de series temporales. Por ejemplo: "¿Cuánto ha crecido mi cartera en las últimas 3 semanas?". Esto se debe a que Gemini Cloud Assist solo lee la última instantánea de un conjunto de datos.

Siguientes pasos