Accedere agli approfondimenti sui dati in Dataplex Universal Catalog

Approfondimenti sui dati offre un modo automatizzato per esplorare e comprendere i tuoi dati. Con gli approfondimenti sui dati, Gemini utilizza i metadati per generare domande in linguaggio naturale sulla tabella e le query per rispondere. In questo modo, puoi individuare pattern, valutare la qualità dei dati ed eseguire analisi statistiche.

Questo documento descrive le funzionalità chiave degli approfondimenti sui dati e come visualizzarli per un'esplorazione approfondita dei dati.

Prima di iniziare

Gli approfondimenti sui dati vengono generati utilizzando Gemini in BigQuery e possono essere generati solo in BigQuery Studio. Innanzitutto, configura Gemini in BigQuery, poi genera insight in BigQuery. Gemini elabora i metadati per gli approfondimenti esclusivamente nella regione us-central1. Per ulteriori informazioni, consulta Località di pubblicazione di Gemini. Dopo aver generato gli approfondimenti, puoi visualizzarli in Dataplex Universal Catalog.

Ruoli obbligatori

Per ottenere l'accesso di sola lettura agli approfondimenti generati, chiedi all'amministratore di concederti il seguente ruolo IAM:

Per ulteriori informazioni sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti. Per vedere quali sono esattamente le autorizzazioni richieste per generare insight, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

  • dataplex.datascans.get
  • dataplex.datascans.getData

Abilita API

Per utilizzare gli approfondimenti sui dati, abilita le seguenti API nel tuo progetto:

Per saperne di più su come abilitare l'API Gemini for Google Cloud, vedi Abilitare l'API Gemini for Google Cloud in un Google Cloud progetto.

Informazioni sugli approfondimenti sui dati

Quando esplorano una tabella nuova e sconosciuta, gli analisti di dati spesso si trovano di fronte al problema dell'avvio a freddo. Il problema spesso riguarda incertezze sulla struttura dei dati, sui pattern chiave e sugli insight pertinenti nei dati, il che rende difficile iniziare a scrivere query.

Gli approfondimenti sui dati risolvono il problema dell'avvio a freddo generando automaticamente query in linguaggio naturale e i relativi equivalenti SQL in base ai metadati di una tabella. Anziché iniziare con un editor di query vuoto, puoi iniziare rapidamente l'esplorazione dei dati con query significative che offrono insight preziosi. Per ulteriori indagini, puoi fare domande aggiuntive nel canvas dei dati.

Esempio di esecuzione di approfondimenti

Considera una tabella denominata telco_churn con i seguenti metadati:

Nome campo Tipo
CustomerID STRING
Genere STRING
Periodo di incarico INT64
InternetService STRING
StreamingTV STRING
OnlineBackup STRING
Contratto STRING
TechSupport STRING
PaymentMethod STRING
MonthlyCharges FLOAT
Churn BOOLEAN

Di seguito sono riportate alcune delle query di esempio che gli approfondimenti sui dati generano per questa tabella:

  • Identifica i clienti che hanno eseguito l'abbonamento a tutti i servizi premium e che sono clienti da più di 50 mesi.

    SELECT
      CustomerID,
      Contract,
      Tenure
    FROM
      agentville_datasets.telco_churn
    WHERE
      OnlineBackup = 'Yes'
      AND TechSupport = 'Yes'
      AND StreamingTV = 'Yes'
      AND Tenure > 50;
    
  • Identifica il servizio internet con il maggior numero di clienti persi.

    SELECT
      InternetService,
      COUNT(DISTINCT CustomerID) AS total_customers
    FROM
      agentville_datasets.telco_churn
    WHERE
      Churn = TRUE
    GROUP BY
      InternetService
    ORDER BY
      total_customers DESC
    LIMIT 1;
    
  • Identifica i tassi di abbandono per segmento tra i clienti di alto valore.

    SELECT
      Contract,
      InternetService,
      Gender,
      PaymentMethod,
      COUNT(DISTINCT CustomerID) AS total_customers,
      SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers,
      (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID))
      * 100 AS churn_rate
    FROM
      agentville_datasets.telco_churn
    WHERE
      MonthlyCharges > 100
    GROUP BY
      Contract,
      InternetService,
      Gender,
      PaymentMethod;
    

Visualizza insight

Per visualizzare gli approfondimenti per una tabella BigQuery, accedi alla voce della tabella in Dataplex Universal Catalog utilizzando la ricerca di Dataplex Universal Catalog.

  1. Nella Google Cloud console, vai alla pagina Cerca di Dataplex Universal Catalog.

    Vai a Cerca

  2. Cerca la voce della tabella in Dataplex Universal Catalog.

  3. Fai clic sulla scheda Approfondimenti. Se la scheda è vuota, significa che gli approfondimenti per questa tabella non sono ancora stati generati. Puoi generare approfondimenti sui dati in BigQuery Studio.

Prezzi

Per informazioni dettagliate sui prezzi di questa funzionalità, consulta la panoramica dei prezzi di Gemini in BigQuery.

Quote e limiti

Per informazioni su quote e limiti per questa funzionalità, vedi Quote per Gemini in BigQuery.

Località

Gemini opera a livello globale, quindi non puoi limitare l'elaborazione dei dati a una regione specifica. Per scoprire di più sulle località in cui Gemini in BigQuery elabora i dati, consulta Località di pubblicazione di Gemini.

Limitazioni

  • Data Insights è disponibile per tabelle BigQuery, tabelle BigLake, tabelle esterne e viste.
  • Per i clienti multicloud, i dati di altri cloud non sono disponibili.
  • Approfondimenti sui dati non supporta i tipi di colonne Geo o JSON.
  • Le esecuzioni degli approfondimenti non garantiscono la presentazione delle query ogni volta. Per aumentare la probabilità di generare query più coinvolgenti, rigenera gli approfondimenti in BigQuery Studio.

Passaggi successivi