Utilizzare la derivazione dei dati con i sistemi Google Cloud

La cronologia dei dati mostra le relazioni tra le risorse del progetto e i processi che le hanno create. Puoi visualizzare le informazioni sulla cronologia dei dati sotto forma di visualizzazione di grafici o elenco nella console Google Cloud oppure recuperarle dall'API Data Lineage sotto forma di dati JSON.

La cronologia viene acquisita in tutti i progetti. Quando visualizzi la cronologia generata da più progetti, puoi visualizzare le informazioni aggregate della cronologia in uno qualsiasi dei progetti pertinenti.

Ruoli e autorizzazioni

Per visualizzare le informazioni sulla cronologia, chiedi all'amministratore di concederti i ruoli di visualizzatore come descritto in Ruoli di cronologia dei dati predefiniti. Devi disporre dell'accesso sia al progetto in cui visualizzi la cronologia sia ai progetti in cui viene registrata.

Data Catalog monitora automaticamente le informazioni sulla derivazione quando attivi l'API Data Lineage. Non sono necessari ruoli di amministratore o editor per acquisire la cronologia per gli asset di dati.

Per ulteriori informazioni sulla concessione dei ruoli, consulta Gestire l'accesso. Puoi assegnare un ruolo a un livello di cartella o organizzazione superiore (consulta Concedere o revocare un singolo ruolo).

Attiva la derivazione dei dati

Attiva la derivazione dei dati per iniziare a monitorare automaticamente le informazioni sulla derivazione per i sistemi supportati. Devi abilitare l'API Data Lineage sia nel progetto in cui visualizzi la derivazione sia nei progetti in cui viene registrata. Per ulteriori informazioni, consulta Tipi di progetti.

  1. Per acquisire le informazioni sulla sequenza:

    1. Nella console Google Cloud, nella pagina Selettore di progetti, seleziona il progetto in cui vuoi registrare la cronologia.

      Vai al selettore di progetti

    2. Abilita l'API Data Lineage.

      Attiva l'API Data Lineage

    3. Ripeti i passaggi precedenti per ogni progetto in cui vuoi registrare la cronologia.
  2. Nel progetto in cui visualizzi la derivazione, abilita l'API Data Lineage e l'API Data Catalog.

    Abilita le API

Visualizzare la derivazione nell'interfaccia utente di Dataplex

Puoi visualizzare le informazioni sulla derivazione dei dati nell'interfaccia utente di Dataplex sotto forma di grafico o elenco.

I grafici di derivazione rappresentano le informazioni raccolte dall'API Data Lineage per una determinata voce.

Un grafico di esempio mostra i dati di due tabelle che vengono trasformati e poi uniti.
Figura 1. Esempio di grafico di visualizzazione della struttura nella UI di Dataplex.

La visualizzazione elenco della derivazione (Anteprima) mostra informazioni dettagliate sulla derivazione delle entità in un'unica tabella che include informazioni sulla derivazione delle entità con molte connessioni.

Per visualizzare la sequenza, segui queste istruzioni:

  1. Apri la pagina di ricerca di Dataplex e trova la risorsa per la quale vuoi visualizzare le informazioni sulla cronologia.

    Apri la pagina di ricerca di Dataplex

    Per ulteriori informazioni, consulta Come cercare asset di dati.

  2. Nella pagina dei dettagli della voce, seleziona la scheda Linage.

  3. Seleziona i pulsanti di elaborazione o dell'origine dati per visualizzare il riquadro dei dettagli.

  4. Per visualizzare le informazioni sulla sequenza di una risorsa a monte o a valle, fai clic su Espandi.

  5. Per visualizzare la sequenza in visualizzazione elenco anziché in visualizzazione grafico, fai clic su Elenco.

Visualizzare la derivazione nell'interfaccia utente di BigQuery

Puoi visualizzare le informazioni sulla cronologia dei dati nell'interfaccia utente di BigQuery sotto forma di grafico o elenco (Anteprima).

Per visualizzare la sequenza, segui queste istruzioni:

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Apri la pagina BigQuery

  2. Apri la tabella di cui vuoi visualizzare la cronologia dei dati.

  3. Fai clic sulla scheda Linage.

  4. Seleziona i pulsanti di elaborazione o dell'origine dati per visualizzare il riquadro dei dettagli.

  5. Per visualizzare le informazioni sulla sequenza di una risorsa a monte o a valle, fai clic su Espandi.

  6. Per visualizzare la sequenza in visualizzazione elenco anziché in visualizzazione grafico, fai clic su Elenco.

Visualizzare la cronologia nell'interfaccia utente di Vertex AI

Sistemi come Vertex AI Pipelines generano dati sulla provenienza per i modelli e i set di dati Vertex AI. Puoi visualizzare le informazioni sulla cronologia dei dati nell'interfaccia utente di Vertex AI sotto forma di grafico o elenco (Anteprima).

Visualizzare la cronologia di un set di dati gestito in Vertex AI

Per visualizzare la cronologia di un set di dati:

  1. Nella console Google Cloud, vai alla pagina Set di dati.

    Apri la pagina Set di dati

  2. Fai clic sul set di dati di cui vuoi visualizzare la cronologia dei dati.

  3. Fai clic sulla scheda Linage.

  4. Seleziona i pulsanti di elaborazione o dell'origine dati per visualizzare il riquadro dei dettagli.

  5. Per visualizzare le informazioni sulla sequenza di una risorsa a monte o a valle, fai clic su Espandi.

  6. Per visualizzare la sequenza in visualizzazione elenco anziché in visualizzazione grafico, fai clic su Elenco.

Visualizzare la cronologia di un modello in Vertex AI

Per visualizzare la cronologia di un modello:

  1. Nella console Google Cloud, vai alla pagina Registry dei modelli.

    Apri la pagina Registro dei modelli

  2. Fai clic sul modello di cui vuoi visualizzare la struttura di dati.

  3. Fai clic sulla scheda Linage.

  4. Seleziona i pulsanti di elaborazione o dell'origine dati per visualizzare il riquadro dei dettagli.

  5. Per visualizzare le informazioni sulla sequenza di una risorsa a monte o a valle, fai clic su Espandi.

  6. Per visualizzare la sequenza in visualizzazione elenco anziché in visualizzazione grafico, fai clic su Elenco.

Passaggi successivi