Utilizzare la concatenazione dei dati con i sistemi Google Cloud

La derivazione dei dati mostra le relazioni tra le risorse del tuo progetto e i processi che le hanno create.

Puoi visualizzare le informazioni sulla derivazione dei dati nella console Google Cloud nei seguenti formati:

  • Grafico della derivazione: mostra la derivazione a monte o a valle di una singola voce radice. Per saperne di più, consulta Grafico della derivazione.
  • Visualizzazione del percorso di derivazione (anteprima): mostra i collegamenti di derivazione tra due risorse selezionate. Per saperne di più, consulta Visualizzazione del percorso di derivazione.
  • Visualizzazione elenco della derivazione (anteprima): mostra informazioni dettagliate sulla derivazione delle risorse in una singola tabella che include informazioni sulla derivazione delle risorse con molte connessioni. Per saperne di più, vedi Visualizzazione elenco della derivazione.

Puoi anche recuperare le informazioni sulla derivazione dall'API Data Lineage sotto forma di dati JSON.

La derivazione viene acquisita tra i progetti. Quando visualizzi la derivazione generata da più progetti, puoi visualizzare le informazioni sulla derivazione aggregate in uno qualsiasi dei progetti pertinenti.

A seconda del volume di dati in fase di elaborazione, è necessario del tempo prima che la derivazione dei dati mostri un grafico. Per la maggior parte dei job sono necessarie tre ore, mentre per alcuni possono essere necessarie fino a 24 ore.

Ruoli e autorizzazioni

Per visualizzare le informazioni sulla derivazione, chiedi all'amministratore di concederti i ruoli di visualizzatore come descritto in Ruoli predefiniti per la derivazione dei dati. Devi disporre dell'accesso sia al progetto in cui visualizzi la derivazione sia ai progetti in cui viene registrata la derivazione.

Il catalogo universale Dataplex monitora automaticamente le informazioni sulla derivazione quando abiliti l'API Data Lineage. Non hai bisogno di ruoli di amministratore o editor per acquisire la derivazione degli asset di dati.

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso. Puoi assegnare un ruolo a un livello superiore di cartella o organizzazione (vedi Concedere o revocare un singolo ruolo).

Abilita la derivazione dei dati

Attiva la derivazione dei dati per iniziare a monitorare automaticamente le informazioni sulla derivazione per i sistemi supportati. Devi abilitare l'API Data Lineage sia nel progetto in cui visualizzi la derivazione sia nei progetti in cui viene registrata. Per saperne di più, consulta Tipi di progetti.

  1. Per acquisire le informazioni sulla derivazione:

    1. Nella console Google Cloud , nella pagina Selettore progetto, seleziona il progetto in cui vuoi registrare la derivazione.

      Vai al selettore di progetti

    2. Abilita l'API Data Lineage.

      Attiva l'API Data Lineage

    3. Ripeti i passaggi precedenti per ogni progetto in cui vuoi registrare la derivazione.
  2. Nel progetto in cui visualizzi la derivazione, abilita l'API Data Lineage e l'API Dataplex.

    Abilita le API

Visualizza la derivazione nel Catalogo universale Dataplex

Puoi visualizzare le informazioni sulla derivazione dei dati nell'interfaccia web di Dataplex Universal Catalog.

Per visualizzare la derivazione, segui queste istruzioni:

  1. Nella console Google Cloud , vai alla pagina Cerca di Dataplex Universal Catalog.

    Vai a Cerca

  2. Seleziona Dataplex Universal Catalog come modalità di ricerca.

  3. Cerca la voce per cui vuoi visualizzare le informazioni sulla derivazione. Per saperne di più, consulta Cercare risorse in Dataplex Universal Catalog.

  4. Nella pagina dei dettagli della voce, seleziona la scheda Lignaggio.

  5. Per visualizzare il grafico della derivazione, fai clic su Grafico.

    • Seleziona i pulsanti del processo o dell'origine dati per visualizzare il riquadro dei dettagli.

    • Per visualizzare le informazioni sulla derivazione upstream o downstream di una risorsa, fai clic su Espandi.

  6. Per visualizzare la derivazione nella visualizzazione elenco, fai clic su Elenco.

  7. Per visualizzare la visualizzazione del percorso di derivazione, fai clic su Elenco e seleziona la risorsa di destinazione nella tabella dei risultati. Nel riquadro dei dettagli, fai clic su Destinazione, quindi su Visualizza lignaggio.

Visualizzare la derivazione in BigQuery

Puoi visualizzare le informazioni sulla derivazione dei dati nell'interfaccia web di BigQuery.

Per visualizzare la derivazione, segui queste istruzioni:

  1. Nella console Google Cloud , vai alla pagina BigQuery.

    Apri la pagina BigQuery

  2. Apri la tabella per cui vuoi visualizzare la derivazione dei dati.

  3. Fai clic sulla scheda Lignaggio.

  4. Per visualizzare il grafico della derivazione, fai clic su Grafico.

    • Seleziona i pulsanti del processo o dell'origine dati per visualizzare il riquadro dei dettagli.

    • Per visualizzare le informazioni sulla derivazione upstream o downstream di una risorsa, fai clic su Espandi.

  5. Per visualizzare la derivazione nella visualizzazione elenco, fai clic su Elenco.

  6. Per visualizzare la visualizzazione del percorso di derivazione, fai clic su Elenco e seleziona la risorsa di destinazione nella tabella dei risultati. Nel riquadro dei dettagli, fai clic su Destinazione, quindi su Visualizza lignaggio.

Visualizzare la derivazione in Vertex AI

Sistemi come Vertex AI Pipelines generano dati di derivazione per modelli e set di dati Vertex AI. Puoi visualizzare le informazioni sulla derivazione dei dati nell'interfaccia web della UI di Vertex AI.

Visualizzare la derivazione per un set di dati gestito in Vertex AI

Per visualizzare la derivazione di un set di dati:

  1. Nella console Google Cloud , vai alla pagina Set di dati.

    Apri la pagina Set di dati

  2. Fai clic sul set di dati per il quale vuoi visualizzare la derivazione dei dati.

  3. Fai clic sulla scheda Lignaggio.

  4. Per visualizzare il grafico della derivazione, fai clic su Grafico.

    • Seleziona i pulsanti del processo o dell'origine dati per visualizzare il riquadro dei dettagli.

    • Per visualizzare le informazioni sulla derivazione upstream o downstream di una risorsa, fai clic su Espandi.

  5. Per visualizzare la derivazione nella visualizzazione elenco, fai clic su Elenco.

  6. Per visualizzare la visualizzazione del percorso di derivazione, fai clic su Elenco e seleziona la risorsa di destinazione nella tabella dei risultati. Nel riquadro dei dettagli, fai clic su Destinazione, quindi su Visualizza lignaggio.

Visualizza la derivazione di un modello in Vertex AI

Per visualizzare la derivazione di un modello:

  1. Nella console Google Cloud , vai alla pagina Registro dei modelli.

    Apri la pagina Model Registry

  2. Fai clic sul modello per cui vuoi visualizzare la derivazione dei dati.

  3. Fai clic sulla scheda Lignaggio.

  4. Per visualizzare il grafico della derivazione, fai clic su Grafico.

    • Seleziona i pulsanti del processo o dell'origine dati per visualizzare il riquadro dei dettagli.

    • Per visualizzare le informazioni sulla derivazione upstream o downstream di una risorsa, fai clic su Espandi.

  5. Per visualizzare la derivazione nella visualizzazione elenco, fai clic su Elenco.

  6. Per visualizzare la visualizzazione del percorso di derivazione, fai clic su Elenco e seleziona la risorsa di destinazione nella tabella dei risultati. Nel riquadro dei dettagli, fai clic su Destinazione, quindi su Visualizza lignaggio.

Passaggi successivi