Considerazioni sulla derivazione dei dati

Questo documento fornisce informazioni sulla conformità e sulle limitazioni della derivazione dei dati. La derivazione dei dati è abilitata per progetto, non per sistema. Ciò significa che dopo aver abilitato l'API Data Lineage, le informazioni sulla derivazione possono essere segnalate automaticamente per più sistemi nel progetto, a seconda del controllo della derivazione a livello di prodotto di ciascun sistema.

Il monitoraggio automatico della derivazione è supportato per i seguenti sistemi:

Controlli della derivazione a livello di prodotto nei Google Cloud sistemi supportati
Sistema Controlli di derivazione disponibili
BigQuery,
Cloud Data Fusion
Non è possibile configurare il monitoraggio della derivazione in modo che sia limitato solo a Cloud Data Fusion o BigQuery quando l'API Data Lineage è abilitata in un progetto.
Cloud Composer Cloud Composer utilizza il controllo dell'integrazione della lineage dei dati a livello di ambiente. La derivazione dei dati viene attivata automaticamente per tutti i nuovi ambienti Cloud Composer, a condizione che soddisfino i requisiti. Per saperne di più, consulta Derivazione dei dati con Dataplex Universal Catalog. Per gli ambienti esistenti, puoi attivare o disattivare l'integrazione della derivazione dei dati nelle impostazioni dell'ambiente.
Dataflow I job Dataflow possono acquisire eventi di derivazione e pubblicarli nell'API Data Lineage. Per ulteriori informazioni, consulta Utilizzare la derivazione dei dati in Dataflow.
Dataproc I job Spark Dataproc possono acquisire eventi di derivazione e pubblicarli nell'API Data Lineage. Per saperne di più, consulta Integrazione di Dataproc della derivazione dei dati.
Vertex AI La derivazione dei dati viene attivata automaticamente per gli artefatti e i parametri di Vertex AI, come modelli, set di dati, modelli di pipeline e componenti. La derivazione di una pipeline include i fattori che hanno contribuito alla sua creazione, nonché gli artefatti e i metadati derivati successivamente. Per saperne di più, consulta Monitoraggio della derivazione degli artefatti della pipeline.

Impatto sulla fatturazione

Quando abiliti l'API Data Lineage in un progetto, esamina l'impatto sugli addebiti di fatturazione, perché l'API Data Lineage è abilitata per progetto (per i dettagli, consulta la sezione precedente). Per saperne di più su come viene addebitata la derivazione dei dati, consulta la pagina Prezzi del Catalogo universale Dataplex.

Per BigQuery Omni, l'elaborazione della derivazione è distribuita in regioni specifiche e i costi dipendono dalle regioni in cui viene eseguita l'elaborazione.

Conformità della derivazione dei dati

  • La derivazione dei dati registra i metadati relativi allo spostamento dei dati, ma non acquisisce i dati stessi. Consulta Modello informativo della derivazione dei dati e Riferimento API Data Lineage per informazioni dettagliate sui campi inclusi nei metadati.
  • La derivazione dei dati nell'ambito di Dataplex Universal Catalog offre il supporto di VPC-SC.
  • Dataplex Universal Catalog non offre la possibilità di utilizzare le chiavi di crittografia gestite dal cliente per proteggere i metadati di derivazione raccolti.

Limitazioni della derivazione dei dati

Quando selezioni un nodo nel grafico della derivazione, il riquadro laterale dei dettagli del nodo è vuoto quando:

  1. la risorsa si trova in un'altra organizzazione oppure
  2. l'utente non è membro dell'organizzazione che ospita la risorsa.