Dataplex Universal Catalog è una soluzione di governance unificata e intelligente per dati e asset AI in Google Cloud. Tramite il Catalogo universale Dataplex, puoi utilizzare l'AI per semplificare le query sui dati, il controllo qualità e gli approfondimenti aziendali.
Dataplex Universal Catalog esegue la governance su larga scala. Prendi ad esempio una società di vendita al dettaglio globale che genera grandi quantità di dati su vendite, inventario e clienti archiviati in Cloud Storage, Spanner e Pub/Sub. Con i dati distribuiti tra i sistemi, la gestione della governance, la garanzia della qualità e il mantenimento della conformità sono complessi e richiedono molto tempo. Dataplex Universal Catalog semplifica questo processo fornendo una visualizzazione centrale per scoprire, profilare, convalidare, monitorare la derivazione e controllare l'accesso agli asset di dati dell'organizzazione.
Perché utilizzare Dataplex Universal Catalog?
Dataplex Universal Catalog governa i dati tramite le seguenti funzionalità:
- Catalogazione dei metadati. Recupera i metadati per Google Cloud le risorse (in BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Dataproc Metastore) e le risorse di terze parti che importi nel catalogo universale Dataplex, per uno snapshot dei tuoi asset di dati.
- Data Discovery. Esegui la scansione dei dati strutturati e non strutturati nei bucket Cloud Storage per estrarre e catalogare i relativi metadati.
- Informazioni basate sui dati. Utilizza l'AI per generare domande in linguaggio naturale sui tuoi dati, per scoprire pattern, valutare la qualità dei dati ed eseguire analisi statistiche.
- Profilazione dei dati. Identifica le caratteristiche comuni dei dati delle colonne nelle tabelle BigQuery, ad esempio valori tipici dei dati, distribuzione dei dati e conteggi null, che possono fornire informazioni per la classificazione dei dati e il controllo qualità.
- Qualità dei dati. Definisci e misura la qualità dei dati nelle tabelle BigQuery con la convalida dei dati in base ai criteri dell'organizzazione e la registrazione di avvisi se i dati non soddisfano i criteri di qualità.
- Glossario aziendale. Gestisci la terminologia e le definizioni relative all'attività in tutta l'organizzazione e collega i termini alle colonne della tabella per promuovere una comprensione coerente dell'utilizzo dei dati.
- Lignaggio dei dati. Monitora il modo in cui i dati vengono trasferiti nei sistemi: da dove provengono, dove vengono inviati e a quali trasformazioni sono sottoposti.
Dataplex Universal Catalog supporta un ciclo di vita dei dati end-to-end, dalla scoperta distribuita agli approfondimenti aziendali. Le funzionalità di governance sono disponibili anche tramite BigQuery.
Passaggi successivi
- Scopri di più sulla gestione dei metadati in Dataplex Universal Catalog.
- Scopri come cercare asset di dati in Dataplex Universal Catalog.
- Scopri come gestire le voci e importare origini personalizzate.
- Scopri come importare i metadati in Dataplex Universal Catalog.
- Scopri di più sulla governance di BigQuery.