Dataplex Universal Catalog est une solution de gouvernance unifiée et intelligente pour les assets de données et d'IA dans Google Cloud. Grâce à Dataplex Universal Catalog, vous pouvez utiliser l'IA pour simplifier les requêtes de données, l'assurance qualité et les insights commerciaux.
Dataplex Universal Catalog assure la gouvernance à grande échelle. Prenons l'exemple d'une entreprise de vente au détail mondiale qui génère de grandes quantités de données sur les ventes, l'inventaire et les clients, stockées dans Cloud Storage, Spanner et Pub/Sub. Avec des données distribuées dans différents systèmes, la gestion de la gouvernance, la garantie de la qualité et le maintien de la conformité sont complexes et chronophages. Dataplex Universal Catalog simplifie ce processus en fournissant une vue centralisée permettant de découvrir, de profiler, de valider, de suivre la traçabilité et de contrôler l'accès aux assets de données de l'organisation.
Pourquoi utiliser Dataplex Universal Catalog ?
Dataplex Universal Catalog gouverne les données grâce aux fonctionnalités suivantes :
- Catalogage des métadonnées. Récupérez les métadonnées des ressources Google Cloud (dans BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Dataproc Metastore) et des ressources tierces que vous importez dans le catalogue universel Dataplex pour obtenir un aperçu de vos assets de données.
- Découverte des données : Analysez les données structurées et non structurées dans les buckets Cloud Storage pour extraire et cataloguer leurs métadonnées.
- Insights sur les données : Utilisez l'IA pour générer des questions en langage naturel sur vos données, identifier des modèles, évaluer la qualité des données et effectuer des analyses statistiques.
- Profilage des données : Identifiez les caractéristiques courantes des données de colonne dans vos tables BigQuery (par exemple, les valeurs de données typiques, la distribution des données et le nombre de valeurs nulles), qui peuvent vous aider à classer les données et à assurer leur qualité.
- Qualité des données : Définissez et mesurez la qualité des données dans vos tables BigQuery en validant les données par rapport aux règles de l'organisation et en enregistrant des alertes si les données ne répondent pas aux critères de qualité.
- Glossaire d'entreprise Gérez la terminologie et les définitions liées à votre activité dans toute votre organisation, et associez des termes aux colonnes de tableau pour favoriser une compréhension cohérente de l'utilisation des données.
- Traçabilité des données. Suivez la manière dont les données transitent par vos systèmes : leur origine, la cible de transmission et les transformations qui leur sont appliquées.
Dataplex Universal Catalog prend en charge le cycle de vie des données de bout en bout, de la découverte distribuée aux insights commerciaux. Des fonctionnalités de gouvernance sont également disponibles dans BigQuery.
Étapes suivantes
- En savoir plus sur la gestion des métadonnées dans Dataplex Universal Catalog
- Découvrez comment rechercher des composants de données dans le catalogue universel Dataplex.
- Découvrez comment gérer les entrées et ingérer des sources personnalisées.
- Découvrez comment importer des métadonnées dans Dataplex Universal Catalog.
- En savoir plus sur la gouvernance BigQuery