Dataplex Universal Catalog の概要

Dataplex Universal Catalog は、 Google Cloudのデータと AI アセット向けの統合されたインテリジェントなガバナンスソリューションです。Dataplex Universal Catalog では、AI を使用してデータクエリ、品質保証、ビジネス分析情報を簡単に利用できます。

Dataplex Universal Catalog は、大規模なガバナンスを行います。たとえば、Cloud Storage、Spanner、Pub/Sub に保存される大量の販売データ、在庫データ、顧客データを生成するグローバル小売企業の場合を考えます。データが複数のシステムに分散していると、ガバナンスの管理や品質の確保、コンプライアンスの維持は複雑で時間のかかる作業になり得ます。Dataplex Universal Catalog は、組織のデータアセットのリネージの検出、プロファイリング、検証、追跡、アクセス制御を一元的なビューで提供することで、このプロセスを簡素化します。

Dataplex Universal Catalog を使用する理由

Dataplex Universal Catalog は、次の機能を使用してデータを管理します。

メタデータのカタログ化。 Google Cloud リソース（BigQuery、Cloud SQL、Spanner、Vertex AI、Pub/Sub、Dataform、Dataproc Metastore 内）や Dataplex Universal Catalog にインポートするサードパーティリソースのメタデータを取得して、データアセットのスナップショットを取得します。
データの検出。Cloud Storage バケット内の構造化データと非構造化データをスキャンして、メタデータを抽出してカタログ化します。
データ分析情報。AI を使用してデータに関する自然言語の質問を生成し、パターンの検出、データ品質の評価、統計分析を行います。
データのプロファイリング。BigQuery テーブル内の列データの一般的な特性（一般的なデータ値、データ分散、NULL 数など）を特定します。これにより、データ分類と品質保証の情報が得られます。
データ品質。組織のポリシーと照らし合わせてデータを検証し、データが品質基準を満たしていない場合はアラートをログに記録することにより、BigQuery テーブル内のデータの品質を定義して測定します。
ビジネス用語集。ビジネス関連の用語と定義を組織全体で管理し、テーブルの列に用語を関連付けることで、データの使用を常に把握できるようにします。
データリネージ。データがシステム内でどのように移動するのかを追跡します。具体的には、データの発生源、伝達先、そして加えられた変換処理を把握できます。

Dataplex Universal Catalog は、分散検出からビジネス分析情報まで、エンドツーエンドのデータライフサイクルをサポートします。ガバナンス機能は BigQuery からも利用できます。

ユースケース

Dataplex Universal Catalog を使用すると、次のことができます。

データを検出して把握する。Dataplex Universal Catalog を使用すると、組織全体のデータリソースを可視化できます。これにより、データ消費ニーズに関連したリソースを見つけることができます。データリソースのコンテキストが提供されるため、データ利用者のニーズに対するデータリソースの適合性を把握できます。
データガバナンスとデータマネジメントを有効にする。Dataplex Universal Catalog が提供するメタデータによって、データガバナンス機能とデータマネジメント機能への情報の付与と強化が可能です。
メタデータ用に拡張可能で包括的なリポジトリを維持する。Dataplex Universal Catalog により、 Google Cloud リソースから自動的に収集されたメタデータが保存され、メタデータへのアクセスが可能になります。Google Cloud 以外のシステムのユーザー独自のメタデータを統合できます。ビジネスメタデータとテクニカルメタデータの追加アノテーションを使用して、すべてのメタデータを拡充できます。

使ってみる

Dataplex Universal Catalog を初めて使用する場合は、クイックスタートを試すことをおすすめします。

BigQuery テーブルのデータリネージを追跡する

次のステップ

Dataplex Universal Catalog のメタデータ管理の詳細を確認する。
データアセットを検索する方法を確認する。
エントリの管理方法とカスタムソースを取り込む方法を学習する。
Dataplex Universal Catalog にメタデータをインポートする方法を確認する。
BigQuery のガバナンスの詳細を確認する。

Dataplex Universal Catalog の概要 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

Dataplex Universal Catalog を使用する理由

ユースケース

使ってみる

次のステップ

Dataplex Universal Catalog の概要