クイックスタート: レイクを作成する
このドキュメントでは、レイクの作成、ゾーンの追加、アセットのアタッチを通じて、Google Cloud コンソールで Dataplex を開始する方法について説明します。
始める前に
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage APIs.
-
Make sure that you have the following role or roles on the project: `roles/dataplex.admin`, `roles/dataplex.editor`
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
[IAM] に移動 - プロジェクトを選択します。
- [ アクセスを許可] をクリックします。
-
[新しいプリンシパル] フィールドに、ユーザー ID を入力します。 これは通常、Google アカウントのメールアドレスです。
- [ロールを選択] リストでロールを選択します。
- 追加のロールを付与するには、 [別のロールを追加] をクリックして各ロールを追加します。
- [保存] をクリックします。
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage APIs.
-
Make sure that you have the following role or roles on the project: `roles/dataplex.admin`, `roles/dataplex.editor`
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
[IAM] に移動 - プロジェクトを選択します。
- [ アクセスを許可] をクリックします。
-
[新しいプリンシパル] フィールドに、ユーザー ID を入力します。 これは通常、Google アカウントのメールアドレスです。
- [ロールを選択] リストでロールを選択します。
- 追加のロールを付与するには、 [別のロールを追加] をクリックして各ロールを追加します。
- [保存] をクリックします。
-
- Cloud Storage バケットの作成:
- In the Google Cloud console, go to the Cloud Storage Buckets page.
- Click Create bucket.
- On the Create a bucket page, enter your bucket information. To go to the next
step, click Continue.
- For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
-
For Choose where to store your data, do the following:
- Select a Location type option.
- Select a Location option.
- For Choose a default storage class for your data, select the following: Standard.
- For Choose how to control access to objects, select an Access control option.
- For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
- Click Create.
レイクを作成する
レイクは、データドメインまたはビジネス ユニットを表す論理的な構造です。たとえば、グループの使用状況に基づいてデータを整理する必要がある場合は、部門(小売、販売、財務など)ごとにレイクを作成します。
次の手順では、Google Cloud コンソールを使用してレイクを作成する方法について説明します。
Google Cloud コンソールで Dataplex に移動します。
[管理] ビューに移動します。
[
作成] をクリックします。[表示名] を入力します。
レイク ID は自動的に生成されます。
レイクを作成する [リージョン] を指定します。
所与のリージョン(たとえば、
us-central1
)で作成されたレイクの場合、シングルリージョン(us-central1
)データとマルチリージョン(us multi-region
)データの両方をゾーン設定に応じてアタッチできます。[作成] をクリックします。
ゾーンをレイクに追加する
レイクを作成すると、ゾーンをレイクに追加できるようになります。ゾーンはレイク内の論理グループであり、構造化データと非構造化データを分類するのに役立ちます。
[管理] ビューで、ゾーンを追加するレイクの名前をクリックします。
[ゾーンを追加] をクリックします。
ゾーンの表示名を入力します。
[タイプ] プルダウンをクリックします。[未加工ゾーン] または [キュレートされたゾーン] を選択します。クラスタのタイプに関する詳細を確認します。
[データのロケーション] で、[リージョン] または [マルチリージョン] を選択します。選択したものは後で変更できません。単一リージョンとマルチリージョンのデータを同一のゾーン内で混在させることはできません。
[作成] をクリックします。
ゾーンが作成されるまでに数分かかる場合があります。
アセットをアタッチする
データは Cloud Storage バケットまたは BigQuery データセットに保存でき、Dataplex レイク内のデータゾーンにアセットとしてアタッチできます。
Cloud Storage バケットをアセットとしてアタッチする手順は次のとおりです。
[管理] ビューで、Cloud Storage バケットをアタッチするレイクの名前をクリックします。
[ゾーン] タブで、アセットを追加するゾーンをクリックします。
[アセット] タブで
[アセットを追加] をクリックします。[アセットを追加] をクリックします。
[タイプ] で [Storage バケット] を選択します。
[表示名] に、アセットの名前を入力します。
[Bucket] フィールドで [参照] をクリックします。Cloud Storage バケットがある場合は、そのバケットを見つけて [選択] をクリックします。Cloud Storage バケットがない場合は、
ボタンをクリックして作成できます。バケットの一意の名前を入力します。[続行] をクリックします。
[ロケーション タイプ] を選択します。[続行] をクリックします。
データのデフォルトのストレージ クラスを選択します。[続行] をクリックします。
アクセス制御レベルを選択します。[続行] をクリックします。
データ保護オプションまたは [なし] を選択します。[続行] をクリックします。
[作成] をクリックします。
[選択] をクリックします。
[完了] をクリックします。
[続行] をクリックします。
[検出の設定] で [継承] を選択して、ゾーンレベルから検出の設定を継承します。
[続行] をクリックします。
[アセットを追加] で [送信] をクリックします。
クラスタの作成が完了するまで待機します。
レイクを使用するには、次のステップ セクションをご覧ください。それ以外の場合は、クリーンアップ セクションの手順に沿って作成したリソースを削除します。
クリーンアップ
このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。
- In the Google Cloud console, go to the Manage resources page.
- If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
あるいは、このチュートリアルで使用したリソースを削除することもできます。レイクは、そのデータゾーン リソースをすべて削除するまで削除されません。同様に、データゾーンは、そのアセット リソースをすべて削除しない限り削除されません。
ストレージ バケットを接続解除する
作成した Dataplex アセットを切断する手順は次のとおりです。
Google Cloud コンソールで Dataplex に移動します。
[管理] ビューで、作成したレイクの名前をクリックします。
[ゾーン] タブで、作成したゾーンの名前をクリックします。
[アセット] タブで、バケット名の左側にあるチェックボックスをオンにして、接続解除するアセットを選択します。
[アセットを削除] をクリックします。
[削除] をクリックして、切断を確定します。
ゾーンを削除する
作成した Dataplex ゾーンを削除する手順は次のとおりです。
Google Cloud コンソールで Dataplex に移動します。
[管理] ビューで、作成したレイクをクリックします。
[ゾーン] タブで、データゾーン名の左側にあるチェックボックスをオンにして、削除するゾーンを選択します。
[ゾーンを削除] をクリックします。
[削除] をクリックして削除を確定します。
レイクを削除する
次の手順では、作成した Dataplex レイクを削除する方法について説明します。
Google Cloud コンソールで Dataplex に移動します。
[管理] ビューで、作成したレイクをクリックします。
ページ上部の [削除] をクリックします。
フィールドに「削除」と入力して削除を確定します。
[レイクを削除] をクリックして削除を確定します。
次のステップ
- レイクとゾーンにデータを編成します。
- レイクを保護します。
- 検出されたメタデータを Google Cloud コンソールを使用して表示します。
- 検出されたメタデータを API を使用して表示します。