このページでは、Cloud Data Fusion インスタンスを作成する方法について説明します。
始める前に
- Cloud Data Fusion API を有効にします。
- Cloud Data Fusion インスタンスを作成するには、
instances.create
権限が必要です。詳細については、アクセス制御をご覧ください。 - Cloud Data Fusion インスタンスは、Compute Engine のデフォルトのサービス アカウントとして実行されます。利用可能な種類とロールについては、サービス アカウントをご覧ください。
- デフォルトでは、Cloud Data Fusion はプロジェクト内の Dataproc クラスタを使用してパイプラインを実行します。プロジェクトが Dataproc ネットワークの要件を満たしていることを確認してください。
- 新しいプロジェクトはデフォルト ネットワークで開始されます。デフォルトのネットワークには、ファイアウォール default-allow-ssh が事前に設定されています。このファイアウォールでは、任意の送信元からネットワーク内の任意のインスタンスへの受信接続が TCP ポート 22 で許可されます。バージョン 6.2.0 より前のバージョンで、Cloud Data Fusion インスタンスで使用されているネットワークに TCP ポート 22 で上り(内向き)を許可するルールが存在しない場合、このルールを作成します。
インスタンスを作成する
Console
API が有効になっている場合、Google Cloud コンソールの Cloud Data Fusion セクションに [インスタンス] ページが表示され、ここで Cloud Data Fusion インスタンスを作成して管理できます。
- コンソールで、Cloud Data Fusion の [インスタンス] ページに移動します。
- [インスタンス]、[インスタンスを作成] の順にクリックします。
- [インスタンス名] を入力します。
- インスタンスの [説明] を入力します。
- インスタンスを作成する [リージョン] を指定します。
- Cloud Data Fusion のバージョンを指定します。
- [Edition] を選択します。デフォルトは [ベーシック] です。
- 省略可: [アクセラレータを追加] をクリックして、インスタンスで使用するアクセラレータを選択します。
- Dataproc で Cloud Data Fusion パイプラインの実行に使用する [Dataproc サービス アカウント] を指定します。デフォルトは Compute Engine アカウントです。バージョンに関係なく、サービス アカウントにニーズに合った Identity and Access Management ロールがあることを確認してください。詳しくは、サービス アカウント ユーザーの権限の付与をご覧ください。
省略可: 詳細オプションを指定します。何も指定しない場合、次のデフォルトが使用されます。
カテゴリ 設定 説明 デフォルト プライベート IP 内部 IP アドレスを有効にする 内部 IP アドレスを使用して Cloud Data Fusion インスタンスを作成します。 無効 ロギングとモニタリング Cloud Logging を有効にする Cloud Logging でパイプライン ログを表示する。 無効 Dataplex データリネージ統合 Dataplex データリネージとの統合を有効または無効にする Dataplex でリネージを表示する 無効 暗号化 顧客管理の暗号鍵(CMEK)を使用する バージョン 6.5 以降では、ロールベースのアクセス制御を使用します。 無効 ラベル Key-Value ペア Compute Engine VM など、基になる関連リソースにアノテーションを付けるために使用する、インスタンスのリソースラベル。ラベルキーとラベル値には、文字、数字、ダッシュ、アンダースコアのみを含めることができます。ラベルキーの先頭は文字または数字である必要があります。 なし メンテナンス メンテナンスの時間枠を有効にする Cloud Data Fusion がインスタンスに対してメンテナンス オペレーションを実行できる時間枠を設定します。詳細については、メンテナンスの時間枠を構成するをご覧ください。 無効 [作成] をクリックします。インスタンスの作成プロセスが完了するまで 30 分ほどかかります。
Cloud Data Fusion がインスタンスを作成している間、[インスタンス] ページのインスタンス名の横に進捗状況が表示されます。完了すると、インスタンスの使用を開始できることを意味する緑色のチェックマークに変わります。
API
インスタンスの作成
Cloud Data Fusion REST API を使用して Cloud Data Fusion インスタンスを作成するには、instances.create
API リクエストを作成し、Instance
リソースに構成情報を入力します。
次のステップ
- Cloud Data Fusion について学ぶ。
- チュートリアルに取り組む。