このページでは、パイプラインの実行のスケジュールを作成する方法について説明します。たとえば、パイプラインを毎日午前 1 時(UTC)に実行するようにスケジュール設定できます。
始める前に
スケジュールを作成するには、Cloud Data Fusion にデプロイされたパイプラインが必要です。ない場合は、次のクイックスタートに沿ってパイプラインを作成できます。
スケジュールを作成、編集、一時停止するには、Cloud Data Fusion でパイプラインを開きます。
インスタンスに移動します:
Google Cloud コンソールで、Cloud Data Fusion のページに移動します。
Cloud Data Fusion Studio でインスタンスを開くには、[インスタンス]、[インスタンスを表示] の順にクリックします。
Cloud Data Fusion の [リスト] ページに移動します。
[デプロイ済み] タブで、パイプラインを選択します。
[パイプライン] ページが開きます。ここで、パイプラインのスケジュールを作成、編集、一時停止できます。
スケジュールを作成する
Cloud Data Fusion Studio の [パイプライン] ページで、[スケジュール] をクリックします。
スケジュールは、[基本] タブまたは [詳細] タブで定義できます。
基本
[基本] タブで、スケジュールに関する次の情報を入力します。
- 頻度(
Every 5 minutes
、Repeats every 30 days
など)。 - 開始時刻(UTC)。
- 最大同時実行数: 最大 10 回の実行を選択します。すでに実行されている 10 個のパイプラインが存在する場合、作成するスケジュール設定された実行は実行されません。
- Compute Engine プロファイル: コンピューティング プロファイルを選択します。デフォルトは Dataproc コンピューティング プロファイルです。
- 頻度(
[スケジュールを保存して開始](スケジュールを後で開始する場合は、[スケジュールを保存])をクリックします。
詳細設定
- [詳細] タブで、cron 構文でスケジュールを定義します。
- [最大同時実行数] フィールドで、最大 10 回の実行を選択します。すでに実行されている 10 個のパイプラインが存在する場合、作成するスケジュール設定された実行は実行されません。
- [スケジュールを保存して開始](スケジュールを後で開始する場合は、[スケジュールを保存])をクリックします。
スケジュールを変更または一時停止する
パイプライン スケジュールの変更、開始、一時停止は、Cloud Data Fusion Studio の [パイプライン] ページから行えます。
スケジュールを一時停止するには、[Unschedule] をクリックします。