パイプラインのスケジュールを設定する

このページでは、パイプラインの実行のスケジュールを作成する方法について説明します。たとえば、パイプラインを毎日午前 1 時(UTC)に実行するようにスケジュール設定できます。

始める前に

スケジュールを作成するには、Cloud Data Fusion にデプロイされたパイプラインが必要です。ない場合は、次のクイックスタートに沿ってパイプラインを作成できます。

スケジュールを作成、編集、一時停止するには、Cloud Data Fusion でパイプラインを開きます。

  1. インスタンスに移動します:

    1. Google Cloud コンソールで、Cloud Data Fusion のページに移動します。

    2. Cloud Data Fusion Studio でインスタンスを開くには、[インスタンス]、[インスタンスを表示] の順にクリックします。

      [インスタンス] に移動

  2. Cloud Data Fusion の [リスト] ページに移動します。

  3. [デプロイ済み] タブで、パイプラインを選択します。

    [パイプライン] ページが開きます。ここで、パイプラインのスケジュールを作成、編集、一時停止できます。

スケジュールを作成する

Cloud Data Fusion Studio の [パイプライン] ページで、[スケジュール] をクリックします。

スケジュールは、[基本] タブまたは [詳細] タブで定義できます。

基本

  1. [基本] タブで、スケジュールに関する次の情報を入力します。

    • 頻度(Every 5 minutesRepeats every 30 days など)。
    • 開始時刻(UTC)。
    • 最大同時実行数: 最大 10 回の実行を選択します。すでに実行されている 10 個のパイプラインが存在する場合、作成するスケジュール設定された実行は実行されません。
    • Compute Engine プロファイル: コンピューティング プロファイルを選択します。デフォルトは Dataproc コンピューティング プロファイルです。
  2. [スケジュールを保存して開始](スケジュールを後で開始する場合は、[スケジュールを保存])をクリックします。

詳細設定

  1. [詳細] タブで、cron 構文でスケジュールを定義します。
  2. [最大同時実行数] フィールドで、最大 10 回の実行を選択します。すでに実行されている 10 個のパイプラインが存在する場合、作成するスケジュール設定された実行は実行されません。
  3. [スケジュールを保存して開始](スケジュールを後で開始する場合は、[スケジュールを保存])をクリックします。

スケジュールを変更または一時停止する

  • パイプライン スケジュールの変更、開始、一時停止は、Cloud Data Fusion Studio の [パイプライン] ページから行えます。

  • スケジュールを一時停止するには、[Unschedule] をクリックします。