ワークフローを作成する

この機能に関するサポートをリクエストする場合、またはフィードバックを提供する場合は、bigquery-workflows-preview-feedback@google.com までメールをお送りください。

このドキュメントでは、BigQuery でワークフローを作成する方法について説明します。Workflows は Dataform をベースにしています。

始める前に

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery, Dataform, and Vertex AI APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery, Dataform, and Vertex AI APIs.

    Enable the APIs

  8. コードアセット管理を有効にするの手順に沿って、ワークフローなどのコードアセットのバージョンを保存、共有、管理します。
  9. コードアセットを初めて作成する場合は、コードアセットの保存に使用するデフォルトのリージョンを設定します。コードアセットのリージョンを作成後に変更することはできません。

必要なロール

ワークフローの作成に必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼してください。

  • ワークフローを作成するには: コード作成者 roles/dataform.codeCreator
  • ワークフローを編集して実行するには: Dataform 編集者 roles/dataform.editor

ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

Dataform IAM の詳細については、IAM によるアクセス制御をご覧ください。

ワークフローを作成する

ワークフローを作成する手順は次のとおりです。

  1. [BigQuery] ページに移動します。

    BigQuery に移動

  2. エディタペインのタブバーで、+ 記号の横にある 矢印プルダウン メニューをクリックし、[ワークフロー] をクリックします。

  3. 省略可: ワークフローに名前を変更するには、ワークフロー名をクリックして、新しい名前を入力します。

  4. [開始する] をクリックし、[設定] タブに移動します。

  5. [サービス アカウント] フィールドで、Dataform サービス アカウントを選択します。

  6. [ロケーション] セクションで、ワークフローの処理リージョンを選択します。

    1. 特定のリージョンを選択するには、[リージョン] を選択し、[リージョン] プルダウン メニューでリージョンを選択します。
    2. マルチリージョンを選択するには、[マルチリージョン] を選択し、[マルチリージョン] プルダウン メニューでマルチリージョンを選択します。

    ワークフローの処理リージョンは、コードアセットのデフォルトのストレージ リージョンと一致する必要はありません。

  7. ワークフローにノートブックを追加する場合は、次の操作を行います。

    1. [Cloud Storage バケット] フィールドで、[参照] をクリックして、ワークフローにノートブックの出力を保存する Cloud Storage バケットを選択または作成します。

    2. バケットレベルのポリシーにプリンシパルを追加するの手順に沿って、カスタム Dataform サービス アカウントをプリンシパルとして、スケジュール設定したワークフローの実行の出力を保存するために使用する Cloud Storage バケットに追加し、このプリンシパルにストレージ管理者(roles/storage.admin)ロールを付与します。

      選択したカスタム Dataform サービス アカウントには、選択したバケットに対するストレージ管理者の IAM ロールを付与する必要があります。

ワークフロー タスクを追加する

ワークフローにタスクを追加する手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery] ページに移動します。

    BigQuery に移動

  2. [エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。

  3. SQL クエリまたはノートブックを追加する手順は次のとおりです。

    SQL クエリ

    1. [タスクを追加] をクリックし、[クエリ] を選択します。

    2. 省略可: [クエリタスクの詳細] ペインの [実行後] プルダウン メニューで、クエリの前に実行するタスクを選択します。

      クエリは、前のタスクによって異なります。

    3. クエリを作成するには、[クエリを作成] をクリックします。

    4. 新しいクエリにクエリ構文を追加し、[クエリを保存] をクリックします。

    5. 省略可: クエリの名前を変更するには、クエリ名をクリックして新しい名前を入力します。

    ノートブック

    1. [タスクを追加] をクリックし、[ノートブック] を選択します。

    2. 省略可: [ノートブック タスクの詳細] ペインの [実行後] プルダウン メニューで、ノートブックの前に実行するタスクを選択します。

      ノートブックは、前のタスクによって異なります。

    3. ノートブックを作成するには、[ノートブックを作成] をクリックします。

    4. 新しいノートブックでノートブック コンテンツを追加し、[保存] をクリックします。

    5. 省略可: ノートブックの名前を変更するには、ノートブック名をクリックして新しい名前を入力します。

ワークフロー タスクを編集する

ワークフロー タスクを編集する手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery] ページに移動します。

    BigQuery に移動

  2. [エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。

  3. 選択したタスクをクリックします。

  4. 前のタスクを変更するには、[実行後] プルダウン メニューで、ノートブックの前に実行するタスクを選択します。

  5. 選択したタスクの内容を編集するには、[編集] をクリックします。

  6. 開いた新しいタブでタスクの内容を編集し、タスクの変更を保存します。

ワークフロー タスクを削除する

ワークフローのタスクを削除する手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery] ページに移動します。

    BigQuery に移動

  2. [エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。

  3. 選択したタスクをクリックします。

  4. [タスクの詳細] ペインで、[ 削除削除] アイコンをクリックします。

ワークフローを実行する

ワークフローの現在のバージョンを手動で実行する手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery] ページに移動します。

    BigQuery に移動

  2. [エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。

  3. [実行] をクリックします。

  4. 省略可: 実行を検査するには、過去の手動実行を表示します。

次のステップ