ワークフローを作成する
この機能に関するサポートをリクエストする場合、またはフィードバックを提供する場合は、bigquery-workflows-preview-feedback@google.com までメールをお送りください。
このドキュメントでは、BigQuery でワークフローを作成する方法について説明します。Workflows は Dataform をベースにしています。
始める前に
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Dataform, and Vertex AI APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Dataform, and Vertex AI APIs.
- コードアセット管理を有効にするの手順に沿って、ワークフローなどのコードアセットのバージョンを保存、共有、管理します。
- コードアセットを初めて作成する場合は、コードアセットの保存に使用するデフォルトのリージョンを設定します。コードアセットのリージョンを作成後に変更することはできません。
必要なロール
ワークフローの作成に必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼してください。
-
ワークフローを作成するには:
コード作成者 (
roles/dataform.codeCreator
) -
ワークフローを編集して実行するには:
Dataform 編集者 (
roles/dataform.editor
)
ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。
必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。
Dataform IAM の詳細については、IAM によるアクセス制御をご覧ください。
ワークフローを作成する
ワークフローを作成する手順は次のとおりです。
[BigQuery] ページに移動します。
エディタペインのタブバーで、+ 記号の横にある
矢印プルダウン メニューをクリックし、[ワークフロー] をクリックします。省略可: ワークフローに名前を変更するには、ワークフロー名をクリックして、新しい名前を入力します。
[開始する] をクリックし、[設定] タブに移動します。
[サービス アカウント] フィールドで、Dataform サービス アカウントを選択します。
[ロケーション] セクションで、ワークフローの処理リージョンを選択します。
- 特定のリージョンを選択するには、[リージョン] を選択し、[リージョン] プルダウン メニューでリージョンを選択します。
- マルチリージョンを選択するには、[マルチリージョン] を選択し、[マルチリージョン] プルダウン メニューでマルチリージョンを選択します。
ワークフローの処理リージョンは、コードアセットのデフォルトのストレージ リージョンと一致する必要はありません。
ワークフローにノートブックを追加する場合は、次の操作を行います。
[Cloud Storage バケット] フィールドで、[参照] をクリックして、ワークフローにノートブックの出力を保存する Cloud Storage バケットを選択または作成します。
バケットレベルのポリシーにプリンシパルを追加するの手順に沿って、カスタム Dataform サービス アカウントをプリンシパルとして、スケジュール設定したワークフローの実行の出力を保存するために使用する Cloud Storage バケットに追加し、このプリンシパルにストレージ管理者(
roles/storage.admin
)ロールを付与します。選択したカスタム Dataform サービス アカウントには、選択したバケットに対するストレージ管理者の IAM ロールを付与する必要があります。
ワークフロー タスクを追加する
ワークフローにタスクを追加する手順は次のとおりです。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。
SQL クエリまたはノートブックを追加する手順は次のとおりです。
SQL クエリ
[タスクを追加] をクリックし、[クエリ] を選択します。
省略可: [クエリタスクの詳細] ペインの [実行後] プルダウン メニューで、クエリの前に実行するタスクを選択します。
クエリは、前のタスクによって異なります。
クエリを作成するには、[クエリを作成] をクリックします。
新しいクエリにクエリ構文を追加し、[クエリを保存] をクリックします。
省略可: クエリの名前を変更するには、クエリ名をクリックして新しい名前を入力します。
ノートブック
[タスクを追加] をクリックし、[ノートブック] を選択します。
省略可: [ノートブック タスクの詳細] ペインの [実行後] プルダウン メニューで、ノートブックの前に実行するタスクを選択します。
ノートブックは、前のタスクによって異なります。
ノートブックを作成するには、[ノートブックを作成] をクリックします。
新しいノートブックでノートブック コンテンツを追加し、[保存] をクリックします。
省略可: ノートブックの名前を変更するには、ノートブック名をクリックして新しい名前を入力します。
ワークフロー タスクを編集する
ワークフロー タスクを編集する手順は次のとおりです。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。
選択したタスクをクリックします。
前のタスクを変更するには、[実行後] プルダウン メニューで、ノートブックの前に実行するタスクを選択します。
選択したタスクの内容を編集するには、[編集] をクリックします。
開いた新しいタブでタスクの内容を編集し、タスクの変更を保存します。
ワークフロー タスクを削除する
ワークフローのタスクを削除する手順は次のとおりです。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。
選択したタスクをクリックします。
[タスクの詳細] ペインで、[ 削除削除] アイコンをクリックします。
ワークフローを実行する
ワークフローの現在のバージョンを手動で実行する手順は次のとおりです。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。
[実行] をクリックします。
省略可: 実行を検査するには、過去の手動実行を表示します。
次のステップ
- BigQuery のワークフローの詳細を確認する。
- ワークフローを管理する方法を学習する。