ノートブックを作成する
このドキュメントでは、BigQuery で Colab Enterprise ノートブックを作成する方法について説明します。ノートブックは、Dataform が提供する BigQuery Studio コードアセットです。
始める前に
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery API.
BigQuery Studio を有効にする
アセット管理に関する BigQuery Studio を有効にするの手順に沿って、コードアセット(ノートブックなど)のバージョンを保存、共有、管理します。
必要な権限
ノートブックを作成、編集、表示するための適切な権限を設定します。
Dataform 管理者(roles/dataform.admin
)ロールを持つすべてのユーザーは、プロジェクトで作成されたすべてのノートブックに対するオーナー アクセス権を持ちます。
BigQuery Identity and Access Management(IAM)の詳細については、IAM によるアクセス制御をご覧ください。
ノートブックを作成する権限
ノートブックを作成して実行するには、次の IAM 権限が必要です。
resourcemanager.projects.get
resourcemanager.projects.list
bigquery.config.get
bigquery.jobs.create
bigquery.readsessions.create
bigquery.readsessions.getData
bigquery.readsessions.update
resourcemanager.projects.get
resourcemanager.projects.list
dataform.locations.get
dataform.locations.list
dataform.repositories.create
dataform.repositories.list
dataform.collections.create
dataform.collections.list
aiplatform.notebookRuntimeTemplates.apply
aiplatform.notebookRuntimeTemplates.get
aiplatform.notebookRuntimeTemplates.list
aiplatform.notebookRuntimeTemplates.getIamPolicy
aiplatform.notebookRuntimes.assign
aiplatform.notebookRuntimes.get
aiplatform.notebookRuntimes.list
aiplatform.operations.list
これらの権限は、次の IAM ロールから取得できます。
- BigQuery 読み取りセッション ユーザー(
roles/bigquery.readSessionUser
) BigQuery Studio ユーザー(
roles/bigquery.studioUser
)BigQuery Studio ユーザーのロールは、次の IAM ロールを組み合わせたものです。
ノートブックを編集する権限
ノートブックを編集して実行するには、次の IAM ロールが必要です。
- BigQuery ジョブユーザー(
roles/bigquery.jobUser
) - BigQuery 読み取りセッション ユーザー(
roles/bigquery.readSessionUser
) - ノートブック ランタイム ユーザー(
roles/aiplatform.notebookRuntimeUser
) - コードエディタ(
roles/dataform.codeEditor
)
ノートブックを表示する権限
ノートブックを表示して実行するには、次の IAM ロールが必要です。
- BigQuery ジョブユーザー(
roles/bigquery.jobUser
) - BigQuery 読み取りセッション ユーザー(
roles/bigquery.readSessionUser
) - ノートブック ランタイム ユーザー(
roles/aiplatform.notebookRuntimeUser
) - コード閲覧者(
roles/dataform.codeViewer
)
ノートブックを作成する
ノートブックの作成方法については、次のセクションをご覧ください。
コードアセットにデフォルトのリージョンを設定する
コードアセットを初めて作成する場合は、コードアセットのデフォルト リージョンを設定します。コードアセットのリージョンを作成後に変更することはできません。
BigQuery エディタからノートブックを作成する
特定のテーブル用のデフォルト クエリを含むノートブックを作成する手順は、次のとおりです。
BigQuery ページに移動します。
エディタペインのタブバーで、+ 記号の横にある
矢印プルダウンをクリックし、[Python ノートブックを作成] をクリックします。新しいノートブックが開き、
bigquery-public-data.ml_datasets.penguins
一般公開データセットに対するクエリの例を示すセルが含まれています。
テーブルからノートブックを作成する
特定のテーブル用のデフォルト クエリを含むノートブックを作成するには、次の手順を行います。
BigQuery ページに移動します。
[エクスプローラ] ペインでプロジェクトを開き、クエリを実行するテーブルを見つけます。
テーブルの横にある > [Python ノートブック] をクリックします。
(アクションを表示)をクリックし、[クエリ]新しいノートブックが開き、選択したテーブルに対するクエリの例が表示されます。
クエリの結果セットを調べるためのノートブックを作成する
クエリの結果セットを調べるノートブックを作成する手順は次のとおりです。
[BigQuery] ページに移動します。
エディタペインで、クエリ結果を生成するクエリを実行します。
[クエリ結果] ペインで [データを探索] をクリックし、[Python ノートブックで探索] をクリックします。
新しいノートブックが開き、クエリ SQL とクエリ結果を返すコードを含むセルが表示されます。
既存のノートブックからノートブックを作成する
既存のノートブックの任意のバージョンを新しいノートブックとして開くには、次の操作を行います。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ノートブック] フォルダを開き、必要に応じて [共有ノートブック] フォルダを開きます。ノートブックを選択します。
[アクティビティ] ペインを選択します。
ノートブック バージョンの横にある
(アクションを表示)をクリックし、[新しい Python ノートブックとして開く] をクリックします。ノートブックのコピーが新しいノートブックとして開かれます。
ノートブックをアップロードする
ローカル ノートブックをアップロードして、BigQuery Studio で使用できるようにします。アップロードされたノートブックは、Google Cloud コンソールの BigQuery ページに表示されます。
ノートブックをアップロードするには、次の操作を行います。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインでプロジェクトを開き、次のいずれかを行います。
- [ノートブック] の横にある > [Notebooks にアップロード] をクリックします。 (アクションを表示)
- Google Cloud プロジェクト名の横にある > [プロジェクトにアップロードする] > [Python ノートブック] をクリックします。 (アクションを表示)
[ノートブックのアップロード] ダイアログの [ノートブック] フィールドで、[参照] をクリックして、アップロードするノートブックを選択します。
省略可: [ノートブック名] フィールドで、ノートブック ファイルの名前を編集します。
[リージョン] フィールドで、ノートブックをアップロードするリージョンを選択します。
[アップロード] をクリックします。
ノートブックが [エクスプローラ ペイン] に表示されます。
ランタイムに接続する
以降のセクションでは、ノートブックを Vertex AI ランタイムに接続する方法について説明します。ランタイムは、ノートブックでコードを実行するコンピューティング リソースです。
ランタイムの詳細については、ランタイムとランタイム テンプレートをご覧ください。
デフォルトのランタイムに接続する
デフォルトのランタイムは、最小限の設定が必要なプリセット ランタイムです。
デフォルトのランタイムに接続するには、次の操作を行います。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ノートブック] フォルダを開き、必要に応じて [共有ノートブック] フォルダを開きます。ノートブックの名前をクリックして開きます。
ノートブックで [接続] をクリックするか、ノートブックの任意のセルを実行します。
アクティブなランタイムがない場合、デフォルトのランタイムへの接続に数分かかることがあります。
デフォルト以外のランタイムに接続する
デフォルト ランタイム以外のランタイムを使用する場合は、まず Vertex AI で追加のランタイムを作成する必要があります。
デフォルト以外のランタイムに接続するには、次の操作を行います。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ノートブック] フォルダを開き、必要に応じて [共有ノートブック] フォルダを開きます。ノートブックの名前をクリックして開きます。
ノートブックで、[接続] の横にある
プルダウンをクリックし、[Connect to a runtime] をクリックします。[既存のランタイムに接続します] をクリックします。
[ランタイム] で、使用するランタイムを選択します。
[Connect] をクリックします。
新しいランタイムに接続する
新しいランタイムに接続するには、次の操作を行います。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ノートブック] フォルダを開き、必要に応じて [共有ノートブック] フォルダを開きます。ノートブックの名前をクリックして開きます。
ノートブックで、[接続] の横にある
プルダウンをクリックし、[Connect to a runtime] をクリックします。[ランタイムを新規作成します] をクリックします。
[ランタイム テンプレート] で、使用する Vertex AI ランタイム テンプレートを選択します。
[ランタイム名] にランタイムの名前を入力します。
[Connect] をクリックします。
ノートブックへのアクセス権を付与する
他のユーザーにノートブックへのアクセス権を付与するには、そのユーザーを適切な IAM ロールに追加します。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ノートブック] フォルダを開き、必要に応じて [共有ノートブック] フォルダを開きます。アクセス権を付与するノートブックを見つけます。
ノートブックの横にある > [権限の管理] をクリックします。
(アクションを表示)をクリックし、[共有][権限を管理] ペインで、[ユーザー / グループの追加] をクリックします。
[新しいプリンシパル] フィールドに、プリンシパルを入力します。
[ロール] リストで、次のいずれかのロールを選択します。
省略可: ロールと詳細な共有設定の完全なリストを表示するには、[詳細な共有] をクリックします。
[保存] をクリックします。
ノートブック情報ページに戻るには、[閉じる] をクリックします。
ノートブックを共有する
ノートブックを他のユーザーと共有するには、ノートブックへのリンクを生成して共有します。共有したノートブックを他のユーザーに表示するには、最初にノートブックへのアクセス権を付与する必要があります。
ノートブックを実行するには、ノートブックがアクセスするデータにユーザーがアクセスできる必要があります。詳細については、データセットへのアクセス権を付与するをご覧ください。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ノートブック] フォルダを開き、必要に応じて [共有ノートブック] フォルダを開きます。共有するノートブックを見つけます。
ノートブックの横にある > [リンクをコピー] をクリックします。
(アクションを表示)をクリックし、[共有]リンクを他のユーザーと共有します。
ノートブックの出力保存を無効にする
ノートブックの出力保存を無効にすると、ノートブック ファイルにアクセスできる他のユーザーと保存済みのノートブック出力を共有できなくなります。
選択したノートブックの出力保存を無効にすると、BigQuery はノートブック ファイルに保存されているすべての出力を削除し、その後の実行の出力は保存されません。
ただし、ノートブックにアクセスできるユーザーは、次の方法で出力を表示できます。
- ノートブックを実行して、現在の出力を確認します。この出力は保存されません。
- ノートブックのアーカイブ バージョンとその出力をリビジョン履歴で確認します。
選択したノートブックの出力保存を無効にするには、次の操作を行います。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ノートブック] フォルダを開き、出力保存を無効にするノートブックを選択します。
> [編集] > [Notebook settings] をクリックします。
(ヘッダーの表示 / 非表示を切り替え)[Notebook settings] ウィンドウで、[Omit code cell output when saving this notebook] を選択します。
[保存] をクリックします。
[再読み込み] をクリックします。
競合を解決する
ユーザーと別のユーザーがノートブックで競合する変更を加えると、Automatic saving failed. This file was updated remotely or
in another tab.
エラーが返され、Show diff
リンクが提供されます。競合を解決する手順は次のとおりです。
Show diff
リンクをクリックします。[リモート変更の確認] ダイアログが開きます。- 省略可: ノートブックのソースコードを比較するには、[元の形式のソース] チェックボックスをオンにします。
- 省略可: 個別のペインではなく、インラインでバージョンを比較するには、[インラインで差分を表示] チェックボックスをオンにします。
- 変更内容を確認して、どれを残すかを判断し、必要に応じて入力を変更します。
- [変更を保存] をクリックします。
ノートブックの名前を変更する
ノートブックの名前を変更するには、次の操作を行います。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ノートブック] フォルダを開き、必要に応じて [共有ノートブック] フォルダを開きます。名前を変更するノートブックを見つけます。
ノートブックの横にある
(アクションを表示)をクリックし、[名前を変更] をクリックします。ノートブックの名前を入力して、[名前を変更] をクリックします。
トラブルシューティング
詳細については、Colab Enterprise のトラブルシューティングをご覧ください。
次のステップ
- ノートブックを管理する方法を確認する。
- ノートブックをオーケストレートする方法を学習する。