BigQuery で BigLake Iceberg テーブルを構成する

このページでは、BigQuery の BigLake Iceberg テーブルへのレプリケーション用に Datastream を構成する方法について説明します。

BigLake Iceberg テーブルは、標準の BigQuery テーブルと同じフルマネージド エクスペリエンスを提供しますが、Apache Iceberg テーブル形式と Parquet ファイル形式で、お客様所有の Cloud Storage バケットにデータを保存します。データを独自のストレージ バケットに保持しながら、BigQuery の機能を使用してデータをクエリして分析できます。

BigLake Iceberg テーブルへのストリーミングを構成する

ストリームを設定して BigLake Iceberg テーブルにデータを取り込むには:

  1. データを保存する Cloud Storage バケットを作成します。
  2. BigQuery でクラウド リソース接続を作成します。このタイプの接続の作成方法については、Cloud リソース接続を作成して設定するをご覧ください。
  3. 接続サービス アカウントの ID を取得します。

    bq show --location=LOCATION --connection --project_id=PROJECT_ID
    CONNECTION_NAME
    
  4. 作成した Cloud Storage バケットへのアクセス権を Cloud リソース接続に付与します。これを行うには、接続サービス アカウントに storage.admin IAM 権限を追加します。

    gcloud storage buckets add-iam-policy-binding gs://YOUR_GCS_BUCKET \
    --member=serviceAccount:YOUR_SERVICE_ACCOUNT_ID \
    --role=roles/storage.admin
    
  5. BigLake Iceberg テーブル ストリームを作成します。

    Google Cloud コンソールを使用して BigLake Iceberg テーブル ストリームを作成する方法については、ストリームを作成するをご覧ください。

    REST、Google Cloud CLI、Terraform を使用して BigLake Iceberg テーブルにデータをストリーミングするリクエストを作成する方法については、API を使用してストリームを管理するをご覧ください。

次のステップ