このページは Cloud Translation API によって翻訳されました。

連携クエリの概要

このページでは、連携クエリの使用方法と、BigQuery から Spanner、AlloyDB、Cloud SQL のデータをクエリする方法について説明します。

連携クエリを使用すると、クエリステートメントを AlloyDB、Spanner、または Cloud SQL データベースに送信し、結果を一時テーブルとして取得できます。連携クエリは、BigQuery Connection API を使用して AlloyDB、Spanner、または Cloud SQL との接続を確立します。クエリで EXTERNAL_QUERY 関数を使用して、外部データベースの SQL 言語を使用してクエリステートメントを外部データベースに送信します。結果は GoogleSQL データ型に変換されます。

サポートされているデータストア

連携クエリは、次のデータストアで使用できます。

ワークフロー

クエリを実行するデータソースを含む Google Cloud プロジェクトを特定します。
bigquery.admin ユーザーが BigQuery で接続リソースを作成します。
管理ユーザーが、ユーザー B に接続リソースの使用権限を付与します。
- 管理者とユーザー B が同一人物の場合は、権限を付与する必要はありません。
ユーザー B が BigQuery で新しい EXTERNAL_QUERY 関数を使用してクエリを作成します。

連携クエリに代わる方法: 外部のテーブルとデータセット

Bigtable、Spanner、Cloud Storage、Google ドライブ、Salesforce Data Cloud などのオペレーショナルデータベースをクエリする別の方法として、外部のテーブルとデータセットを使用する方法があります。外部のデータセットやテーブルを使用すると、EXTERNAL_QUERY SQL 関数を使用せずに、テーブルとそのスキーマを表示してクエリできます。データを BigQuery に戻す必要はなく、SQL 固有の SQL データベース言語で記述する代わりに BigQuery 構文を使用できます。

サポートされるリージョン

サポートされているロケーションの一覧については、次のセクションをご覧ください。

AlloyDB と Cloud SQL

連携クエリは、外部データソースと BigQuery の両方をサポートするリージョンでのみサポートされます。

次のルールに従って接続を作成し、リージョン間で連携クエリを実行できます。

単一リージョン

BigQuery の単一リージョンは、同じリージョン内のリソースにのみクエリを実行できます。

たとえば、データセットが us-east4 にある場合、us-east4 内に配置されている Cloud SQL インスタンスまたは AlloyDB インスタンスに対してクエリを実行できます。クエリ処理ロケーションは BigQuery の単一リージョンです。

マルチリージョン

BigQuery マルチリージョンは、同じ大規模な地域（米国、EU）内の任意のデータソースリージョンにクエリを実行できます。次に例を示します。マルチリージョンのロケーションは Cloud SQL インスタンスでは使用できません。これらはバックアップにのみ使用されるためです。

BigQuery US マルチリージョンで実行されるクエリは、us-central1、us-east4、us-west2 など、米国内の任意のシングルリージョンに対してクエリを実行できます。

注意: southamerica-east1 にある外部データソースに対して、US マルチリージョンの BigQuery データセットからクエリを実行することはサポートされていません。
BigQuery EU マルチリージョンで実行されるクエリは、europe-north1、europe-west3 など、EU の加盟国にある任意のシングルリージョンに対してクエリを実行できます。
クエリを実行するロケーションは、接続リソースのロケーションと同じにする必要があります。たとえば、US マルチリージョンから実行されるクエリは、US マルチリージョンにある接続を使用する必要があります。

注意: マルチリージョンから送信されたクエリは、単一リージョンの接続を参照できなくなります。影響を受ける接続がある場合は、クエリと同じマルチリージョンで接続を再作成してください。

クエリのパフォーマンスは、データセットと外部データソースの近接度に応じて異なります。たとえば US マルチリージョンのデータセットと us-central1 の Cloud SQL インスタンス間の連携クエリは高速です。ただし、US マルチリージョンと us-east4 の Cloud SQL インスタンスの間で同じクエリを実行すると、パフォーマンスが低下する可能性があります。

クエリ処理ロケーションはマルチリージョンロケーション（US または EU）です。

Spanner

Spanner では、リージョン構成とマルチリージョン構成の両方がサポートされています。BigQuery の単一リージョン / マルチリージョンでは、サポートされている任意の Spanner リージョン内の Spanner インスタンスに対してクエリを実行できます。詳細については、クロスリージョンクエリをご覧ください。

データ型マッピング

連携クエリを実行すると、外部データソースのデータは GoogleSQL のデータ型に変換されます。詳細については、Cloud SQL 連携クエリをご覧ください。

割り当てと上限

クロスリージョン連携クエリ。BigQuery のクエリ処理ロケーションと外部データソースのロケーションが異なる場合、クロスリージョンのクエリになります。プロジェクトごとに 1 日あたり 1 TB までクロスリージョンのクエリを実行できます。クロスリージョンのクエリの例を次に示します。
- Cloud SQL インスタンスは us-west1 にありますが、BigQuery 接続は US マルチリージョンを基点にしています。BigQuery のクエリ処理ロケーションは US です。
割り当て。ユーザーは、Cloud SQL や AlloyDB などの外部データソースでクエリ割り当てを制御する必要があります。連携クエリに追加の割り当て設定はありません。ワークロードの分離を実現するには、データベースのリードレプリカに対してのみクエリを実行することをおすすめします。
課金される最大バイト数。このフィールドは、連携クエリではサポートされていません。実際に連携クエリを実行する前に課金対象のバイト数を計算することはできません。
接続数。連携クエリは、最大 10 の一意の接続を使用できます。
Cloud SQL の MySQL と PostgreSQL。割り当てと上限が適用されます。

制限事項

Spanner 連携クエリには、次の制限があります。

パフォーマンス。連携クエリは、BigQuery ストレージのみをクエリするほど高速ではない可能性があります。BigQuery の場合、外部クエリを実行し、外部データソースから BigQuery にデータを一時的に移動するまで、ソースデータベースが待機状態になります。また、ソースデータベースが複雑な分析クエリ用に最適化されていない可能性があります。

また、クエリのパフォーマンスは、データセットと外部データソースの近接度に応じて異なります。詳細については、サポートされているリージョンをご覧ください。
連携クエリは読み取り専用です。ソースデータベースで実行される外部クエリは読み取り専用である必要があります。したがって、DML ステートメントと DDL ステートメントはサポートされていません。
サポートされていないデータ型。BigQuery でサポートされていないデータ型が外部クエリに含まれている場合、クエリはすぐに失敗します。サポートされていないデータ型は、サポートされている別のデータ型にキャストできます。
顧客管理の暗号鍵（CMEK）。CMEK は、BigQuery 用と外部データソース用で別々に構成されます。BigQuery ではなく CMEK を使用するようにソースデータベースを構成すると、連携クエリの結果を含む一時テーブルは Google-owned and Google-managed encryption keyで暗号化されます。

料金

オンデマンド料金モデルを使用している場合は、BigQuery から連携クエリを実行すると、外部クエリから返されたバイト数に基づいて課金されます。詳しくは、オンデマンド分析の料金をご覧ください。
BigQuery エディションを使用している場合は、使用するスロット数に基づいて課金されます。詳細については、容量コンピューティングの料金をご覧ください。

SQL プッシュダウン

連携クエリには、SQL プッシュダウンと呼ばれる最適化手法が適用されます。フィルタリングなどのオペレーションを BigQuery で実行する代わりに、外部データソースに委任することで、クエリのパフォーマンスが向上します。外部データソースから転送されるデータの量を減らすと、クエリの実行時間を短縮し、費用を削減できます。SQL プッシュダウンには、列のプルーニング（SELECT 句）とフィルタプッシュダウン（WHERE 句）の両方が含まれます。

EXTERNAL_QUERY 関数を使用した場合、元のクエリを書き換えることで SQL プッシュダウンが機能します。次の例では、EXTERNAL_QUERY 関数を使用して Cloud SQL データベースと通信します。

SELECT COUNT(*)
FROM (
  SELECT * FROM EXTERNAL_QUERY("CONNECTION_ID", "select * from operations_table")
  )
WHERE a = 'Y' AND b NOT IN ('COMPLETE','CANCELLED');

CONNECTION_ID は、BigQuery 接続の ID に置き換えます。

SQL プッシュダウンを使用しない場合は、次のクエリが Cloud SQL に送信されます。

SELECT *
FROM operations_table

このクエリを実行すると、一部の行と列だけが必要な場合でもテーブル全体が BigQuery に返されます。

SQL プッシュダウンを使用する場合は、次のクエリが Cloud SQL に送信されます。

SELECT `a`, `b`
FROM (
  SELECT * FROM operations_table) t
WHERE ((`a` = 'Y') AND (NOT `b` IN ('COMPLETE', 'CANCELLED')))

このクエリを実行すると、2 つの列のみと、フィルタリングの述語に一致する行が BigQuery に返されます。

SQL プッシュダウンは、Spanner 外部データセットを使用して連携クエリを実行する場合にも適用されます。

適用されたプッシュダウン（存在する場合）は、クエリプランで確認できます。

制限事項

SQL プッシュダウンには、外部データソースとデータのクエリ方法に応じてさまざまな制限があります。

`EXTERNAL_QUERY` を使用する場合のクエリ連携の制限事項

SQL プッシュダウンは、SELECT * FROM T 形式の連携クエリにのみ適用されます。
列のプルーニングとフィルタプッシュダウンのみがサポートされています。特に、コンピューティング、結合、上限、順序付け、集計のプッシュダウンはサポートされていません。
フィルタプッシュダウンの場合、リテラルの型は BOOL、INT64、FLOAT64、STRING、DATE、DATETIME、TIMESTAMP のいずれかにする必要があります。構造体であるリテラルはサポートされていません。
SQL 関数のプッシュダウンは、BigQuery と宛先データベースの両方でサポートされている関数にのみ適用されます。
SQL プッシュダウンは、AlloyDB、Cloud SQL、Spanner でのみサポートされています。
SAP Datasphere では SQL プッシュダウンはサポートされていません。

Spanner 外部データセットを使用する場合のクエリ連携の制限事項

列のプルーニング、フィルタ、コンピューティング、部分集計のプッシュダウンがサポートされています。特に、結合、上限、集計による並べ替えはサポートされていません。
フィルタプッシュダウンの場合、リテラルの型は BOOL、INT64、FLOAT64、STRING、DATE、DATETIME、TIMESTAMP、BYTE、または配列のいずれかにする必要があります。構造体であるリテラルはサポートされていません。
SQL 関数のプッシュダウンは、BigQuery と Spanner の両方でサポートされている関数にのみ適用されます。

データソース別のサポートされている関数

データソース別のサポートされている SQL 関数は次のとおりです。SAP Datasphere では関数はサポートされていません。

Cloud SQL MySQL

論理演算子: AND、OR、NOT。
比較演算子: =、>、>=、<、<=、<>、IN、BETWEEN、IS NULL。
算術演算子: +、-、*（INT64 と FLOAT64 のみ）。

Cloud SQL PostgreSQL、AlloyDB

論理演算子: AND、OR、NOT。
比較演算子: =、>、>=、<、<=、<>、IN、BETWEEN、IS NULL。
算術演算子: +、-、*、/（INT64、FLOAT64、DATE のみ、DATE 減算を除く）。

Spanner - PostgreSQL 言語

論理演算子: AND、OR、NOT。
比較演算子: =、>、>=、<、<=、<>、IN、BETWEEN、IS NULL。
算術演算子: +、-、*、/（INT64、FLOAT64、NUMERIC のみ）。
外部データセットを使用する場合は、次のものもサポートされます。
- コンピューティング プッシュダウン
- 部分集計プッシュダウン
- 文字列関数
- 数学関数
- キャスト関数
- 配列関数
クエリの実行時に PostgreSQL のセマンティクスではなく GoogleSQL のセマンティクスが想定されます。次に例を示します。
- NULL 値は、デフォルトでは昇順で最初に並べ替えられます。PostgreSQL では、デフォルトで最後に並べ替えられます。
- Spanner から読み取られた PostgreSQL NUMERIC 値は、Spanner から BigQuery への型マッピングに従って処理されます。たとえば、数値列に 1.1234567891 値がある場合、次のクエリは 0 行を返します。
```
SELECT * FROM EXTERNAL_QUERY("CONNECTION_ID", "SELECT * from
operations_table where numeric_col = 1.123456789")
```
  ただし、次のステートメントは GoogleSQL のセマンティクスに基づいて 1 行を返します。
```
SELECT * from operations_table where numeric_col = 1.123456789
```
- JSON オブジェクトの正規化の動作は異なります。Spanner JSON ではキーは厳密に辞書順で並べ替えられますが、PostgreSQL PG JSONB では、まずキーの長さで並べ替えられ、次に同等のキーの長さで辞書順で並べ替えられます。

Spanner - GoogleSQL 言語

論理演算子: AND、OR、NOT。
比較演算子: =、>、>=、<、<=、<>、IN、BETWEEN、IS NULL。
算術演算子: +、-、*、/（INT64、FLOAT64、NUMERIC のみ）。
安全な算術演算子: SAFE_ADD、SAFE_SUBTRACT、SAFE_MULTIPLY、SAFE_DIVIDE（INT64、FLOAT64、NUMERIC のみ）。
外部データセットを使用する場合は、次のものもサポートされます。
- コンピューティング プッシュダウン
- 部分集計プッシュダウン
- 文字列関数
- 数学関数
- キャスト関数
- 配列関数

外部データソースの照合順序を操作する

外部データソースの列に照合順序が設定されている場合があります（大文字と小文字を区別しないなど）。連携クエリを実行すると、リモートデータベースは構成された照合順序を考慮します。

外部データソースに大文字と小文字を区別しない照合順序の flag 列がある次の例を考えてみましょう。

SELECT * FROM EXTERNAL_QUERY("CONNECTION_ID", "select * from operations_table where flag = 'Y'")

CONNECTION_ID は、BigQuery 接続の ID に置き換えます。

上記のクエリは、外部データソースで実行されるため、flag が y または Y の行を返します。

ただし、Cloud SQL、SAP Datasphere、AlloyDB のデータソースとのクエリ連携では、メインクエリにフィルタを追加すると、クエリはデフォルトの照合順序で BigQuery 側で実行されます。次のクエリをご覧ください。

SELECT * FROM
  (
    SELECT * FROM EXTERNAL_QUERY("CONNECTION_ID", "select * from operations_table")
  )
WHERE flag = 'Y'

BigQuery のデフォルトの照合順序（大文字と小文字を区別）のため、上記のクエリはフラグが Y の行のみを返し、フラグが y の行をフィルタで除外します。WHERE 句で大文字と小文字が区別されないようにするには、クエリで照合順序を指定します。

SELECT * FROM
  (
    SELECT * FROM EXTERNAL_QUERY("CONNECTION_ID", "select * from operations_table")
  )
WHERE COLLATE(flag, 'und:ci') = 'Y'

連携クエリの概要

サポートされているデータストア

ワークフロー

連携クエリに代わる方法: 外部のテーブルとデータセット

サポートされるリージョン

AlloyDB と Cloud SQL

Spanner

データ型マッピング

割り当てと上限

制限事項

料金

SQL プッシュダウン

制限事項

EXTERNAL_QUERY を使用する場合のクエリ連携の制限事項

Spanner 外部データセットを使用する場合のクエリ連携の制限事項

データソース別のサポートされている関数

Cloud SQL MySQL

Cloud SQL PostgreSQL、AlloyDB

Spanner - PostgreSQL 言語

Spanner - GoogleSQL 言語

外部データソースの照合順序を操作する

次のステップ

`EXTERNAL_QUERY` を使用する場合のクエリ連携の制限事項