AlloyDB 聯合查詢
資料分析師可以使用聯合查詢,從 BigQuery 查詢 PostgreSQL 適用的 AlloyDB 資料。
BigQuery AlloyDB 連結可讓 BigQuery 即時查詢 AlloyDB 中的資料,而且無須複製或移動資料。
事前準備
- 請確認您的 BigQuery 管理員已建立 AlloyDB 連線,並與您分享。
-
如要取得查詢 AlloyDB 執行個體所需的權限,請要求管理員為您授予專案的 BigQuery 連線使用者 (
roles/bigquery.connectionUser
) IAM 角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
查詢資料
如要從 GoogleSQL 查詢傳送聯合查詢至 AlloyDB,請使用 EXTERNAL_QUERY
函式。
假設您在 BigQuery 中儲存客戶資料表,同時在 AlloyDB 中儲存銷售資料表,並希望透過單一查詢彙整這兩個資料表。以下範例會對名為 orders
的 AlloyDB 資料表執行聯合查詢,並將結果與名為 mydataset.customers
的 BigQuery 資料表彙整。
查詢範例包括 3 個部分:
透過
EXTERNAL_QUERY
函式在 AlloyDB 資料庫中執行外部查詢SELECT customer_id, MIN(order_date) AS first_order_date FROM orders GROUP BY customer_id
,藉此取得每位客戶第一筆訂單的日期。依據
customer_id
彙整外部查詢結果資料表與 BigQuery 中的客戶資料表。在最終結果集中選取客戶資訊和第一筆訂單日期。
SELECT c.customer_id, c.name, rq.first_order_date
FROM mydataset.customers AS c
LEFT OUTER JOIN EXTERNAL_QUERY(
'us.connection_id',
'''SELECT customer_id, MIN(order_date) AS first_order_date
FROM orders
GROUP BY customer_id''') AS rq ON rq.customer_id = c.customer_id
GROUP BY c.customer_id, c.name, rq.first_order_date;
查看 AlloyDB 資料表結構定義
您可以使用 EXTERNAL_QUERY
函式查詢 information_schema
資料表,藉此存取資料庫中繼資料。舉例來說,您可以列出資料庫中的所有資料表,或查看資料表結構定義。詳情請參閱「PostgreSQL information_schema 資料表」。
-- List all tables in a database.
SELECT * FROM EXTERNAL_QUERY("region.connection_id",
"select * from information_schema.tables;");
-- List all columns in a table.
SELECT * FROM EXTERNAL_QUERY("region.connection_id",
"select * from information_schema.columns where table_name='x';");
追蹤 BigQuery 聯合查詢
對 AlloyDB 執行聯合查詢時,BigQuery 會在查詢中加上註解,類似於以下內容:
/* Federated query from BigQuery. Project ID: PROJECT_ID, BigQuery Job ID: JOB_ID. */
如果您要監控查詢使用情形的記錄,以下註解可協助您識別來自 BigQuery 的查詢。
前往「Logs Explorer」頁面。
在「Query」分頁中,輸入下列查詢:
resource.type="alloydb.googleapis.com/Instance" textPayload=~"Federated query from BigQuery"
點選「執行查詢」。
如果有可供 BigQuery 聯合查詢使用的記錄,查詢結果會顯示類似下列的記錄清單。
YYYY-MM-DD hh:mm:ss.millis UTC [3210064]: [4-1] db=DATABASE, user=USER_ACCOUNT STATEMENT: SELECT 1 FROM (SELECT FROM company_name_table) t; /* Federated query from BigQuery. Project ID: PROJECT_ID, BigQuery Job ID: JOB_ID */ YYYY-MM-DD hh:mm:ss.millis UTC [3210532]: [2-1] db=DATABASE, user=USER_ACCOUNT STATEMENT: SELECT "company_id", "company type_id" FROM (SELECT FROM company_name_table) t; /* Federated query from BigQuery. Project ID: PROJECT_ID, BigQuery Job ID: JOB_ID */
如要進一步瞭解 Cloud Logging,請參閱 Cloud Logging。
疑難排解
本節說明傳送聯合查詢至 AlloyDB 時可能會遇到的潛在錯誤,並提供可能的疑難排解解決方案。
問題:無法連線至資料庫伺服器,並顯示以下錯誤訊息:
Invalid table-valued function EXTERNAL_QUERY Connect to PostgreSQL server failed: server closed the connection unexpectedly. This probably means the server terminated abnormally before or while processing the request.
解決方法:請確認您在建立 AlloyDB 連線時,使用了有效的憑證並遵循所有先決條件。請檢查在建立與 AlloyDB 的連線時自動建立的服務帳戶,是否具有 AlloyDB 用戶端 (roles/alloydb.client
) 角色。詳情請參閱「授予服務帳戶存取權」。
後續步驟
- 瞭解聯合查詢。
- 瞭解 PostgreSQL 到 BigQuery 的資料類型對應關係。
- 瞭解不支援的資料類型。