本頁面由 Cloud Translation API 翻譯而成。

管理分區和叢集建議

本文說明分割區和叢集建議工具的運作方式、如何查看建議和洞察資料，以及如何套用分割區和叢集建議。

現有資料表類型	建議子類型	建議範例
未分區、未叢集	分區	「將 column_C 依 DAY 分區，每月約可省下 64 個運算單元小時」
未分區、未叢集	叢集	「根據 column_C 分群，每月可省下約 64 個運算單元時數」
已分區，未叢集	叢集	「根據 column_C 分群，每月可省下約 64 個運算單元時數」

限制

分區和叢集建議工具不支援使用舊版 SQL 的 BigQuery 資料表。產生建議時，推薦工具會在分析中排除任何舊版 SQL 查詢。此外，如果對使用舊版 SQL 的 BigQuery 資料表套用分區建議，該資料表中的所有舊版 SQL 工作流程都會中斷。

套用分割區建議前，請先將舊版 SQL 工作流程遷移至 GoogleSQL。
BigQuery 不支援就地變更資料表的分區架構。您只能在資料表副本上變更資料表的分區。詳情請參閱「套用分區建議」。

位置

分割與分群建議工具適用於下列處理位置：

	地區說明	區域名稱	詳細資料
亞太地區
	德里	`asia-south2`
	香港	`asia-east2`
	雅加達	`asia-southeast2`
	孟買	`asia-south1`
	大阪	`asia-northeast2`
	首爾	`asia-northeast3`
	新加坡	`asia-southeast1`
	雪梨	`australia-southeast1`
	台灣	`asia-east1`
	東京	`asia-northeast1`
歐洲
	比利時	`europe-west1`	二氧化碳排放量低₂
	柏林	`europe-west10`
	歐盟多區域	`eu`
	法蘭克福	`europe-west3`
	倫敦	`europe-west2`	二氧化碳排放量低₂
	荷蘭	`europe-west4`	二氧化碳排放量低₂
	蘇黎世	`europe-west6`	二氧化碳排放量低₂
美洲
	愛荷華州	`us-central1`	二氧化碳排放量低₂
	拉斯維加斯	`us-west4`
	洛杉磯	`us-west2`
	蒙特婁	`northamerica-northeast1`	二氧化碳排放量低₂
	北維吉尼亞州	`us-east4`
	奧勒岡州	`us-west1`	二氧化碳排放量低₂
	鹽湖城	`us-west3`
	聖保羅	`southamerica-east1`	二氧化碳排放量低₂
	多倫多	`northamerica-northeast2`	二氧化碳排放量低
	美國多區域	`us`

事前準備

所需權限

如要取得存取分區和叢集建議所需的權限，請要求管理員授予您 BigQuery 分區分群建議工具檢視者 (roles/recommender.bigqueryPartitionClusterViewer) 身分與存取權管理角色。如要進一步瞭解如何授予角色，請參閱「管理專案、資料夾和機構的存取權」。

這個預先定義的角色具備存取分割區和叢集建議所需的權限。如要查看確切的必要權限，請展開「必要權限」部分：

所需權限

如要存取分割區和叢集建議，您必須具備下列權限：

recommender.bigqueryPartitionClusterRecommendations.get
recommender.bigqueryPartitionClusterRecommendations.list

您或許還可透過自訂角色或其他預先定義的角色取得這些權限。

如要進一步瞭解 BigQuery 中的 IAM 角色和權限，請參閱「IAM 簡介」。

查看建議

本節說明如何使用 Google Cloud 控制台、Google Cloud CLI 或 Recommender API，查看分割區和叢集建議與深入分析。

選取下列選項之一：

主控台

前往 Google Cloud 控制台的「BigQuery」頁面。

前往「BigQuery」
在導覽選單中，按一下「最佳化建議」。

「最佳化建議」分頁會列出專案可用的所有最佳化建議。
在「盡可能提高 BigQuery 工作負載成本效益」面板中，按一下「查看全部」。

費用建議表格會列出為目前專案產生的所有建議。舉例來說，下列螢幕截圖顯示建議引擎分析 example_table 資料表後，建議叢集 example_column 欄，以節省大約位元組和時段的數量。
如要進一步瞭解表格洞察資料和建議，請按一下建議。

gcloud

如要查看特定專案的分區或叢集建議，請使用 gcloud recommender recommendations list 指令：

gcloud recommender recommendations list \
    --project=PROJECT_NAME \
    --location=REGION_NAME \
    --recommender=google.bigquery.table.PartitionClusterRecommender \
    --format=FORMAT_TYPE \

更改下列內容：

PROJECT_NAME：包含 BigQuery 資料表的專案名稱
REGION_NAME：專案所在的區域
FORMAT_TYPE：支援的 gcloud CLI 輸出格式，例如 JSON

下表說明推薦工具 API 回應中的重要欄位：

屬性	適用於子類型	說明
`recommenderSubtype`	分區或叢集	指出建議類型。
`content.overview.partitionColumn`	分區	建議的分區資料欄名稱。
`content.overview.partitionTimeUnit`	分區	建議的分區時間單位。舉例來說，`DAY` 表示建議在建議的資料欄中建立每日分區。
`content.overview.clusterColumns`	叢集	建議的叢集資料欄名稱。

如要進一步瞭解推薦項目回應中的其他欄位，請參閱「REST 資源：projects.locations.recommendersrecommendation」。
如要進一步瞭解如何使用 Recommender API，請參閱「使用 API - 建議內容」。

如要使用 gcloud CLI 查看資料表洞察，請使用 gcloud recommender insights list 指令：

gcloud recommender insights list \
    --project=PROJECT_NAME \
    --location=REGION_NAME \
    --insight-type=google.bigquery.table.StatsInsight \
    --format=FORMAT_TYPE \

更改下列內容：

PROJECT_NAME：包含 BigQuery 資料表的專案名稱
REGION_NAME：專案所在的區域
FORMAT_TYPE：支援的 gcloud CLI 輸出格式，例如 JSON

下表說明洞察 API 回應中的重要欄位：

屬性	適用於子類型	說明
`content.existingPartitionColumn`	叢集	現有的分區資料欄 (如有)
`content.tableSizeTb`	全部	資料表大小 (以 TB 為單位)
`content.bytesReadMonthly`	全部	每月從資料表讀取的位元組數
`content.slotMsConsumedMonthly`	全部	在資料表上執行的工作負載每月耗用的運算單元時間 (毫秒)
`content.queryJobsCountMonthly`	全部	每月在資料表上執行的工作數

如要進一步瞭解洞察回應中的其他欄位，請參閱 REST 資源：projects.locations.insightTypes.insights。
如要進一步瞭解如何使用洞察資料，請參閱「使用 API - 洞察資料」。

REST API

如要查看特定專案的分區或叢集建議，請使用 REST API。您必須為每個指令提供驗證權杖，這類權杖可使用 gcloud CLI 取得。如要進一步瞭解如何取得驗證權杖，請參閱「取得 ID 權杖的方法」。

您可以透過 curl list 要求，查看特定專案的所有最佳化建議：

curl
    -H "Authorization: Bearer $GCLOUD_AUTH_TOKEN"
    -H "x-goog-user-project: PROJECT_NAME" https://recommender.googleapis.com/v1/projects/my-project/locations/us/recommenders/google.bigquery.table.PartitionClusterRecommender/recommendations

更改下列內容：

GCLOUD_AUTH_TOKEN：有效的 gcloud CLI 存取權杖名稱
PROJECT_NAME：包含 BigQuery 資料表的專案名稱

下表說明推薦工具 API 回應中的重要欄位：

屬性	適用於子類型	說明
`recommenderSubtype`	分區或叢集	指出建議類型。
`content.overview.partitionColumn`	分區	建議的分區資料欄名稱。
`content.overview.partitionTimeUnit`	分區	建議的分區時間單位。舉例來說，`DAY` 表示建議在建議的資料欄中建立每日分區。
`content.overview.clusterColumns`	叢集	建議的叢集資料欄名稱。

如要進一步瞭解推薦項目回應中的其他欄位，請參閱「REST 資源：projects.locations.recommendersrecommendation」。
如要進一步瞭解如何使用 Recommender API，請參閱「使用 API - 建議內容」。

如要使用 REST API 查看資料表洞察，請執行下列指令：

curl
-H "Authorization: Bearer $GCLOUD_AUTH_TOKEN"
-H "x-goog-user-project: PROJECT_NAME" https://recommender.googleapis.com/v1/projects/my-project/locations/us/insightTypes/google.bigquery.table.StatsInsight/insights

更改下列內容：

GCLOUD_AUTH_TOKEN：有效的 gcloud CLI 存取權杖名稱
PROJECT_NAME：包含 BigQuery 資料表的專案名稱

下表說明洞察 API 回應中的重要欄位：

屬性	適用於子類型	說明
`content.existingPartitionColumn`	叢集	現有的分區資料欄 (如有)
`content.tableSizeTb`	全部	資料表大小 (以 TB 為單位)
`content.bytesReadMonthly`	全部	每月從資料表讀取的位元組數
`content.slotMsConsumedMonthly`	全部	在資料表上執行的工作負載每月耗用的運算單元時間 (毫秒)
`content.queryJobsCountMonthly`	全部	每月在資料表上執行的工作數

如要進一步瞭解洞察回應中的其他欄位，請參閱 REST 資源：projects.locations.insightTypes.insights。
如要進一步瞭解如何使用洞察資料，請參閱「使用 API - 洞察資料」。

查看 `INFORMATION_SCHEMA` 建議

您也可以使用INFORMATION_SCHEMA檢視畫面查看建議和洞察資料。舉例來說，您可以透過 INFORMATION_SCHEMA.RECOMMENDATIONS 檢視畫面，根據節省的空位數查看前三項最佳化建議，如下列範例所示：

SELECT
   recommender,
   target_resources,
   LAX_INT64(additional_details.overview.bytesSavedMonthly) / POW(1024, 3) as est_gb_saved_monthly,
   LAX_INT64(additional_details.overview.slotMsSavedMonthly) / (1000 * 3600) as slot_hours_saved_monthly,
  last_updated_time
FROM
  `region-us`.INFORMATION_SCHEMA.RECOMMENDATIONS
WHERE
   primary_impact.category = 'COST'
AND
   state = 'ACTIVE'
ORDER by
   slot_hours_saved_monthly DESC
LIMIT 3;

結果會類似如下：

+---------------------------------------------------+--------------------------------------------------------------------------------------------------+
|                    recommender                    |   target_resources      | est_gb_saved_monthly | slot_hours_saved_monthly |  last_updated_time
+---------------------------------------------------+--------------------------------------------------------------------------------------------------+
| google.bigquery.materializedview.Recommender      | ["project_resource"]    | 140805.38289248943   |        9613.139166666666 |  2024-07-01 13:00:00
| google.bigquery.table.PartitionClusterRecommender | ["table_resource_1"]    | 4393.7416711859405   |        56.61476777777777 |  2024-07-01 13:00:00
| google.bigquery.table.PartitionClusterRecommender | ["table_resource_2"]    |   3934.07264107652   |       10.499466666666667 |  2024-07-01 13:00:00
+---------------------------------------------------+--------------------------------------------------------------------------------------------------+

詳情請參閱下列資源：

套用叢集建議

如要套用叢集建議，請執行下列任一操作：

直接將叢集套用至原始表格
將叢集套用至複製的資料表
在具體化檢視表中套用叢集

直接將叢集套用至原始資料表

您可以直接將叢集最佳化建議套用至現有的 BigQuery 資料表。這個方法比將建議套用至複製的資料表更快，但不會保留備份資料表。

請按照下列步驟，將新的叢集規格套用至未分區或分區資料表。

在 bq 工具中，更新資料表的叢集規格，使其符合新的叢集：
```
 bq update --clustering_fields=CLUSTER_COLUMN DATASET.ORIGINAL_TABLE 
```
更改下列內容：
- CLUSTER_COLUMN：您要叢集化的資料欄，例如 mycolumn
- DATASET：包含資料表的資料集名稱，例如 mydataset
- ORIGINAL_TABLE：原始資料表的名稱，例如 mytable
您也可以呼叫 tables.update 或 tables.patch API 方法，修改叢集規格。
如要根據新的叢集規格將所有資料列叢集化，請執行下列 UPDATE 陳述式：
```
UPDATE DATASET.ORIGINAL_TABLE SET CLUSTER_COLUMN=CLUSTER_COLUMN WHERE true
```
注意： 如果將新的叢集規格套用至長期儲存空間中的資料表，該資料表就會恢復為有效儲存空間價格。詳情請參閱儲存空間價格。

將叢集套用至複製的資料表

將叢集建議套用至 BigQuery 資料表時，您可以先複製原始資料表，然後將建議套用至複製的資料表。這個方法可確保您在需要還原叢集設定變更時，原始資料不會遺失。

您可以使用這個方法，將叢集建議套用至未分區和已分區的資料表。

前往 Google Cloud 控制台的「BigQuery」頁面。

前往「BigQuery」
在查詢編輯器中，使用 LIKE 運算子建立空白資料表，並採用與原始資料表相同的中繼資料 (包括叢集規格)：
```
CREATE TABLE DATASET.COPIED_TABLE
LIKE DATASET.ORIGINAL_TABLE
```
更改下列內容：
- DATASET：包含資料表的資料集名稱，例如 mydataset
- COPIED_TABLE：複製資料表的名稱，例如 copy_mytable
- ORIGINAL_TABLE：原始資料表的名稱，例如 mytable
在 Google Cloud 控制台中開啟 Cloud Shell 編輯器。

啟用 Cloud Shell
在 Cloud Shell 編輯器中，使用 bq update 指令更新所複製資料表的叢集規格，以符合建議的叢集：
```
 bq update --clustering_fields=CLUSTER_COLUMN DATASET.COPIED_TABLE 
```
將 CLUSTER_COLUMN 替換為要用於叢集化的資料欄，例如 mycolumn。

您也可以呼叫 tables.update 或 tables.patch API 方法，修改叢集規格。

在查詢編輯器中，擷取原始資料表的資料表結構定義，以及分區和分群設定 (如有)。如要擷取結構定義，請查看原始資料表的 INFORMATION_SCHEMA.TABLES 檢視畫面：

SELECT
  ddl
FROM
  DATASET.INFORMATION_SCHEMA.TABLES
WHERE
  table_name = 'DATASET.ORIGINAL_TABLE;'

輸出內容是 ORIGINAL_TABLE 的完整資料定義語言 (DDL) 陳述式，包括 PARTITION BY 子句。如要進一步瞭解 DDL 輸出內容中的引數，請參閱 CREATE TABLE 陳述式。

DDL 輸出內容會指出原始資料表中的分區類型：

分區類型	輸出範例
未分割	缺少 `PARTITION BY` 子句。
依資料表欄分區	`PARTITION BY c0`
	`PARTITION BY DATE(c0)`
	`PARTITION BY DATETIME_TRUNC(c0, MONTH)`
依擷取時間分區	`PARTITION BY _PARTITIONDATE`
依擷取時間分區	`PARTITION BY DATETIME_TRUNC(_PARTITIONTIME, MONTH)`

將資料擷取至複製的資料表。使用的程序取決於分區類型。
- 如果原始資料表未分區，或依資料表欄分區，請將原始資料表的資料擷取到複製的資料表：
```
INSERT INTO DATASET.COPIED_TABLE
SELECT * FROM DATASET.ORIGINAL_TABLE
```
- 如果原始資料表是依擷取時間分區，請按照下列步驟操作：
  1. 使用 INFORMATION_SCHEMA.COLUMNS 檢視畫面擷取資料欄清單，以形成資料擷取運算式：
```
SELECT
ARRAY_TO_STRING((
SELECT
  ARRAY(
  SELECT
    column_name
  FROM
    DATASET.INFORMATION_SCHEMA.COLUMNS
  WHERE
    table_name = 'ORIGINAL_TABLE')), ", ")
```
    輸出內容是以半形逗號分隔的資料欄名稱清單。
  2. 將原始資料表的資料匯入複製的資料表：
```
INSERT DATASET.COPIED_TABLE (COLUMN_NAMES, _PARTITIONTIME)
SELECT *, _PARTITIONTIME FROM DATASET.ORIGINAL_TABLE
```
    將 COLUMN_NAMES 替換為上一個步驟的輸出內容 (以逗號分隔的資料欄清單)，例如 col1, col2, col3。
您現在已取得叢集複製資料表，內含與原始資料表相同的資料。在後續步驟中，您會以新叢集資料表取代原始資料表。
將原始資料表重新命名為備份資料表：
```
ALTER TABLE DATASET.ORIGINAL_TABLE
RENAME TO DATASET.BACKUP_TABLE
```
將 BACKUP_TABLE 替換為備份資料表的名稱，例如 backup_mytable。
將複製的資料表重新命名為原始資料表：
```
ALTER TABLE DATASET.COPIED_TABLE
RENAME TO DATASET.ORIGINAL_TABLE
```
原始資料表現在會根據叢集建議進行叢集處理。

建議您檢查叢集資料表，確保所有資料表函式都能正常運作。許多資料表函式可能與資料表 ID 相關聯，而非資料表名稱，因此建議先查看下列資料表函式，再繼續操作：

存取權和權限，例如 IAM 權限、資料列層級存取權或資料欄層級存取權。
資料表構件，例如資料表本機副本、資料表快照或搜尋索引。
任何進行中的資料表程序狀態，例如任何具體化檢視區塊，或您複製資料表時執行的任何工作。
可使用時空旅行功能存取歷來資料表資料。
與原始資料表相關聯的任何中繼資料，例如 table_option_list 或 column_option_list。詳情請參閱「資料定義語言陳述式」。

如有任何問題，您必須手動將受影響的構件遷移至新表格。

查看叢集資料表後，您可以選擇使用下列指令刪除備份資料表：

    DROP TABLE DATASET.BACKUP_TABLE

在具體化檢視表中套用叢集

您可以建立資料表的具體化檢視表，儲存套用建議後的原始資料表資料。使用具體化檢視套用最佳化建議，可確保叢集資料透過自動重新整理保持最新狀態。查詢、維護及儲存具體化檢視區塊時，請留意價格注意事項。如要瞭解如何建立叢集具體化檢視表，請參閱「叢集具體化檢視表」。

套用分區建議

如要套用分割建議，請務必將建議套用至原始表格的副本。BigQuery 不支援就地變更資料表的分區架構，例如將未分區的資料表變更為分區資料表、變更資料表的分區架構，或是建立與基礎資料表分區架構不同的具體化檢視區塊。您只能在資料表副本上變更資料表的分區。

將分區建議套用至複製的資料表

將分區建議套用至 BigQuery 資料表時，您必須先複製原始資料表，然後將建議套用至複製的資料表。這樣一來，如果需要還原分割區，原始資料就能保留下來。

下列程序會使用範例建議，依分區時間單位 DAY 將資料表分區。

使用分區建議建立複製的資料表：
```
CREATE TABLE DATASET.COPIED_TABLE
PARTITION BY DATE_TRUNC(PARTITION_COLUMN, DAY)
AS SELECT * FROM DATASET.ORIGINAL_TABLE
```
更改下列內容：
- DATASET：包含資料表的資料集名稱，例如 mydataset
- COPIED_TABLE：複製資料表的名稱，例如 copy_mytable
- PARTITION_COLUMN：您要分區的資料欄，例如 mycolumn
如要進一步瞭解如何建立分區資料表，請參閱建立分區資料表。
將原始資料表重新命名為備份資料表：
```
ALTER TABLE DATASET.ORIGINAL_TABLE
RENAME TO DATASET.BACKUP_TABLE
```
將 BACKUP_TABLE 替換為備份資料表的名稱，例如 backup_mytable。
將複製的資料表重新命名為原始資料表：
```
ALTER TABLE DATASET.COPIED_TABLE
RENAME TO DATASET.ORIGINAL_TABLE
```
原始資料表現在會根據分區建議分區。

建議您檢查分區資料表，確保所有資料表函式都能正常運作。許多資料表函式可能與資料表 ID 相關聯，而非資料表名稱，因此建議先查看下列資料表函式，再繼續操作：

存取權和權限，例如 IAM 權限、資料列層級存取權或資料欄層級存取權。
資料表構件，例如資料表本機副本、資料表快照或搜尋索引。
任何進行中的資料表程序狀態，例如任何具體化檢視區塊，或您複製資料表時執行的任何工作。
可使用時空旅行功能存取歷來資料表資料。
與原始資料表相關聯的任何中繼資料，例如 table_option_list 或 column_option_list。詳情請參閱「資料定義語言陳述式」。
可使用舊版 SQL 將查詢結果寫入分區資料表。分區資料表不完全支援使用舊版 SQL。其中一個解決方法是將舊版 SQL 工作流程遷移至 GoogleSQL，再套用分割區建議。

如有任何問題，您必須手動將受影響的構件遷移至新表格。

查看分區資料表後，您可以選擇使用下列指令刪除備份資料表：

    DROP TABLE DATASET.BACKUP_TABLE

定價

將建議套用至表格時，可能會產生下列費用：

處理成本。套用建議時，您會對 BigQuery 專案執行資料定義語言 (DDL) 或資料操縱語言 (DML) 查詢。
儲存空間費用。如果您使用複製資料表的方法，複製 (或備份) 的資料表會佔用額外儲存空間。

系統會根據與專案相關聯的帳單帳戶，收取標準處理和儲存費用。詳情請參閱 BigQuery 計價方式一文。

疑難排解

問題：特定表格未顯示任何建議。

如果資料表符合下列條件，系統可能不會顯示分區建議：

資料表小於 100 GB。
資料表已分區或叢集。

如果資料表符合下列條件，系統可能不會顯示叢集建議：

表格小於 10 GB。
資料表已叢集化。

在下列情況下，系統可能會抑制分區和分群建議：

資料表因資料操縱語言 (DML) 作業而產生高昂的寫入費用。
過去 30 天內未讀取資料表。
預估每月可節省的費用太少 (節省的運算單元時數不到 1 小時)。

管理分區和叢集建議

推薦工具的運作方式

限制

位置

事前準備

所需權限

所需權限

查看建議

主控台

gcloud

REST API

查看 INFORMATION_SCHEMA 建議

套用叢集建議

直接將叢集套用至原始資料表

將叢集套用至複製的資料表

在具體化檢視表中套用叢集

套用分區建議

將分區建議套用至複製的資料表

定價

疑難排解

查看 `INFORMATION_SCHEMA` 建議