JOBS_TIMELINE_BY_FOLDER 檢視表
INFORMATION_SCHEMA.JOBS_TIMELINE_BY_FOLDER
檢視畫面會根據時間片段,顯示目前專案上層資料夾中提交的所有工作 (包括子資料夾中的所有工作) 的近乎即時 BigQuery 中繼資料。這個檢視畫面包含執行中和已完成的工作。
所需權限
如要查詢 INFORMATION_SCHEMA.JOBS_TIMELINE_BY_FOLDER
檢視畫面,您必須具備父資料夾的 bigquery.jobs.listAll
身分與存取權管理 (IAM) 權限。以下每個預先定義的 IAM 角色都包含必要權限:
- 資料夾管理員
- BigQuery 管理員
如要進一步瞭解 BigQuery 權限,請參閱「使用身分與存取權管理功能控管存取權」。
結構定義
查詢 INFORMATION_SCHEMA.JOBS_TIMELINE_BY_*
檢視表時,每個 BigQuery 工作執行的每秒,在查詢結果中都會有一個資料列。每個期間都會以整秒間隔開始,並持續一秒鐘。
INFORMATION_SCHEMA.JOBS_TIMELINE_BY_*
檢視表具有下列結構定義:
資料欄名稱 | 資料類型 | 值 |
---|---|---|
period_start |
TIMESTAMP |
這個期間的開始時間。 |
period_slot_ms |
INTEGER |
這段期間消耗的運算單元時間 (毫秒)。 |
project_id |
STRING |
(叢集欄) 專案 ID。 |
project_number |
INTEGER |
專案編號。 |
folder_numbers |
REPEATED INTEGER |
包含專案的資料夾 ID,從直接包含專案的資料夾開始,接著是包含子資料夾的資料夾,以此類推。舉例來說,如果 `folder_numbers` 是 `[1, 2, 3]`,則資料夾 `1` 會立即包含專案,資料夾 `2` 包含 `1`,而資料夾 `3` 則包含 `2`。 |
user_email |
STRING |
(叢集資料欄) 執行工作的使用者電子郵件地址或服務帳戶。 |
job_id |
STRING |
工作 ID。例如 bquxjob_1234 。 |
job_type |
STRING |
工作類型。可以是 QUERY 、LOAD 、EXTRACT 、COPY 或 null 。工作類型 null 表示內部工作,例如指令碼工作陳述式評估或物化檢視畫面重新整理。 |
statement_type |
STRING |
查詢陳述式的類型 (如果有效)。例如 SELECT 、INSERT 、UPDATE 或 DELETE 。 |
priority |
STRING |
這項工作的優先順序。有效值包括 INTERACTIVE 和 BATCH 。 |
parent_job_id |
STRING |
父項工作 ID (如果有的話)。 |
job_creation_time |
TIMESTAMP |
(分區欄) 這項工作的建立時間。分區作業會以這個時間戳記的世界標準時間為準。 |
job_start_time |
TIMESTAMP |
這項工作的開始時間。 |
job_end_time |
TIMESTAMP |
這項工作的結束時間。 |
state |
STRING |
工作在這個期間結束時的執行狀態。有效的狀態包括 PENDING 、RUNNING 和 DONE 。 |
reservation_id |
STRING |
在這個期間結束時,指派給這項工作的主要預留項目名稱 (如適用)。 |
edition |
STRING |
與指派給此工作的預留項目相關聯的版本。如要進一步瞭解版本,請參閱「BigQuery 版本簡介」。 |
total_bytes_billed |
INTEGER |
如果專案已設定為使用依用量計價,則這個欄位會包含工作所產生的總位元組數。如果專案已設為使用固定費率定價,則系統不會針對位元組收費,這個欄位僅供參考。 |
total_bytes_processed |
INTEGER |
工作處理的位元組總數。 |
error_result |
RECORD |
錯誤詳細資料 (如有) 為
ErrorProto.
|
cache_hit |
BOOLEAN |
這個工作查詢結果是否來自快取。 |
period_shuffle_ram_usage_ratio |
FLOAT |
所選時間範圍內的重組用量比率。 |
period_estimated_runnable_units |
INTEGER |
可在這個期間立即排定的作業單元。只要預訂中沒有其他查詢需要額外運算單元,這些工作單元的額外運算單元就能加快查詢速度。 |
transaction_id |
STRING |
這個工作執行的交易 ID (如有)。(預覽) |
資料保留
這個檢視畫面包含目前執行中的工作,以及過去 180 天的作業歷史記錄。
範圍和語法
對這個檢視表執行的查詢必須包含區域限定詞。如果您未指定區域限定條件,系統會從所有區域擷取中繼資料。下表說明此檢視區域範圍:
檢視表名稱 | 資源範圍 | 區域範圍 |
---|---|---|
[PROJECT_ID.]`region-REGION`.INFORMATION_SCHEMA.JOBS_TIMELINE_BY_FOLDER |
專案層級 | REGION |
-
選用:
PROJECT_ID
: Google Cloud 專案的 ID。如果未指定,系統會使用預設專案。 -
REGION
:任一資料集區域名稱。例如:`region-us`
。
範例
以下範例說明如何查詢 INFORMATION_SCHEMA.JOBS_TIMELINE_BY_FOLDER
檢視畫面。
取得不重複工作數量
以下查詢會顯示指定專案資料夾中,每分鐘執行的專屬工作數量:
SELECT TIMESTAMP_TRUNC(period_start, MINUTE) AS per_start, COUNT(DISTINCT job_id) AS unique_jobs FROM `region-us`.INFORMATION_SCHEMA.JOBS_TIMELINE_BY_FOLDER, UNNEST(folder_numbers) f WHERE my_folder_number = f GROUP BY per_start ORDER BY per_start DESC;
結果大致如下:
+---------------------------+---------------------------------+ | per_start | unique_jobs | +---------------------------+---------------------------------+ | 2019-10-10 00:04:00 UTC | 5 | | 2019-10-10 00:03:00 UTC | 2 | | 2019-10-10 00:02:00 UTC | 3 | | 2019-10-10 00:01:00 UTC | 4 | | 2019-10-10 00:00:00 UTC | 4 | +---------------------------+---------------------------------+
計算使用的運算單元時間
以下查詢會顯示指定專案資料夾中每分鐘使用的時段時間:
SELECT TIMESTAMP_TRUNC(period_start, MINUTE) AS per_start, SUM(period_slot_ms) AS slot_ms FROM `region-us`.INFORMATION_SCHEMA.JOBS_TIMELINE_BY_FOLDER, UNNEST(folder_numbers) f WHERE my_folder_number = f AND reservation_id = "my reservation id" AND statement_type != "SCRIPT" GROUP BY per_start ORDER BY per_start DESC;
結果大致如下:
+---------------------------+---------------------------------+ | per_start | slot_ms | +---------------------------+---------------------------------+ | 2019-10-10 00:04:00 UTC | 500 | | 2019-10-10 00:03:00 UTC | 1000 | | 2019-10-10 00:02:00 UTC | 3000 | | 2019-10-10 00:01:00 UTC | 4000 | | 2019-10-10 00:00:00 UTC | 4000 | +---------------------------+---------------------------------+