連結至 Google BigQuery

BigQuery 是 Google 的全代管 PB 規模低成本數據分析資料倉儲。Looker Studio 的 BigQuery 連接器可讓您在 Looker Studio 中存取 BigQuery 表格的資料。

事前準備

如要在 Looker Studio 中存取 BigQuery 資料,您必須提供 Google Cloud Billing 帳戶。BigQuery 是付費產品,透過 Looker Studio 存取 BigQuery 時,可能會產生 BigQuery 使用費。進一步瞭解 BigQuery 定價

如何連線至 BigQuery

您可以將 Looker Studio 連結至 Google BigQuery 中的資料表、View 或自訂查詢。

連線步驟

  1. 登入 Looker Studio

  2. 按一下 「建立」,然後選取「報表」

  3. 報表編輯器隨即顯示,並開啟「將資料新增至報表」面板。

  4. 如要建立新的嵌入式資料來源,請選取 BigQuery 連接器

    1. 如要選取現有的可重複使用的資料來源,請按一下「我的資料來源」分頁,然後選取您先前建立或與您共用的任何類型資料來源。
  5. 設定資料來源連線至 BigQuery 資料。你可以連結至 BigQuery 資料表或檢視畫面,也可以使用自訂 SQL 查詢建立連結。

  6. 按一下「新增」。

稍後,報表畫布上會顯示已連結至資料來源的資料表。

說明嵌入式和可重複使用資料來源

資料來源可以是嵌入可重複使用。報表可同時包含嵌入和可重複使用的資料來源。

編輯報表時建立的資料來源會嵌入報表。如要編輯嵌入的資料來源,請在該報表中進行。嵌入式資料來源可讓您更輕鬆地與他人共同作業報表和資料來源。任何可編輯報表的使用者,也能編輯資料來源及修改連線。分享或複製報表時,系統也會一併分享或複製所有嵌入的資料來源。

透過首頁建立的資料來源可重複使用。您可以在不同報表中重複使用這些資料來源。可重複使用的資料來源可讓您在整個機構中建立及共用一致的資料模型。只有您共用可重複使用的資料來源的使用者,才能編輯該資料來源。只有資料來源憑證的擁有者才能修改連線。

進一步瞭解資料來源

您是 Looker Studio 新手嗎?

使用屬性面板變更資料表的資料和樣式。使用工具列,在報表中新增更多圖表、控制項和其他元件。

瞭解 Looker Studio

連結至 BigQuery 資料表或檢視畫面

BigQuery 資料表含有以資料列分組的個別記錄,每筆記錄是由資料欄所組成 (也稱為「欄位」)。BigQuery 檢視表是指由 BigQuery 控制台執行的 SQL 查詢所定義的虛擬資料表。

如要連結資料表或檢視畫面,您必須提供下列資訊:

  • BigQuery 專案
  • 資料集
  • 資料表或檢視表

專案

專案會整理您的 BigQuery 資源,並在報表超出 BigQuery 的免費配額時,提供帳單所需的資訊。您可以使用同一個專案進行帳單和資料管理作業,也可以使用一個專案管理資料,並在另一個專案中收取帳單。進一步瞭解 Google Cloud 專案

請選擇下列其中一個選項來選取專案:

  • 近期專案
  • 我的專案
  • 共用專案

近期專案

「近期專案」選項會顯示您最近在 Google Cloud 控制台存取過的專案。您也可以手動輸入專案 ID。您選擇的專案會用於帳單和資料存取。選取專案後,請選取資料集。

我的專案

您可以透過「我的專案」選項選取任何可存取的專案。您也可以手動輸入專案 ID。您選擇的專案會用於帳單和資料存取。選取專案後,請選取資料集。

如果您有權存取多個專案,這些專案可能不會全部顯示在清單中。如果清單中的項目數量超過上限,您可以直接在輸入欄位中輸入未列出的專案。

共用專案

您可以透過「共用專案」選項存取與您共用的專案。您可以選取不同的資料和計費專案。

資料集

資料集可用來整理及控管資料的存取權。從清單中選取資料集,或依名稱搜尋資料集。

公開資料集

BigQuery 公開資料集是公開的樣本,可共用資料集,但無法共用專案。如要查詢這項資料,您必須指定自己的帳單專案,系統會根據該專案收取共用資料的處理費用。

資料表

您可以將 Looker Studio 資料來源連結至單一資料表或檢視畫面。

連線至以日期分區的資料表

Looker Studio 可善用 BigQuery 日期分區表格。當您連線至以 DATEDATETIMETIMESTAMP 欄位分割的資料表時,Looker Studio 可以將該欄位用於以此資料來源為基礎的圖表,做為日期範圍維度。如要啟用這個選項,請勾選資料來源連結頁面「設定」欄中的「使用欄位名稱做為日期範圍維度」核取方塊。

如果 BigQuery 中分區資料表需要分區篩選器,系統預設會選取「Use fieldname as date range dimension」(使用欄位名稱做為日期範圍維度) 核取方塊,且無法取消選取。

進一步瞭解 BigQuery 中的日期分區資料表

使用自訂 SQL 查詢連線至 BigQuery

您可以使用「自訂查詢」選項編寫 SQL 來連結資料。自訂查詢語法遵循 標準 SQL 方言。如要使用舊版 BigQuery SQL 方言,請選取「使用舊版 SQL」選項。

使用 BigQuery 使用者介面編寫及測試查詢,然後複製並貼到 Looker Studio 自訂查詢方塊中。

帳單專案

您可以透過「Billing Project」選項,為自訂查詢提供計費專案,方法是搜尋或手動輸入專案 ID。如果貴機構有許多 BigQuery 專案,您可能需要使用手動輸入方法來找出專案。

如要使用一個專案進行帳單作業,並使用其他專案處理資料,請在使用者介面中選取或輸入帳單專案,然後在自訂查詢的 SELECT...FROM 子句中加入資料專案。

BigQuery 自訂查詢設定範例:帳單專案設為 Looker Studio 專案,查詢則在查詢 FROM 子句中指定 BigQuery 公開資料集。

查詢參數

參數可讓您製作更有彈性、可自訂的報表。您可以將 BigQuery 資料來源中的參數傳回至基礎查詢。如要在自訂查詢中使用參數,請按照 BigQuery 執行參數化查詢的語法指南操作。

進一步瞭解如何在自訂查詢中使用參數

自訂查詢的限制

Looker Studio 會將自訂 SQL 做為內部 SELECT 陳述式,針對每個產生的資料庫查詢使用。實際上,自訂查詢會產生新的虛擬資料表,Looker Studio 會使用其產生的「外部」SQL 進行查詢。因此,Looker Studio 中的自訂查詢會受到以下限制:

自訂 SQL 查詢只能包含單一陳述式

舉例來說,以下內容會失效,因為它包含多個 SQL 陳述式:


DECLARE cost_per_tb_in_dollar FLOAT64 DEFAULT 4.2;

SELECT total_bytes_billed / (1024 * 1024)* cost_per_tb_in_dollar)/(1024*1024))) FROM billing-table;

在彙整中使用明確的欄位名稱

自訂彙整查詢無法處理重複的資料欄名稱。如果圖表使用以包含重複欄位的自訂查詢為基礎的資料來源,就會傳回類似以下的使用者設定錯誤:

錯誤訊息文字:使用者設定錯誤

為避免這個問題,請務必在自訂查詢中使用明確的欄位名稱。

舉例來說,假設您要彙整兩個結構定義相同的資料表,並以兩個資料表中都存在的 Criteria_ID 欄位進行彙整。


    SELECT * FROM (
          SELECT Criteria_ID, Parent_ID, Name FROM 'table_1'
            ) As table_1
          LEFT JOIN (
            SELECT Criteria_ID, Parent_ID, Name FROM 'table_2'
            ) As table_2
          ON
            table_1.Criteria_ID = table_2.Criteria_ID

這項查詢包含下列重複的資料欄名稱:

  • Criteria_ID
  • Parent_ID
  • Name

為避免發生 Field is ambiguous 錯誤,您可以使用 AS 關鍵字明確重新命名重複的欄位:


    SELECT *
          FROM (
            SELECT
              Criteria_ID AS Criteria_ID_1,
              Parent_ID AS Parent_ID_1,
              Name AS NAME_1
           FROM
             'table_1' ) AS table_1
           LEFT JOIN (
             SELECT
               Criteria_ID AS Criteria_ID_2,
               Parent_ID AS Parent_ID_2,
               Name AS NAME_2
             FROM
               'table_2' ) AS table_2
             ON
               table_1.Criteria_ID_1 = table_2.Criteria_ID_2;

如果只需要重新命名幾個欄位,您可以選取所有欄位,除了要重新命名的欄位,例如:


SELECT * EXCEPT (city), city AS city_1 FROM 'table_1'

查詢逾時

Looker Studio 中的自訂查詢可能會在 3 到 5 分鐘後逾時。如果自訂查詢逾時,請嘗試下列方法解決問題:

  • 簡化查詢,加快執行速度。
  • 在資料庫中執行查詢,並將結果儲存在另一個資料表中。接著,連結至資料來源中的該資料表。

多日表格

BigQuery 支援跨多個資料表進行查詢,每個資料表都包含一天的資料。表格的格式為 YYYYMMDD。當 Looker Studio 遇到格式為 YYYYMMDD 的資料表時,該資料表會標示為多日資料表,且在資料表選取畫面中只會顯示前置字串_YYYYMMDD 的名稱。

建立圖表以呈現這個資料表時,Looker Studio 會自動建立過去 28 天的預設日期範圍,然後正確查詢過去 28 天的資料表。如要設定這項設定,請編輯報表、選取圖表,然後調整圖表的「資料」分頁中的「日期範圍」屬性。

查看向 BigQuery 發出的 SQL

您可以在 BigQuery 查詢記錄使用者介面中,查看 Looker Studio 產生的所有 BigQuery SQL。

記錄計數指標

BigQuery 資料來源會自動提供預設的「記錄計數」指標。您可以使用這項功能細分維度,顯示圖表匯總的記錄數量。

支援 VPC Service Controls

Looker Studio 可透過以觀看者 IP 為依據的存取層級,連線至受 VPC Service Controls (VPC-SC) 範圍保護的 BigQuery 專案。BigQuery 連接器會將報表檢視者的 IP 位址傳遞給 BigQuery,後者可強制執行已設定的任何 IP 存取層級。

將 BigQuery GEOGRAPHY 多邊形視覺化

您可以在報表中使用 Google 地圖視覺化功能,顯示 地理資訊多邊形。如需教學課程,請參閱「使用 Looker Studio 以圖表呈現 BigQuery GEOGRAPHY 多邊形」一文。

使用工作標籤分析 Looker Studio 查詢

Looker Studio 傳送至 BigQuery 的所有查詢都會加上 BigQuery 工作標籤 requestor:looker_studio。您可以使用這項工作標籤,找出與 Looker Studio 相關的 BigQuery 查詢。如要進一步瞭解 BigQuery 中的標籤,請參閱「查看標籤」BigQuery 說明文件頁面。

如要進一步瞭解如何追蹤 Looker Studio 圖表和報表的效能和成本,請參閱「使用 Looker Studio 分析資料」BigQuery 說明文件頁面。

BigQuery 對話方塊

如果您擁有 BigQuery 資料來源的擁有者憑證,Looker Studio 會在任何使用 BigQuery 的圖表右上角顯示 BigQuery 圖示。將滑鼠游標懸停在圖表上,然後按一下 BigQuery 圖示,即可開啟 BigQuery 對話方塊。對話方塊會顯示 BigQuery 工作詳細資料頁面的連結。BigQuery 工作詳細資料頁面包含下列資訊:

  • 圖表的 SQL 查詢
  • SQL 查詢傳回的資料
  • 查詢步驟的各階段細目
  • 查詢統計資料,例如總執行時間和使用的運算單元

配額和一般限制

使用 BigQuery 連接器時,可傳回的資料列數量上限為 200 萬列。Looker Studio 會指出資料列數量超過 200 萬,但不會指定列數。

此外,BigQuery 資料來源適用於 BigQuery 本身的頻率限制和配額限制

針對 BigQuery 資料來源,MEDIAN 是使用 BigQuery APPROX_QUANTILES 函式實作。將 MEDIAN 套用至來自 BigQuery 的資料,與將 MEDIAN 套用至來自其他資料來源類型的相同資料相比,可能會傳回略有不同的結果。