混合提示和進階概念

本文提供有關資料混合功能的建議和深入資訊,協助您瞭解混合功能的運作方式,並解決複雜的使用情境。為了充分運用本文,您應已熟悉資料混合作業的基本概念,這部分已在本主題的其他文章中介紹。

混合資料應只包含可用資料的子集

最佳做法是,在以混合資料為基礎的圖表中,只納入要呈現的特定欄位。這麼做的重要性如下:

  • 混合可能會產生非常龐大的資料集,導致效能變慢,並可能提高 BigQuery 等付費服務的查詢費用。
  • 以混合資料為基礎的圖表會計算混合資料中的所有資料列,即使這些資料列未用於圖表也一樣。
    • 舉例來說,假設您建立的混合資料包含 10 個欄位,接著,您可以定義只使用其中 1 個欄位的圖表。Looker Studio 會計算 10 個欄位的混合資料,然後在混合資料的輸出內容中查詢該 1 個欄位,以建立圖表。
    • 只有在混合資料包含基礎資料的子集時,才會進行重新匯總。

使用混合功能重新匯總指標

從基礎資料來源納入的指標會在混合中變成未經匯總的數字。如果混合資料包含的欄位少於基礎資料來源的完整欄位組合,系統會根據新資料重新匯總這些數字。如果您需要對已匯總的欄位套用不同的匯總方式 (例如計算平均值的平均值),這類混合方式就很實用。

詳情請參閱「使用混合功能重新匯總資料」。

從單一資料來源建立混合資料

混合資料不一定要使用不同的資料來源。您也可以透過混合來自同一個資料來源的多個資料表,重新匯總資料。

舉例來說,假設您有一個資料集,其中包含美國人口最多的州的前三名縣人口資料,如以下表格所示:

狀態

人口數 (2023 年預估值)

加州

洛杉磯縣

10,014,009

加州

聖地牙哥縣

3,298,634

加州

橘郡

3,186,989

德州

Harris County

4,731,145

德州

達拉斯郡

2,613,539

德州

塔蘭特郡

2,110,640

紐約州

紐約市布魯克林區

2,736,074

紐約州

皇后郡

2,405,464

紐約州

布朗克斯郡

1,418,890

您想計算各州各縣的人口百分比,但要這麼做,您必須將各州的總人口數設為個別欄位。在資料集中,您無法取得該指標,但可以透過下列步驟將人口資料來源與自身混合,以便取得該指標:

  1. 使用基本資料集建立資料來源。
  2. 在報表中加入使用該資料來源的圖表。
  3. 使用兩個資料表建立混合資料集。每個資料表都會使用您在步驟 1 中建立的相同資料來源。
    1. 針對表格 1,請加入下列欄位:
      1. 州/省人口
      2. 將「Population」重新命名為「CountyPopulation」
    2. 針對表格 2,只納入「Population」欄位,並將該欄位重新命名為「StatePopulation」
  4. 彙整條件請使用左外部彙整,將第 1 張表中的「State」連結至第 2 張表中的「State」
  5. 按一下 [儲存]
  6. 按一下「X」返回報表編輯器。

接著,請在報表中新增圖表 (例如表格),然後按照下列步驟選取混合資料做為圖表的資料來源:

  1. 將「State」、「County」、「CountyPopulation」和「StatePopulation」欄位新增至圖表。
  2. 如要計算各縣的州人口百分比,請在圖表中新增計算欄位,並使用重新匯總的資料:
    1. 在「屬性」面板中,依序點選「新增指標」和「新增欄位」
    2. 例如將欄位命名為「州人口百分比」
    3. 在「公式」方塊中輸入 (CountyPopulation / StatePopulation)*100
    4. (選用) 設定「顯示格式」,以特定等級顯示百分比值 (例如「百分比 (2)」,代表小數點後有兩個數字)。

完成後,表格應如下所示:

狀態

CountyPopulation

StatePopulation

州人口百分比

加州

洛杉磯縣

10014009

16499632

60.69

德州

Harris County

4731145

9455324

50.04

加州

聖地牙哥縣

3298634

16499632

19.99

加州

橘郡

3186989

16499632

19.32

紐約州

紐約市布魯克林區

2736074

6560428

41.71

德州

達拉斯郡

2613539

9455324

27.64

紐約州

皇后郡

2405464

6560428

36.67

德州

塔蘭特郡

2110640

9455324

22.32

紐約州

布朗克斯郡

1418890

6560428

21.63

混合中的表格順序

Looker Studio 會依序評估混合中的彙整設定,從最左側的設定開始。然後將每個彙整結果套用至右側的下一個彙整作業。舉例來說,在三個資料表的混合中,系統會評估資料表 1 (最左) 和資料表 2 (中間) 之間的彙整設定,然後將這些結果用於資料表 2 和資料表 3 (最右) 之間的彙整設定。

自動建立的混合資料表中的表格順序

當您將所選圖表合併時,Looker Studio 會為每個圖表建立資料表,然後將圖表中的欄位新增至對應的資料表。混合圖表中的表格順序會與所選圖表的順序一致:所選的第一個圖表會成為第一個 (最左側) 表格,第二個所選圖表會成為第二個表格,以此類推。

Looker Studio 也會為每個資料表自動建立彙整設定,並使用左外部彙整類型。

如果您不滿意預設設定,或是資料表之間沒有明確的連結,可以編輯混合資料集以符合目標。

資料表是在混合前建立

系統會先查詢混合資料中的每個資料表資料,再將這些資料彙整為最終的混合資料。資料表中的日期範圍、篩選器和計算欄位會套用至產生資料表的查詢,在執行任何彙整作業之前。這些因素可能會影響混合表格中納入的資料,並改變混合結果。

混合資料可能包含比原始資料更多的資料列

混合圖表可能會顯示比混合圖表中所用個別資料來源更豐富的資料。結果可能會因資料和混合選取的彙整設定而異。舉例來說,左外部彙整會納入左側資料表的所有記錄,以及右側資料表中與彙整條件共用相同值的所有記錄。彙整條件有多個相符項目時,混合資料中顯示的資料列可能會比最左側資料來源中多。

混合資料和明確的日期範圍和篩選條件

您可以使用日期範圍或套用篩選器,限制混合資料中的資料列數量。您可以限制以混合資料為基礎的圖表或組成混合資料的表格資料列。建議您將這個流程視為「前調合」或「後調合」。

當您在混合資料中對表格套用日期範圍或篩選器時,系統會先套用這些項目,再將資料與混合資料中的其他表格彙整。超出日期範圍或遭篩除的資料列,無法供彙整查詢使用。

將日期範圍或篩選器套用至以混合資料為基礎的圖表時,您是在建立混合資料後套用篩選條件 (「後混合」)。

這項差異可能會對圖表中顯示的結果造成重大影響,具體取決於您的資料和設定混合方式。

混合和沿用篩選器

只要篩選器與混合前或混合後的資料相容,混合資料就會繼承報表、網頁或群組層級篩選條件。如果篩選器與混合功能使用的基礎資料來源相容,則篩選器會對預先混合資料進行篩選。否則,篩選器會對混合後的資料進行篩選。如果篩選器與前置混合或後置混合資料不相容,系統會忽略篩選器。

進一步瞭解篩選器繼承

當以混合資料為基礎的圖表受到繼承篩選器的影響時,Looker Studio 會以五個步驟處理資料:

(預先混合)

  • 步驟 1:系統會根據「Blend Data」面板中指定的維度,將資料分組及匯總。
  • 步驟 2:將繼承的維度篩選器和相容的指標篩選器套用至「混合資料」面板中包含的資料來源。

(混合)

  • 步驟 3:系統會使用指定的彙整設定來混合資料。

(後混合)

  • 步驟 4:系統會根據圖表中的維度,將資料分組及匯總。
  • 步驟 5:如果指標篩選器與混合資料相容,就會套用至圖表。