本文提供有關資料混合功能的建議和深入資訊,協助您瞭解混合功能的運作方式,並解決複雜的使用情境。為了充分運用本文,您應已熟悉資料混合作業的基本概念,這部分已在本主題的其他文章中介紹。
混合資料應只包含可用資料的子集
最佳做法是,在以混合資料為基礎的圖表中,只納入要呈現的特定欄位。這麼做的重要性如下:
- 混合可能會產生非常龐大的資料集,導致效能變慢,並可能提高 BigQuery 等付費服務的查詢費用。
- 以混合資料為基礎的圖表會計算混合資料中的所有資料列,即使這些資料列未用於圖表也一樣。
- 舉例來說,假設您建立的混合資料包含 10 個欄位,接著,您可以定義只使用其中 1 個欄位的圖表。Looker Studio 會計算 10 個欄位的混合資料,然後在混合資料的輸出內容中查詢該 1 個欄位,以建立圖表。
- 只有在混合資料包含基礎資料的子集時,才會進行重新匯總。
使用混合功能重新匯總指標
從基礎資料來源納入的指標會在混合中變成未經匯總的數字。如果混合資料包含的欄位少於基礎資料來源的完整欄位組合,系統會根據新資料重新匯總這些數字。如果您需要對已匯總的欄位套用不同的匯總方式 (例如計算平均值的平均值),這類混合方式就很實用。
詳情請參閱「使用混合功能重新匯總資料」。
從單一資料來源建立混合資料
混合資料不一定要使用不同的資料來源。您也可以透過混合來自同一個資料來源的多個資料表,重新匯總資料。
舉例來說,假設您有一個資料集,其中包含美國人口最多的州的前三名縣人口資料,如以下表格所示:
狀態 |
縣 |
人口數 (2023 年預估值) |
---|---|---|
加州 |
洛杉磯縣 |
10,014,009 |
加州 |
聖地牙哥縣 |
3,298,634 |
加州 |
橘郡 |
3,186,989 |
德州 |
Harris County |
4,731,145 |
德州 |
達拉斯郡 |
2,613,539 |
德州 |
塔蘭特郡 |
2,110,640 |
紐約州 |
紐約市布魯克林區 |
2,736,074 |
紐約州 |
皇后郡 |
2,405,464 |
紐約州 |
布朗克斯郡 |
1,418,890 |
您想計算各州各縣的人口百分比,但要這麼做,您必須將各州的總人口數設為個別欄位。在資料集中,您無法取得該指標,但可以透過下列步驟將人口資料來源與自身混合,以便取得該指標:
- 使用基本資料集建立資料來源。
- 在報表中加入使用該資料來源的圖表。
- 使用兩個資料表建立混合資料集。每個資料表都會使用您在步驟 1 中建立的相同資料來源。
- 針對表格 1,請加入下列欄位:
- 州/省、縣、人口。
- 將「Population」重新命名為「CountyPopulation」。
- 針對表格 2,只納入「Population」欄位,並將該欄位重新命名為「StatePopulation」。
- 針對表格 1,請加入下列欄位:
- 彙整條件請使用左外部彙整,將第 1 張表中的「State」連結至第 2 張表中的「State」。
- 按一下 [儲存]。
- 按一下「X」返回報表編輯器。
接著,請在報表中新增圖表 (例如表格),然後按照下列步驟選取混合資料做為圖表的資料來源:
- 將「State」、「County」、「CountyPopulation」和「StatePopulation」欄位新增至圖表。
- 如要計算各縣的州人口百分比,請在圖表中新增計算欄位,並使用重新匯總的資料:
- 在「屬性」面板中,依序點選「新增指標」和「新增欄位」。
- 例如將欄位命名為「州人口百分比」。
- 在「公式」方塊中輸入
(CountyPopulation / StatePopulation)*100
。 - (選用) 設定「顯示格式」,以特定等級顯示百分比值 (例如「百分比 (2)」,代表小數點後有兩個數字)。
完成後,表格應如下所示:
狀態 |
縣 |
CountyPopulation |
StatePopulation |
州人口百分比 |
---|---|---|---|---|
加州 |
洛杉磯縣 |
10014009 |
16499632 |
60.69 |
德州 |
Harris County |
4731145 |
9455324 |
50.04 |
加州 |
聖地牙哥縣 |
3298634 |
16499632 |
19.99 |
加州 |
橘郡 |
3186989 |
16499632 |
19.32 |
紐約州 |
紐約市布魯克林區 |
2736074 |
6560428 |
41.71 |
德州 |
達拉斯郡 |
2613539 |
9455324 |
27.64 |
紐約州 |
皇后郡 |
2405464 |
6560428 |
36.67 |
德州 |
塔蘭特郡 |
2110640 |
9455324 |
22.32 |
紐約州 |
布朗克斯郡 |
1418890 |
6560428 |
21.63 |
混合中的表格順序
Looker Studio 會依序評估混合中的彙整設定,從最左側的設定開始。然後將每個彙整結果套用至右側的下一個彙整作業。舉例來說,在三個資料表的混合中,系統會評估資料表 1 (最左) 和資料表 2 (中間) 之間的彙整設定,然後將這些結果用於資料表 2 和資料表 3 (最右) 之間的彙整設定。
自動建立的混合資料表中的表格順序
當您將所選圖表合併時,Looker Studio 會為每個圖表建立資料表,然後將圖表中的欄位新增至對應的資料表。混合圖表中的表格順序會與所選圖表的順序一致:所選的第一個圖表會成為第一個 (最左側) 表格,第二個所選圖表會成為第二個表格,以此類推。
Looker Studio 也會為每個資料表自動建立彙整設定,並使用左外部彙整類型。
如果您不滿意預設設定,或是資料表之間沒有明確的連結,可以編輯混合資料集以符合目標。
資料表是在混合前建立
系統會先查詢混合資料中的每個資料表資料,再將這些資料彙整為最終的混合資料。資料表中的日期範圍、篩選器和計算欄位會套用至產生資料表的查詢,在執行任何彙整作業之前。這些因素可能會影響混合表格中納入的資料,並改變混合結果。
混合資料可能包含比原始資料更多的資料列
混合圖表可能會顯示比混合圖表中所用個別資料來源更豐富的資料。結果可能會因資料和混合選取的彙整設定而異。舉例來說,左外部彙整會納入左側資料表的所有記錄,以及右側資料表中與彙整條件共用相同值的所有記錄。彙整條件有多個相符項目時,混合資料中顯示的資料列可能會比最左側資料來源中多。
混合資料和明確的日期範圍和篩選條件
您可以使用日期範圍或套用篩選器,限制混合資料中的資料列數量。您可以限制以混合資料為基礎的圖表或組成混合資料的表格資料列。建議您將這個流程視為「前調合」或「後調合」。
當您在混合資料中對表格套用日期範圍或篩選器時,系統會先套用這些項目,再將資料與混合資料中的其他表格彙整。超出日期範圍或遭篩除的資料列,無法供彙整查詢使用。
將日期範圍或篩選器套用至以混合資料為基礎的圖表時,您是在建立混合資料後套用篩選條件 (「後混合」)。
這項差異可能會對圖表中顯示的結果造成重大影響,具體取決於您的資料和設定混合方式。
混合和沿用篩選器
只要篩選器與混合前或混合後的資料相容,混合資料就會繼承報表、網頁或群組層級篩選條件。如果篩選器與混合功能使用的基礎資料來源相容,則篩選器會對預先混合資料進行篩選。否則,篩選器會對混合後的資料進行篩選。如果篩選器與前置混合或後置混合資料不相容,系統會忽略篩選器。
進一步瞭解篩選器繼承。
當以混合資料為基礎的圖表受到繼承篩選器的影響時,Looker Studio 會以五個步驟處理資料:
(預先混合):
- 步驟 1:系統會根據「Blend Data」面板中指定的維度,將資料分組及匯總。
- 步驟 2:將繼承的維度篩選器和相容的指標篩選器套用至「混合資料」面板中包含的資料來源。
(混合):
- 步驟 3:系統會使用指定的彙整設定來混合資料。
(後混合):
- 步驟 4:系統會根據圖表中的維度,將資料分組及匯總。
- 步驟 5:如果指標篩選器與混合資料相容,就會套用至圖表。