Looker 模塊

Looker Blocks™ 是針對常見的分析模式和資料來源預先建構的資料模型。重複使用他人已完成的工作,而非從頭開始,然後根據您的確切規格自訂方塊。從最佳化 SQL 模式到完整建立的資料模型,Looker Blocks 可用於在 Looker 中快速且彈性地建立資料模型。

可用的區塊

您可以選擇多種 Looker 區塊,如要查看可用的區塊,請前往 Looker 市集的「區塊」部分。

按一下你感興趣的區塊,即可查看具體使用說明。

您可以使用 Looker Marketplace 快速安裝部分 Looker Blocks。您必須先請 Looker 管理員啟用Marketplace功能,才能透過 Looker Marketplace 部署區塊。如要進一步瞭解如何安裝及自訂 Looker 市集中的 Looker Blocks,請參閱 Looker 市集說明文件。

標準化和自訂

不同區塊的使用難易度會因資料庫架構標準化程度而異。大多數 Looker 區塊都需要進行一些自訂,才能符合您的資料結構定義,但資料區塊除外,因為這類區塊最容易實作,但無法自訂。

  • 資料區塊包含公開資料集和完整 LookML 模型,只要從 GitHub 存放區複製 LookML 模型,即可存取模擬資料表。如需詳細操作說明,請參閱本頁的「使用資料區塊」。

  • 資料收集應用程式 (例如 Segment 和 Snowplow) 會以相對標準化的格式追蹤事件。這可讓您建立範本化設計模式,以便使用者透過這些應用程式清理、轉換及分析資料。

  • 其他網路應用程式 (例如 Salesforce) 可讓您為內部使用者新增自訂欄位。這麼做自然會產生較不標準的資料格式。因此,我們可以將部分資料模型設為範本,讓 Analytics 開始運作,但您必須自訂非標準化部分。

  • 最後,我們有一般業務洞察資料的區塊。這些是最佳化 SQL 或 LookML 設計模式,不受資料來源限制。舉例來說,許多公司都想分析顧客的終身價值。這些模式內建了一些假設,但您可以根據特定業務需求自訂這些模式。這些模式反映了 Looker 在進行特定類型分析時的最佳做法。

如果您是 Looker 新手,Looker 分析師可以協助您充分運用這些模型。

在 LookML 中新增區塊

  • 部分區塊會在同一個檔案中展示探索和檢視畫面。這麼做是為了方便查看,但一般來說,您應該將 LookML 的適當部分複製到資料模型中適當的位置。詳情請參閱「瞭解模型和檢視檔案」說明文件。
  • 在某些情況下,您可能會想在資料模型中建立新的 LookML 檔案,以便收納範例。

使用資料區塊

資料區塊是一種特殊類型的 Looker 區塊,可提供資料集和資料模型。Looker 資料區塊包含公開資料來源,例如:

  • 客層資料:美國社區調查的常見客層指標,包括州、縣、郵遞區號統計區,甚至是普查區塊群組層級。
  • 天氣資料:美國郵遞區號級別的氣象報告,從 1920 年到前一天。這個區塊會每晚更新。

如要查看可用區塊的完整清單,請參閱 Looker 市集的「區塊」專區。

存取不同資料庫中的資料集

存取資料區塊資料集的程序會因資料庫結構定義而異。以下各節將說明如何存取這些資料庫中的資料集:

存取 Google BigQuery 中的資料集

如果您已擁有 Google BigQuery 帳戶,就能存取 Looker 在 BigQuery 上代管的資料集。請跳至本頁的「在專案中新增資料區塊」一節。

如果您還沒有 Google BigQuery 帳戶,可以設定免費試用方案,然後在 BigQuery 中存取 Looker 的公開資料集。

存取其他資料庫中的資料集

您使用的是 Amazon Redshift、MySQL、PostgreSQL 還是 Oracle?

我們已將這些資料集的轉換資料公開於 Google Cloud Service 和 S3 中,方便您直接匯入所選資料庫。

我們也為 GitHub 存放區中的每個資料集提供資料定義語言 (DDL)。DDL 陳述式可能需要根據所選資料庫中的資料類型進行修改,但應可提供各資料表的資料欄類型。

直接從下列任一位置下載資料:

存取 LookML 模型

將其中一個 GitHub 存放區分支至新的 GitHub 存放區 (由 Looker 或貴公司代管),然後在執行個體中擴充精簡

在專案中新增資料區塊

除了本節所述的方法之外,您也可以使用 LookML 精修功能,在專案中建構檢視區塊和探索的 LookML。

如何在專案中新增資料區塊:

  1. 在 Looker 執行個體中新增專案

  2. 分支或複製先前提到的 GitHub 存放區,即可存取預先建構的 LookML。請務必建立新的 GitHub 存放區。

  3. 從存放區中移除其他資料庫方言檔案。Looker 區塊通常會包含 Google BigQuery、Amazon Redshift 和 Snowflake 的檔案。舉例來說,如果您在 Google BigQuery 上設定資料區塊,就只需要 Google BigQuery 檢視檔案、Google BigQuery Explore 檔案和 Google BigQuery 模型檔案。

  4. 將模型檔案中的連線名稱,替換為資料塊資料所在的資料庫連線。如果您使用的是 Google BigQuery 或 Snowflake,請使用要擴充或精進的資料庫連線。

    所有彙整邏輯都位於各個存放區的 .explore 檔案中。設定專案資訊清單後,您會在後續步驟中加入這個檔案。

  5. 在您要擴充或精進資料區塊的主要 Looker 專案中,建立專案資訊清單檔案

  6. 將下列 LookML 新增至專案資訊清單檔案,以便參照主要 Looker 專案中的資料區塊:

    project_name: "<your_project_name\>"

    local_dependency: {
      project: "<project_name_of_datablock\>"
    }

設定注意事項和選項

Google BigQuery:請務必使用正確的模擬檔案組合。如果您使用 Google BigQuery,建議您參照檔案名稱中含有 _bq_ 的所有檔案。您可能需要將 Google BigQuery 模型方言調整為自己的資料庫方言。

擴充功能:所有專案都已設定為允許探索檔案的擴充功能,因為模型擴充功能可能會導致多個連線的問題。

彙整衍生資料表:建議您參閱原生衍生資料表的說明文件。您可以讓 Looker 針對公開可用的資料集,在不同匯總層級為您編寫 SQL,並將這些資料匯入模型。

合併結果集:您也可以選擇合併查詢結果集,將我們的資料集與您自己的資料合併

客層資料集設定範例

  1. 您可以從 S3 或 Google Cloud Service 值區下載原始資料,或是連線至 Looker 資料庫,以便存取資料。

  2. 從 LookML 匯入「客層資料區塊」模型,做為 Looker 執行個體中的獨立專案。

  3. 使用 include 參數匯入檢視檔案。

  4. 接著,您可以擴充精簡檢視檔案,或是使用原生衍生資料表,以便取得 Explore 所需的匯總層級資料。

    在本範例中,由於客層資料的匯總層級與電子商務資料集不同 (區塊群組與郵遞區號),因此我們使用原生衍生資料表,將統計資料匯總至郵遞區號層級。這樣一來,就能避免複雜的多對多彙整:

      include: "/american_community_survey/bq.explore"
    
      view: zipcode_income_facts {
        derived_table: {
          persist_for: "10000 hours"
          explore_source: fast_facts {
            column: ZCTA5 { field: tract_zcta_map.ZCTA5 }
            column: income_household { field: bg_facts.avg_income_house }
            column: total_population { field: bg_facts.total_population }
          }
        }
        dimension: ZCTA5 {}
        dimension: income_household {
          hidden: yes
        }
    
  5. 將檢視檔案彙整至模型:

      include: "acs*.view"
    
      explore: order_items {
        join: users {
          sql_on: ${users.id} = ${order_items.user_id} ;;
          type: left_outer
          relationship: many_to_one
        }
    
        join: zipcode_income_facts {
          sql_on: ${users.zip} = ${zipcode_income_facts.ZCTA5} ;;
          type: left_outer
          relationship: many_to_one
        }
      }
    
  6. 探索visualize資料。

使用圖表區塊

Looker 內建多種可視化類型。不過,如果您有繪製圖表的需求,而 Looker 內建的視覺化類型無法滿足,也可以新增自己的自訂視覺化類型。您也可以開發自訂視覺化圖表,並透過 Looker Marketplace 提供給所有 Looker 使用者。

圖表模塊是 Looker 代管的預先建構 JavaScript 圖表類型。您可以將 Viz 區塊新增至 Looker 例項,這些區塊的運作方式與 Looker 內建的任何示意圖類型類似:會顯示在示意圖選單列上,並包含鑽研、下載、嵌入和排程等核心功能。

如要進一步瞭解 Viz 區塊,請在 Looker Marketplace 的「插件」部分選取視覺化類型,然後點選「查看程式碼」,並前往 Viz 區塊的 READ.ME 檔案。READ.ME 檔案會顯示視覺化呈現的範例,並提供視覺化區塊的更多資訊。對於部分視覺化內容,READ.ME 檔案也會提供網址和新增視覺化區塊的操作說明。

如要將圖表類型新增至執行個體,請參閱 READ.ME 檔案 (如有) 中的操作說明,以及圖表說明文件頁面中的資訊。