在 BigQuery 中設定及使用實體解析功能
本文件說明如何為實體解析端使用者 (以下簡稱「端使用者」) 和身分識別提供者實作實體解析功能。
使用者可以透過這份文件連結身分識別提供者,並使用提供者的服務比對記錄。身分識別提供者可使用這份文件來設定服務,並在 Google Cloud Marketplace 上與使用者分享。
使用者的工作流程
以下各節將向使用者說明如何在 BigQuery 中設定實體解析功能。如需完整設定的視覺化呈現,請參閱實體解析架構。
事前準備
- 與識別資訊提供者聯絡並建立關係。BigQuery 支援使用 LiveRamp 進行實體解析。
- 從身分識別資訊提供者取得下列項目:
- 服務帳戶憑證
- 遠端函式簽章
- 在專案中建立兩個資料集:
- 輸入資料集
- 輸出資料集
必要的角色
如要取得執行實體解析工作所需的權限,請管理員授予您下列 IAM 角色:
-
讓身分提供者的服務帳戶讀取輸入資料集,並寫入輸出資料集:
-
輸入資料集的 BigQuery 資料檢視器 (
roles/bigquery.dataViewer
) -
輸出資料集的 BigQuery 資料編輯器 (
roles/bigquery.dataEditor
)
-
輸入資料集的 BigQuery 資料檢視器 (
如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
翻譯或解析實體
如需特定身分提供者的操作說明,請參閱下列各節。
LiveRamp
事前準備
- 在 BigQuery 中設定 LiveRamp 嵌入式身分。詳情請參閱「在 BigQuery 中啟用 LiveRamp 嵌入式身分」。
- 與 LiveRamp 協調,啟用 API 憑證,以便與嵌入式身分識別服務搭配使用。詳情請參閱「驗證」。
設定
第一次使用 LiveRamp 嵌入式身分識別系統時,必須執行下列步驟。設定完成後,您只需要在執行作業之間修改輸入資料表和中繼資料表。
建立輸入表
在輸入資料集中建立資料表。在資料表中填入 RampID、目標網域和目標類型。如需詳細資訊及範例,請參閱「輸入資料表資料欄和說明」。
建立中繼資料表
中繼資料表可用於控制 BigQuery 上 LiveRamp 嵌入式身分的執行作業。在輸入資料集中建立中繼資料表。在中繼資料表中填入用戶端 ID、執行模式、目標網域和目標類型。如需詳細資訊及範例,請參閱「中繼資料表欄和說明」。
與 LiveRamp 共用資料表
授予 LiveRamp Google Cloud 服務帳戶存取權,以便查看及處理輸入資料集中的資料。如需詳細資訊和範例,請參閱「與 LiveRamp 共用資料表和資料集」。
執行嵌入式身分工作
如要在 BigQuery 中使用 LiveRamp 執行內嵌身分工作,請按照下列步驟操作:
- 確認網域中已編碼的所有 RampID 都位於輸入表格中。
- 請先確認中繼資料表仍正確無誤,再執行工作。
- 請透過 LiveRampIdentitySupport@liveramp.com 提出工作處理要求。請為輸入資料表、中繼資料表和輸出資料集加入專案 ID、資料集 ID 和資料表 ID (如適用)。詳情請參閱「通知 LiveRamp 啟動轉碼」一文。
結果通常會在三個工作天內送至輸出資料集。
LiveRamp 支援
如有支援問題,請與 LiveRamp 身分識別服務支援團隊聯絡。
LiveRamp 帳單
LiveRamp 會處理實體解析的結帳作業。
識別資訊提供者的作業流程
以下各節將說明身分識別提供者如何在 BigQuery 中設定實體解析。如需完整設定的視覺化呈現,請參閱實體解析架構。
事前準備
- 建立 Cloud Run 作業或 Cloud Run 函式,以便與遠端函式整合。這兩種做法都適合用於此用途。
請記下與 Cloud Run 或 Cloud Run 函式相關聯的服務帳戶名稱:
前往 Google Cloud 控制台的「Cloud Functions」頁面。
按一下函式的名稱,然後點選「Details」分頁標籤。
在「General Information」窗格中,找出並記下遠端函式的服務帳戶名稱。
建立遠端函式。
向使用者收集使用者主體。
必要的角色
如要取得執行實體解析工作所需的權限,請管理員授予您下列 IAM 角色:
-
如要讓與函式相關聯的服務帳戶讀取及寫入相關聯的資料集和啟動工作:
-
專案中的 BigQuery 資料編輯者 (
roles/bigquery.dataEditor
) -
專案中的 BigQuery 工作使用者 (
roles/bigquery.jobUser
)
-
專案中的 BigQuery 資料編輯者 (
-
讓使用者端原則擁有者查看及連線至遠端函式:
-
連線上的 BigQuery 連線使用者 (
roles/bigquery.connectionUser
) -
在含有遠端函式的控制平面資料集中,使用 BigQuery 資料檢視器 (
roles/bigquery.dataViewer
)
-
連線上的 BigQuery 連線使用者 (
如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
共用實體辨識遠端函式
修改並與使用者分享下列遠端介面程式碼。使用者需要這段程式碼才能啟動實體解析工作。
`PARTNER_PROJECT_ID.DATASET_ID`.match`(LIST_OF_PARAMETERS)
將 LIST_OF_PARAMETERS 替換為傳遞至遠端函式的參數清單。
選用:提供工作中繼資料
您可以選擇使用個別的遠端函式,或在使用者的輸出資料集中寫入新的狀態表格,提供工作中繼資料。中繼資料的範例包括工作狀態和指標。
識別資訊提供者的帳單
為簡化客戶帳單和新手上路流程,建議您將實體解析服務整合至 Google Cloud Marketplace。您可以根據實體解析工作用量設定定價模式,由 Google 處理帳單。詳情請參閱「提供軟體即服務 (SaaS) 產品」。