瞭解資料範圍和時間長度

AML AI 的設定可評估某個業務領域的洗錢風險。這項資料與你的零售或商業客戶相關。

建立用於 LoB 的資料集時,您需要加入幾個資料表。每個資料表都應涵蓋足夠的時間範圍。本頁面將概略介紹您需要的資料表,並說明如何判斷每個資料表應涵蓋的時間範圍。

要使用的資料表

用於 AML AI 的 BigQuery 資料集應包含下列資料表:

  • 當事人:與該業務單位相關的所有當事人
    • 零售 LoB:在指定時間範圍內的任何時間點擁有帳戶的所有零售銀行客戶
    • 商業業務單位:在指定時間範圍內,曾經持有帳戶的所有商業銀行客戶 (法人和自然人實體)
  • AccountPartyLink:哪些帳戶由哪些當事人持有的完整記錄。在指定時間範圍內,如果任何一方在任何時間點是「當事人」資料表中的主要帳戶持有人,這項設定應涵蓋所有產品和服務的帳戶。
  • 交易:在指定時間範圍內,AccountPartyLink 資料表中所有帳戶的交易。
  • RiskCaseEvent:在「Party」表格中,凡是風險案件和當事人,且在指定時間範圍內有 AML_PROCESS_START (調查開始) 的風險案件事件 (請參閱事件類型值)。這個表格可能包含事件時間早於或晚於必要時間範圍的事件。
  • PartySupplementaryData:(如果使用) 針對 0 到 100 個不重複的 party_supplementary_data_id 值,請在指定時間範圍內,為 Party 資料表中的所有參與者提供這些欄位的完整值歷。

使用其他資料

如果您有與識別洗錢風險相關的額外資料 (未在結構定義中涵蓋),請參閱補充資料

資料集時間範圍

對於任何作業,資料集中的任何資料表應涵蓋的時間範圍,可按照下列方式計算。您需要瞭解:

  • 結束時間。這是最近一次使用標籤和資料產生功能以供調整的時間。
  • 您要使用的引擎版本 (請參閱引擎版本清單)。
  • 您要執行的作業:調整、訓練、預測或回測。
  • 針對預測或回測作業,您要在 API 呼叫中指定要執行作業的週期數。

瞭解資料範圍時間長度

首先,您應計算運算要使用的週期數。這是指在指定結束時間之前,上一個完整日曆月的連續月份數,AML AI 會評估這些月份的模型特徵。

  • 對於預測和回測作業,這是 API 呼叫中指定的預測期數或回測期數。
  • 其他作業則取決於引擎版本和作業。舉例來說,v004.004 引擎版本會使用 18 個週期進行調整,以及 15 個週期進行訓練。

接下來,您應該為每個資料表計算回溯時間窗口。這是 AML AI 需要從該資料表取得的資料月數上限,以便計算特定期間的模型功能。

  • 舉例來說,如果是 v004.004 的 Engine 版本,則為 Transaction 和 AccountPartyLink 資料表的 13 個月、RiskCaseEvent 資料表的 12 個月,以及 Party 和 PartySupplementaryData 資料表的 0 個月。

資料集必須涵蓋所選作業所使用的所有期間的回溯期。您可以使用下列公式,計算特定作業結束時間前,需要的完整日曆月資料數量:

  • 期間數量 + 回溯期 -1

舉例來說,如果要進行 v004.00X 引擎版本的調整,您需要:

  • 18 + 13 - 1 = 30 個月的資料,來自「Transaction」和「AccountPartyLink」資料表
  • 18 + 12 - 1 = 29 個月的資料 (來自「風險案件事件」表格),以及表格中風險案件的任何近期事件
  • 因此,Party 和 PartySupplementaryData 資料表的資料長度為 18 + 0 - 1 = 17 個月。