本詞彙表定義反洗錢 AI 專用術語。如需瞭解一般機器學習術語,請參閱機器學習詞彙表。
A
- ADC
每個 API 用戶端程式庫都提供使用本機應用程式預設憑證 (ADC) 的方法。
如要瞭解本機 ADC 憑證和 gcloud CLI 憑證的差異,請參閱「gcloud CLI 憑證和 ADC 憑證」
B
- backtesting
- 回測會使用歷來資料,比較模型產生的風險分數與歷來調查的實際結果,藉此評估模型的效能 (觀察回溯率)。
- 回測結果
- AML AI BacktestResult 資源 (也稱為「回測結果」) 會建立,用於測試模型在資料集上的效能。
- 詳情請參閱「評估模型」。
C
- 核心銀行資料
- 核心銀行資料包括當事人、交易和帳戶存款資料。這有助於 AML AI 瞭解客戶及其銀行活動,進而偵測出具風險特徵和行為。
- 核心時間範圍
核心時間視窗是指 AML AI 作業 (引擎設定、訓練、回測和預測) 用於產生訓練、評估範例或模型輸出的時間範圍。資料集中的所有資料表都必須涵蓋這個時間範圍。
不同 API 作業對產生功能和標籤的核心時間視窗有不同的要求。詳情請參閱「瞭解資料範圍和時間長度」。
另請參閱「回溯期」。
D
- 資料驗證
- AML AI 會在建立資料集、引擎設定、模型、回測結果或預測結果時,進行資料驗證檢查。如果指定的資料集未通過資料驗證,系統就不會建立資源,並產生資料驗證錯誤 (指出問題的性質)。
- 詳情請參閱「資料驗證錯誤」。
- dataset
AML AI 資料集資源 (或稱「資料集」) 可用於指定資料,符合 AML 輸入資料模型,可用於產生模型、評估模型成效,以及產生風險分數和每個參與者的可解釋性。
詳情請參閱「瞭解 AML 資料模型和相關規定」。
E
- 結束時間
使用資料集的反洗錢 AI 作業需要指定結束時間。這個欄位可用於控制資料集中哪些月份用於產生訓練或評估範例和模型輸出內容。
作業的結束時間和所有月份,必須位於相關聯資料集的日期範圍內。
舉例來說,訓練作業需要 15 個月的核心時間視窗。如果您使用資料集,其日期範圍為 2021 年 10 月 15 日至 2023 年 5 月 21 日,且結束時間為 2023 年 4 月 12 日,則訓練會使用 2022 年 1 月至 2023 年 3 月的日曆月範例,這些範例位於資料集的日期範圍內。
- 引擎設定
AML AI EngineConfig 資源 (也稱為「引擎設定」) 會指定產生及評估 AML AI 模型,以及產生風險分數和可解釋性時使用的參數。
其中部分參數會在 API 呼叫中指定,以便建立引擎設定,例如引擎版本和預期的調查量。其他參數則會由 AML AI 使用指定資料集自動產生,例如經過調整的超參數。
詳情請參閱「設定引擎」。
- 引擎版本
AML AI EngineVersion 資源 (也稱為「引擎版本」) 會定義 AML AI 偵測風險的方式,包括模型調整、訓練和評估,以及整體 AML 資料模型和特徵群組。
設定 AML AI 引擎時,您必須指定要使用的引擎版本。接著,系統會使用引擎版本,搭配該引擎設定訓練及評估模型,並產生風險分數和可解釋性。
引擎版本命名結構如下,引擎類型會表示支援的業務線,而引擎子類型、調整、主要版本和次要版本會隨著新行為的實作而更新。
範例版本包括:
aml-retail.default.v004.008.202411-001
aml-commercial.default.v004.008.202411-001
如要進一步瞭解如何管理引擎版本,請參閱「管理引擎版本」。
- 評估
另請參閱「backtesting」。
- 可解釋性
AML AI 模型可用於找出行為或特徵顯示高洗錢風險的對象。可解釋性功能會指出哪些行為或特徵對特定對象的高風險分數影響最大。
詳情請參閱「瞭解預測輸出結果」。
另請參閱「預測」。
- 匯出中繼資料
多個反詐欺 AI 資源會儲存與效能和資料品質相關的其他資訊,您可以使用匯出中繼資料作業存取這些資訊。
詳情請參閱 AML 輸出資料模型。
F
- 特徵族群
- 特徵組合是相關機器學習特徵的集合,提供簡單易懂的類別,供調查人員和內部稽核團隊參考。
I
- 不可變動的實體
AML AI 需要能夠在不同時間點重新建立資料檢視畫面,以便進行調整、訓練和回測。為達成這項目標,AML AI 會區分可變動的實體 (可隨時間變更值) 和不可變動的實體 (不會變更)。
舉例來說,可變動的實體可能是您的支票帳戶餘額,因為這項資訊會隨著時間而變動;但不可變動的實體可能是事件,例如在 2024 年 7 月 2 日 12:00:00 從您的支票帳戶提款 $50 美元,因為這項資訊是時間的快照,不會變動。
在 AML 輸入資料模型中,代表不可變動實體的資料表沒有
validity_start_time
和is_entity_deleted
欄位。包括 RiskCaseEvent 表格。詳情請參閱「瞭解資料隨時間變化的情形」。
另請參閱「可變動實體」。
- instance
AML AI 執行個體資源 (也稱為「執行個體」) 位於所有其他 AML AI 資源的根目錄,必須先建立這項資源,才能使用其他 AML AI 資源。您可以在專案內的同一區域中建立多個執行個體。
詳情請參閱「建立 AML AI 執行個體」。
- 調查程序
調查程序涵蓋整個調查或由警報觸發的調查序列。這個程序會在調查的第一部分開始時啟動,並在調查不再產生任何結果時結束。
詳情請參閱「風險案例的生命週期」。
L
- 回溯期
除了核心時間視窗外,AML AI 作業還要求資料集包含回溯視窗,以便產生可追蹤行為變化的特徵。
詳情請參閱「瞭解資料範圍和時間長度」。
- LRO
幾項 AML AI 作業 (包括引擎設定、訓練、回測和預測) 會啟動長時間執行的作業 (LRO)。
詳情請參閱「管理長時間執行的作業」。
M
- 缺失值
建立下列 AML AI 資源時,系統會針對所有特徵系列計算缺失率指標:引擎設定、模型、回測結果和預測結果。
這項指標會顯示特徵家族中所有特徵的遺漏值比例。在調整、訓練、評估和預測之間,如果任何特徵家族的缺失率出現重大變化,可能表示所用資料集不一致。
- model
AML AI 模型資源 (也稱為「模型」) 代表經過訓練的模型,可用於產生風險分數和可解釋性。
- 可變動實體
AML AI 需要能夠在不同時間點重新建立資料檢視畫面,以便進行調整、訓練和回測。為達成這項目標,AML AI 會區分可變實體 (可隨時間變更值) 和不可變實體 (不會變更)。
舉例來說,可變動的實體可能是您的支票帳戶餘額,因為這項資訊會隨著時間變動;但不可變動的實體可能是事件,例如在 2024 年 7 月 2 日 12:00:00 從您的支票帳戶提款 $50 美元,因為這項資訊是時間的快照,不會變動。
在 AML 輸入資料模型中,代表可變動實體的表格具有
validity_start_time
和is_entity_deleted
欄位。包括 Party、AccountPartyLink、Transaction 和 PartySupplementaryData 資料表。詳情請參閱「瞭解資料隨時間變化的情形」。
另請參閱「不可變動的實體」。
O
- observed-recall
AML AI 會使用觀察回溯指標,評估模型在歷史資料上的效能。
這項指標會顯示所選期間內,在可疑活動期間被評估模型認定為高風險的正向標籤方 (例如顧客離開) 比例。
P
- party
在 AML 輸入資料模型中,一方代表銀行的客戶。當事人可以是自然人或法人。
詳情請參閱「派對」表格。
另請參閱「註冊方」。
- 預測
- 預測結果
AML AI PredictionResult 資源 (也稱為「預測結果」) 是使用模型建立預測結果的結果。
如要進一步瞭解如何產生風險分數和可解釋性,以及如何在調查程序中使用這些分數,請參閱「產生風險分數和可解釋性」一節中的頁面。
R
- 已註冊的一方
- 方必須註冊對應的業務線,才能用於建立預測結果 (例如方級風險分數和可解釋性)。
- 風險案例
風險案例涵蓋調查程序,或一組不同當事人的相關調查程序。
請參閱「RiskCaseEvent」表格。
- 風險調查資料
AML AI 會使用風險調查資料,瞭解風險調查程序和結果,並產生訓練標籤。
- 風險分數
AML AI 模型可用於找出有洗錢高風險行為或特徵的對象。這項作業是透過風險分數完成。
風險分數介於 0 到 1 之間,分數越高,風險越高。不過,風險分數不應直接解讀為洗錢活動的可能性。
詳情請參閱「瞭解預測輸出結果」。
- 風險類型
AML AI 可在五種主要的 AML 風險類型中,找出與交易監控相關的洗錢風險。
有了充足的調查資料和補充方資料 (請參閱「補充資料」表格),AML AI 就能涵蓋更多類型。
S
- 補充資料
舉例來說,您可以找出並新增風險指標,協助模型更準確地預測未涵蓋的風險類型。
您可以使用 PartySupplementaryData 資料表,將補充資料新增至資料集。
- 可疑活動期間
可疑活動期間是指您認為受調查方展現可疑行為的一段時間。這項指標可用於模型評估 (例如回測結果的回憶率指標),確認系統在高風險客戶出現可疑活動的月份,找出這些客戶。
詳情請參閱「風險案例的生命週期」。
T
- training
- AML AI 會在使用指定引擎設定的超參數建立模型時進行訓練 (請參閱「調整」)。
- 調音
- 調整是指模型超參數的最佳化。AML AI 會在建立引擎設定時進行調整。
V
- 有效開始時間
AML AI 會使用可變動實體的有效起始時間,建構銀行在特定時間點所知的資訊。這可讓反洗錢 AI 準確訓練模型,以便在最新資料 (即銀行所知的資料) 上重複使用模型,產生高保真度風險分數。
特定資料列的有效開始時間代表銀行得知並修正此列資料的最早時間。
詳情請參閱「瞭解資料隨時間變化的情形」。