反洗钱 AI 的核心是详细而最新地了解银行的相关方及其活动,尤其是涵盖以下数据:
- 事务性 activity
- 账号持仓
- 派别特征
- 风险调查数据
本页介绍了如何创建和管理 AML AI 所用的数据,包括 AML 的数据模型、数据架构和数据要求的详细信息。架构本身(包括各个字段的详细信息)会显示在 AML 输入数据模型(CSV 文件)中。您还可以通过快速入门获取合成示例数据集。
本页未介绍以下前提条件:
数据要求概览
反洗钱数据模型接受零售或商业实体及其账号和交易的信息,以及与这些实体相关的风险案例的详细信息。本部分介绍了数据模型中适用于不同实体的各个重要方面。
反洗钱数据模型架构分为三个区域:核心银行数据、风险调查数据和补充数据。
核心银行数据
- 表:Party、AccountPartyLink、Transaction
- 用途:作为客户及其银行活动的结构化数据集,用于检测风险。应包含要监控的所有相关方、账号和交易。在 AML AI 数据集中提供零售或商业数据
风险调查数据
- 表:RiskCaseEvent
- 用途:
- 作为有关风险调查流程和之前被认定为存在风险的相关方的结构化数据集
- 协助为反洗钱风险模型创建训练标签
补充数据
- 表:PartySupplementaryData
- 用途:可选表,可包含与识别洗钱风险相关的其他信息,而其他架构中未涵盖这些信息。您无需提供任何补充数据,即可开始使用 AML AI。
表关系
下图介绍了表关系、主键和外键。
错误
创建数据集时,AML AI 会自动执行数据验证检查。如需了解这些检查、错误消息以及如何解决这些错误,请参阅数据验证错误。
如需详细了解技术架构,请参阅 AML 输入数据模型(CSV 文件)。 如需了解数据时长要求和范围,请参阅了解数据范围和时长。在 BigQuery 中准备好表后,您可以使用 AML AI 创建和管理数据集。