Comprendre la portée et la durée des données

L'IA de lutte contre le blanchiment d'argent est conçue pour évaluer le risque de blanchiment d'argent pour un secteur d'activité. Un canal de vente est associé à l'un de vos clients commerciaux ou marchands.

Lorsque vous créez un ensemble de données à utiliser avec un secteur d'activité, vous devez inclure plusieurs tables. Chaque table doit couvrir une période suffisamment longue. Cette page présente les tables dont vous aurez besoin et explique comment déterminer la période à couvrir pour chacune d'elles.

Tables à utiliser

L'ensemble de données BigQuery utilisé avec l'IA AML doit contenir les tables suivantes:

  • Partie: toutes les parties concernées par ce secteur d'activité
    • Retail LoB: tous les clients de la banque de détail qui ont détenu un compte à un moment donné au cours de la période requise
    • Commercial LoB: tous les clients bancaires professionnels (personnes morales et physiques) qui ont détenu des comptes à un moment donné au cours de la période requise
  • AccountPartyLink: historique complet des comptes détenus par les différentes parties. Cela devrait couvrir tous les comptes pour les produits et services lorsqu'une partie de la table "Partie" était le titulaire principal du compte à un moment donné de la période requise.
  • Transaction: toutes les transactions des comptes du tableau "AccountPartyLink" pour la période requise.
  • RiskCaseEvent: tous les événements de cas à risque (voir les valeurs de type d'événement) pour tout cas à risque et toute partie dans le tableau "Party" avec un événement AML_PROCESS_START (début de l'enquête) dans la période requise. Ce tableau peut inclure des événements dont l'heure est antérieure ou postérieure à la période requise.
  • PartySupplementaryData: (si utilisé) Pour 0 à 100 valeurs uniques de party_supplementary_data_id, incluez un historique complet des valeurs de ces champs pour tous les participants de la table "Party" pour la période requise.

Utiliser des données supplémentaires

Consultez la section Données supplémentaires si vous disposez de données supplémentaires sur les parties (non couvertes par le schéma) qui sont pertinentes pour identifier le risque de blanchiment d'argent.

Plage temporelle de l'ensemble de données

La période que toute table d'un ensemble de données doit couvrir peut être calculée comme suit pour une opération donnée. Vous devez savoir:

  • Heure de fin. Il s'agit de la date et de l'heure à partir desquelles les libellés et les données sont utilisés pour générer des fonctionnalités à régler.
  • La version du moteur (voir la liste des versions de moteur) que vous utiliserez.
  • L'opération que vous allez effectuer: réglage, entraînement, prédiction ou rétrotest.
  • Pour les opérations de prédiction ou de backtesting, le nombre de périodes pour lesquelles vous allez effectuer l'opération, à spécifier dans l'appel d'API.

Comprendre la durée de la portée des données

Vous devez d'abord déterminer le nombre de périodes que l'opération utilisera. Il s'agit du nombre de mois consécutifs se terminant par le dernier mois calendaire complet précédant l'heure de fin spécifiée, pour lesquels l'IA AML évaluera les caractéristiques du modèle.

  • Pour les opérations de prédiction et de backtest, il s'agit du nombre de périodes de prédiction ou de backtest spécifiées dans l'appel d'API.
  • Pour les autres opérations, cela dépend de la version du moteur et de l'opération. Par exemple, les versions de moteur v004.004 utilisent 18 périodes pour le réglage et 15 pour l'entraînement.

Vous devez ensuite déterminer la période d'analyse pour chaque table. Il s'agit du nombre maximal de mois de données nécessaires à partir de ce tableau pour que l'IA AML calcule les caractéristiques du modèle pour une période donnée.

  • Par exemple, pour les versions de moteur v004.004, il s'agit de 13 mois pour les tables "Transaction" et "AccountPartyLink", de 12 mois pour la table "RiskCaseEvent" et de 0 mois pour les tables "Party" et "PartySupplementaryData".

L'ensemble de données doit couvrir la période d'analyse pour toutes les périodes utilisées par l'opération choisie. Vous pouvez calculer le nombre de mois calendaires complets de données avant l'heure de fin dont vous aurez besoin pour une opération donnée à l'aide de la formule suivante:

  • nombre de périodes + période d'analyse -1

Par exemple, pour les versions de moteur v004.00X effectuant un réglage, vous avez besoin des éléments suivants:

  • 18 + 13 - 1 = 30 mois de données des tables "Transaction" et "AccountPartyLink",
  • 18 + 12 - 1 = 29 mois de données du tableau "Événements liés aux cas à risque", ainsi que tous les événements plus récents pour les cas à risque dans le tableau
  • Et 18 + 0 - 1 = 17 mois de données provenant des tables "Party" et "PartySupplementaryData".