Glossaire AML AI

Ce glossaire définit les termes spécifiques à l'IA de lutte contre le blanchiment d'argent. Pour en savoir plus sur les termes généraux du machine learning, consultez le glossaire du machine learning.

A

ADC

Chacune des bibliothèques clientes de l'API fournit un moyen d'utiliser les identifiants par défaut de l'application (ADC) locaux.

Pour en savoir plus sur la différence entre vos identifiants ADC locaux et vos identifiants gcloud CLI, consultez la page Identifiants gcloud CLI et identifiants ADC.

B

backtesting
Le backtesting utilise des données historiques pour évaluer les performances (rappel observé) d'un modèle en comparant le score de risque qu'il génère aux résultats réels des investigations historiques.
résultats du test rétrospectif
Une ressource BacktestResult d'IA AML (également appelée "résultats de backtest") est créée pour tester les performances d'un modèle sur un ensemble de données.
Pour en savoir plus, consultez Évaluer un modèle.

C

données bancaires de base
Les
données bancaires de base incluent des données sur les parties, les transactions et les avoirs de compte. Elle aide l'IA de lutte contre le blanchiment d'argent à comprendre vos clients et leur activité bancaire afin de détecter les caractéristiques et les comportements à risque.
Fenêtre temporelle de base

La fenêtre temporelle de base fait référence à la plage de temps utilisée dans une opération d'IA AML (configuration du moteur, entraînement, rétrocompatibilité et prédiction) pour générer des exemples d'entraînement, d'évaluation ou de sortie de modèle. Cette période doit être couverte par toutes les tables de l'ensemble de données.

Les différentes opérations d'API ont des exigences différentes pour la période de base afin de générer des éléments géographiques et des libellés. Pour en savoir plus, consultez la section Comprendre la portée et la durée des données.

Voir également la section Période d'analyse.

D

validation des données
AML AI effectue des vérifications de validation des données lors de la création d'un ensemble de données, d'une configuration de moteur, d'un modèle, de résultats de backtesting ou de prédiction. Si l'ensemble de données spécifié ne passe pas la validation des données, la ressource n'est pas créée et des erreurs de validation des données sont générées (indiquant la nature du problème).
Pour en savoir plus, consultez la section Erreurs de validation des données.
ensemble de données

Une ressource d'ensemble de données d'IA AML (ou simplement "ensemble de données") permet de spécifier des données conformes au modèle de données d'entrée AML, qui peuvent être utilisées pour générer un modèle, évaluer ses performances, et générer des scores de risque et une explicabilité par partie.

Pour en savoir plus, consultez la section Comprendre le modèle de données et les exigences liées à la lutte contre le blanchiment d'argent.

E

heure de fin

Les opérations d'IA AML qui utilisent un ensemble de données nécessitent de spécifier une heure de fin. Ce champ permet de contrôler les mois de l'ensemble de données utilisés pour générer des exemples d'entraînement ou d'évaluation et des sorties de modèle.

L'heure de fin et tous les mois utilisés pour une opération doivent se trouver dans la plage de dates de l'ensemble de données associé.

Par exemple, une opération d'entraînement nécessite une période de base de 15 mois. Si vous utilisez un ensemble de données avec une plage de dates allant du 15 octobre 2021 au 21 mai 2023 et une heure de fin le 12 avril 2023, l'entraînement utilise des exemples des mois civils de janvier 2022 à mars 2023, qui se trouvent dans la plage de dates de l'ensemble de données.

configuration du moteur

Une ressource EngineConfig d'IA AML (également appelée "configuration du moteur") spécifie les paramètres de génération et d'évaluation d'un modèle d'IA AML, ainsi que de génération de scores de risque et d'explicabilité.

Certains de ces paramètres sont spécifiés dans l'appel d'API pour créer une configuration de moteur, tels que la version du moteur et le volume d'investigation prévu. D'autres paramètres sont générés automatiquement par l'IA AML à l'aide d'un ensemble de données spécifié, par exemple des hyperparamètres ajustés.

Pour en savoir plus, consultez Configurer un moteur.

version du moteur

Une ressource EngineVersion AML AI (également appelée "version du moteur") définit des aspects de la façon dont l'IA AML détecte les risques, ce qui comprend le réglage, l'entraînement et l'évaluation du modèle, ainsi que le modèle de données AML global et les familles de fonctionnalités.

Pour configurer un moteur d'IA AML, vous devez spécifier une version de moteur à utiliser. La version du moteur est ensuite utilisée pour entraîner et évaluer des modèles avec cette configuration de moteur, et pour générer des scores de risque et d'explicabilité.

L'attribution de noms aux versions du moteur est structurée comme suit, le type de moteur exprimant le domaine d'activité compatible, et le sous-type de moteur, le réglage, la version majeure et la version mineure sont mis à jour à mesure que de nouveaux comportements sont implémentés.

Voici quelques exemples de versions:

  • aml-retail.default.v004.000.202312-000
  • aml-commercial.default.v004.000.202312-000
Gestion des versions du moteur

Pour en savoir plus sur la gestion des versions du moteur, consultez la section Gérer les versions du moteur.

évaluation

Voir également backtesting.

explicabilité

Les modèles d'IA AML permettent d'identifier les parties présentant des comportements ou des caractéristiques à haut risque de blanchiment d'argent. L'explicabilité indique quels comportements ou caractéristiques ont le plus contribué à un score à haut risque pour un tiers donné.

Pour en savoir plus, consultez la section Comprendre les résultats de prédiction.

Voir également Prédiction.

exporter les métadonnées

Plusieurs ressources d'IA AML stockent des informations supplémentaires sur les performances et la qualité des données, auxquelles vous pouvez accéder à l'aide de l'opération d'exportation des métadonnées.

Pour en savoir plus, consultez la section Modèle de données de sortie AML.

F

famille de fonctionnalités
Les familles de fonctionnalités sont des collections de fonctionnalités de ML associées. Elles fournissent une catégorisation simple et compréhensible pour les enquêteurs et les équipes d'audit interne.

I

entité immuable

L'IA AML doit pouvoir recréer des vues des données à différents moments pour l'ajustement, l'entraînement et le rétrocompatibilité. Pour ce faire, l'IA AML fait la distinction entre les entités modifiables (qui peuvent modifier leurs valeurs au fil du temps) et les entités immuables (qui ne changent pas).

Par exemple, une entité modifiable peut être le solde de votre compte courant, qui peut changer au fil du temps. Une entité immuable peut être un événement, comme le retrait de 50 $de votre compte courant le 2 juillet 2024 à 12h00, qui ne change pas, car il s'agit d'un instantané.

Dans le modèle de données d'entrée AML, les tables représentant des entités immuables ne comportent pas les champs validity_start_time et is_entity_deleted. Cela inclut la table RiskCaseEvent.

Pour en savoir plus, consultez Comprendre l'évolution des données au fil du temps.

Voir aussi la section Entité modifiable.

instance

Une ressource d'instance d'IA AML (également appelée "instance") se trouve à la racine de toutes les autres ressources d'IA AML et doit être créée avant que vous puissiez travailler avec d'autres ressources d'IA AML. Vous pouvez créer plusieurs instances dans la même région au sein d'un projet.

Pour en savoir plus, consultez la section Créer une instance d'IA AML.

procédure d'investigation

Un processus d'investigation couvre l'ensemble de l'enquête ou la séquence d'enquêtes déclenchées par une alerte. Le processus commence lorsque la première partie d'une enquête commence et se termine lorsqu'aucun autre résultat n'est attendu de cette enquête.

Pour en savoir plus, consultez la section Cycle de vie d'un cas de risque.

L

LOB
La ligne d'activité permet de distinguer les clients de services aux particuliers et de services commerciaux dans l'IA de lutte contre le blanchiment d'argent. Les ensembles de données, les versions du moteur et l'enregistrement des parties sont associés à un secteur d'activité spécifique (commerce, vente au détail, etc.).
période d'analyse

En plus de la fenêtre temporelle principale, les opérations d'IA AML exigent que les ensembles de données incluent une fenêtre d'analyse rétrospective pour permettre la génération de fonctionnalités qui suivent le comportement au fil du temps.

Pour en savoir plus, consultez la section Comprendre la portée et la durée des données.

LRO

Plusieurs opérations d'IA AML, y compris la configuration du moteur, l'entraînement, le backtesting et la prédiction, lancent une opération de longue durée (LRO).

Pour en savoir plus, consultez la page Gérer les opérations de longue durée.

M

valeurs manquantes

La métrique de manque est calculée pour toutes les familles de fonctionnalités lors de la création des ressources d'IA AML suivantes: configuration du moteur, modèle, résultats du backtest et résultats de prédiction.

Cette métrique indique la part des valeurs manquantes pour toutes les fonctionnalités d'une famille de fonctionnalités. Un changement significatif de l'absence de valeur pour une famille de fonctionnalités entre l'ajustement, l'entraînement, l'évaluation et la prédiction peut indiquer une incohérence dans les ensembles de données utilisés.

model

Une ressource de modèle d'IA AML (également appelée "modèle") représente un modèle entraîné qui peut être utilisé pour générer des scores de risque et une explicabilité.

entité modifiable

L'IA AML doit pouvoir recréer des vues des données à différents moments pour l'ajustement, l'entraînement et le rétrocompatibilité. Pour ce faire, l'IA AML fait la distinction entre les entités modifiables (qui peuvent modifier leurs valeurs au fil du temps) et les entités immuables (qui ne changent pas).

Par exemple, une entité modifiable peut être le solde de votre compte courant, qui peut changer au fil du temps. En revanche, une entité immuable peut être un événement, comme le retrait de 50 $de votre compte courant le 2 juillet 2024 à 12h00, qui ne change pas, car il s'agit d'un instantané.

Dans le modèle de données d'entrée AML, les tables représentant des entités modifiables comportent les champs validity_start_time et is_entity_deleted. Cela inclut les tables Party, AccountPartyLink, Transaction et PartySupplementaryData.

Pour en savoir plus, consultez Comprendre l'évolution des données au fil du temps.

Voir également la section Entité immuable.

O

observed-recall

L'IA AML mesure les performances du modèle sur les données historiques à l'aide de la métrique "Rappel observé".

Cette métrique indique la proportion de parties libellées comme positives (par exemple, les sorties de clients) sur une période sélectionnée qui auraient été identifiées comme présentant un risque élevé par le modèle évalué au cours d'une période d'activité suspecte.

P

fête

Dans le modèle de données d'entrée AML, une partie représente un client de la banque. Une partie peut être une personne physique ou une entité juridique.

Pour en savoir plus, consultez le tableau Partie.

Voir également parti enregistré.

prédiction

La prédiction consiste à utiliser un modèle pour générer des scores de risque et une explicabilité, qui peuvent être utilisés dans votre processus d'investigation AML.

résultats de prédiction

Une ressource PredictionResult d'IA AML (également appelée "résultats de prédiction") est le résultat de l'utilisation d'un modèle pour créer des prédictions.

Pour en savoir plus sur la génération de scores de risque et d'explicabilité, ainsi que sur leur utilisation dans votre processus d'investigation, consultez les pages de la section Générer des scores de risque et d'explicabilité.

R

parti enregistré
Avant qu'un parti puisse être utilisé pour créer des résultats de prédiction (par exemple, des scores de risque et une explicabilité au niveau du parti), il doit être enregistré pour le secteur d'activité correspondant.
cas de risque

Un cas de risque couvre un processus d'enquête ou un groupe de processus d'enquête associés pour différentes parties.

Consultez le tableau RiskCaseEvent.

données d'investigation des risques

Les données d'investigation des risques sont utilisées par l'IA AML pour comprendre votre processus et vos résultats d'investigation des risques, et pour générer des libellés d'entraînement.

score de risque

Les modèles d'IA de lutte contre le blanchiment d'argent permettent d'identifier les parties présentant des comportements ou des caractéristiques à haut risque de blanchiment d'argent. Cela se fait à l'aide d'un score de risque.

Les scores de risque varient de 0 à 1. Plus le score est élevé, plus le risque est important. Toutefois, les scores de risque ne doivent pas être interprétés directement comme une probabilité d'activité de blanchiment d'argent.

Pour en savoir plus, consultez la section Comprendre les résultats des prédictions.

typologie des risques

L'IA AML peut identifier le risque de blanchiment d'argent dans les cinq principales typologies de risques AML liées à la surveillance des transactions.

Avec une investigation suffisante et des données supplémentaires sur les tiers (voir les tableaux Données supplémentaires), l'IA AML peut couvrir plus de typologies.

S

données supplémentaires

Les données supplémentaires sont des données en plus de celles contenues dans les sections Données bancaires de base et Données d'investigation des risques du schéma d'IA de lutte contre le blanchiment d'argent, qui sont pertinentes pour prédire le risque de blanchiment d'argent.

Par exemple, vous pouvez identifier et ajouter un indicateur de risque qui aide les modèles à mieux prédire une typologie de risque qui n'est pas bien couverte.

Vous pouvez ajouter des données supplémentaires à un ensemble de données à l'aide de la table PartySupplementaryData.

période d'activité suspecte

Une période d'activité suspecte correspond à une période pendant laquelle vous pensez qu'une partie faisant l'objet d'une enquête a présenté un comportement suspect. Cette métrique est utilisée dans l'évaluation du modèle (par exemple, la métrique de rappel pour les résultats du backtest) pour confirmer que les clients à haut risque sont identifiés pendant les mois où ils ont enregistré une activité suspecte.

Pour en savoir plus, consultez la section Cycle de vie d'un cas de risque.

T

formation
L'IA AML effectue l'entraînement lors de la création d'un modèle à l'aide d'hyperparamètres (voir réglage) à partir d'une configuration de moteur spécifiée.
accordage
Le réglage consiste à optimiser les hyperparamètres du modèle. L'IA AML effectue un réglage lors de la création d'une configuration de moteur.

V

validity start time

L'heure de début de validité d'une entité modifiable est utilisée par l'IA de lutte contre le blanchiment d'argent pour créer une vue de ce que la banque savait à un moment donné. Cela permet à l'IA de lutte contre le blanchiment d'argent d'entraîner avec précision des modèles pouvant être réutilisés sur les dernières données (c'est-à-dire ce que la banque connaît) afin de produire des scores de risque haute fidélité.

L'heure de début de validité d'une ligne donnée représente la date et l'heure les plus anciennes auxquelles la banque a connu les données de cette ligne et qu'elles étaient correctes.

Pour en savoir plus, consultez Comprendre l'évolution des données au fil du temps.