Cette page présente brièvement les concepts de l'entraînement de modèle. Une ressource de modèle d'IA AML représente un modèle entraîné qui peut être utilisé pour générer des scores de risque et une explicabilité.
Quand entraîner ou réentraîner un modèle ?
L'IA AML entraîne un modèle lors de la création d'une ressource de modèle. Le modèle doit être entraîné avant de pouvoir être évalué (c'est-à-dire testé en arrière) ou utilisé pour générer des résultats de prédiction.
Pour des performances optimales et pour conserver les modèles les plus à jour, envisagez de les réentraîner tous les mois. Toutefois, une version de moteur donnée permet de générer des résultats de prédiction pendant 12 mois à compter de la publication d'une version mineure plus récente du moteur.
S'entraîner
Pour entraîner un modèle (c'est-à-dire le créer), consultez la section Créer et gérer des modèles.
Vous devez notamment sélectionner les éléments suivants:
Données à utiliser pour l'entraînement:
Spécifiez un ensemble de données et une heure de fin comprise dans la période de l'ensemble de données.
La formation utilise des libellés et des fonctionnalités basés sur des mois calendaires complets jusqu'au mois de la date de fin sélectionnée, mais sans l'inclure. Pour en savoir plus, consultez la section Plages temporelles des ensembles de données.
Une configuration de moteur créée à l'aide d'un ensemble de données cohérent:
Consultez la section Configurer un moteur.
Training output
L'entraînement génère une ressource de modèle, qui peut être utilisée pour effectuer les opérations suivantes:
- Créez des résultats de rétrotest, qui sont utilisés pour évaluer les performances du modèle à l'aide des vrais positifs actuellement connus.
- Créez des résultats de prédiction, qui seront utilisés lorsque vous serez prêt à commencer à examiner les nouvelles affaires pour détecter un éventuel blanchiment d'argent.
Les métadonnées du modèle contiennent la métrique missingness
, qui peut être utilisée pour évaluer la consistance de l'ensemble de données (par exemple, en comparant les valeurs de manque des familles d'éléments géographiques de différentes opérations).
Nom de la métrique | Description de la métrique | Exemple de valeur de métrique |
---|---|---|
Données manquantes |
Pourcentage de valeurs manquantes pour toutes les entités de chaque famille d'entités. Dans l'idéal, toutes les familles de fonctionnalités d'IA AML doivent avoir un taux de données manquantes proche de 0. Des exceptions peuvent se produire lorsque les données sous-jacentes à ces familles d'éléments ne sont pas disponibles pour l'intégration. Un changement significatif de cette valeur pour une famille de fonctionnalités entre le réglage, l'entraînement, l'évaluation et la prédiction peut indiquer une incohérence dans les ensembles de données utilisés. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Importance |
Métrique qui indique l'importance d'une famille de caractéristiques pour le modèle. Plus les valeurs sont élevées, plus l'utilisation de la famille de caractéristiques est importante dans le modèle. Une famille de caractéristiques qui n'est pas utilisée dans le modèle n'a aucune importance. Les valeurs d'importance peuvent être utilisées pour hiérarchiser les actions à effectuer en fonction des résultats de biais familiaux. Par exemple, une valeur de biais identique pour une famille plus importante pour le modèle doit être résolue plus rapidement. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "importanceValue": 459761000000, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "importanceValue": 27492, }, ], } |
Les métadonnées du modèle ne contiennent pas les métriques de rappel d'un ensemble de test. Pour générer des mesures de rappel pour une période spécifique (par exemple, l'ensemble de test), consultez Évaluer un modèle.