Questa pagina illustra brevemente i concetti alla base dell'addestramento dei modelli. Una risorsa di modello di IA AML rappresenta un modello addestrato che può essere utilizzato per generare punteggi di rischio e spiegabilità.
Quando eseguire l'addestramento o il nuovo addestramento
L'IA AML addestra un modello durante la creazione di una risorsa modello. Il modello deve essere addestrato prima di poter essere valutato (ovvero sottoposto a backtest) o utilizzato per generare risultati di previsione.
Per ottenere le migliori prestazioni e mantenere i modelli più aggiornati, valuta la possibilità di eseguire un nuovo addestramento mensile. Tuttavia, una determinata versione del motore supporta la generazione di risultati di previsione per 12 mesi dal rilascio di una versione secondaria più recente del motore.
Come allenarsi
Per addestrare un modello (ovvero crearlo), consulta Creare e gestire i modelli.
In particolare, devi selezionare quanto segue:
I dati da utilizzare per l'addestramento:
Specifica un set di dati e un'ora di fine nell'intervallo di date del set di dati.
L'addestramento utilizza etichette e funzionalità basate su mesi solari completi fino al mese dell'ora di fine selezionata, escluso. Per ulteriori informazioni, consulta la sezione Intervalli di tempo dei set di dati.
Una configurazione del motore creata utilizzando un set di dati coerente:
Vedi Configurare un motore.
Output formazione
L'addestramento genera una risorsa modello, che può essere utilizzata per:
- Creare risultati di backtest, che vengono utilizzati per valutare le prestazioni del modello utilizzando i veri positivi attualmente noti
- Creare risultati di previsione, che vengono utilizzati quando è tutto pronto per iniziare a esaminare le nuove segnalazioni di potenziali casi di riciclaggio di denaro
I
metadati del modello
contengono la metrica missingness
, che può essere utilizzata per valutare la
coerenza del set di dati
(ad esempio, confrontando i valori di mancanza delle famiglie di funzionalità di
diverse operazioni)
Nome metrica | Descrizione della metrica | Valore della metrica di esempio |
---|---|---|
Mancanza di dati |
Percentuale di valori mancanti in tutte le funzionalità di ogni famiglia di funzionalità. Idealmente, tutte le famiglie di funzionalità di IA AML dovrebbero avere un valore di mancante prossimo a 0. Potrebbero verificarsi eccezioni se i dati alla base di queste famiglie di funzionalità non sono disponibili per l'integrazione. Una variazione significativa di questo valore per qualsiasi famiglia di funzionalità tra ottimizzazione, addestramento, valutazione e previsione può indicare incoerenza nei set di dati utilizzati. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Importanza |
Una metrica che mostra l'importanza di una famiglia di funzionalità per il modello. Valori più alti indicano un utilizzo più significativo della famiglia di funzionalità nel modello. Una famiglia di funzionalità non utilizzata nel modello ha un'importanza pari a zero. I valori di importanza possono essere utilizzati per dare la priorità all'intervento in base ai risultati relativi allo scostamento del gruppo. Ad esempio, lo stesso valore di asimmetria per una famiglia con maggiore importanza per il modello è più urgente da risolvere. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "importanceValue": 459761000000, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "importanceValue": 27492, }, ], } |
I metadati del modello non contengono metriche di richiamo di un set di test. Per generare misurazioni del recupero per un periodo di tempo specifico (ad esempio il set di test), consulta Valutare un modello.