Glossario dell'IA AML

Questo glossario definisce i termini specifici dell'IA AML. Per i termini generali del machine learning, consulta il Glossario del machine learning.

A

ADC

Ciascuna delle librerie client API fornisce un mezzo per utilizzare le credenziali predefinite dell'applicazione (ADC) locali.

Per informazioni sulla differenza tra le credenziali ADC locali e quelle dell'interfaccia a riga della gcloud CLI, consulta Credenziali dell'interfaccia a riga di comando gcloud e credenziali ADC

B

backtesting
Il backtesting utilizza i dati storici per valutare il rendimento (riconoscimento osservato) di un modello confrontando il punteggio di rischio generato con i risultati effettivi delle indagini storiche.
risultati del backtest
Per testare le prestazioni di un modello su un set di dati, viene creata una risorsa BacktestResult di AML AI (nota anche come "risultati del backtest").
Per ulteriori informazioni, consulta Valutare un modello.

C

Dati di core banking
I
dati bancari di base includono dati su parti, transazioni e titoli di conto. Aiuta l'AI AML a comprendere i tuoi clienti e la loro attività bancaria per rilevare caratteristiche e comportamenti rischiosi.
Finestra temporale principale

La finestra temporale principale si riferisce all'intervallo di tempo utilizzato in un'operazione di IA AML (configurazione dell'engine, addestramento, backtesting e previsione) per generare esempi di addestramento, valutazione o output del modello. Questo intervallo di tempo deve essere coperto da tutte le tabelle del set di dati.

Le diverse operazioni dell'API hanno requisiti diversi per la finestra temporale principale per generare funzionalità ed etichette. Per ulteriori informazioni, consulta Informazioni sull'ambito e sulla durata dei dati.

Vedi anche finestra temporale.

D

convalida dei dati
L'AI AML esegue controlli di convalida dei dati durante la creazione di un set di dati, della configurazione dell'engine, del modello, dei risultati del backtest o dei risultati di previsione. Se il set di dati specificato non supera la convalida dei dati, la risorsa non viene creata e vengono generati errori di convalida dei dati (che indicano la natura del problema).
Per ulteriori informazioni, vedi Errori di convalida dei dati.
dataset

Una risorsa set di dati di AI AML (o semplicemente "set di dati") viene utilizzata per specificare i dati conformi al modello dei dati di input AML, che possono essere utilizzati per generare un modello, valutare il rendimento di un modello e generare punteggi di rischio e spiegabilità per interessato.

Per ulteriori informazioni, consulta Informazioni sul modello dei dati e sui requisiti AML.

E

end time

Le operazioni di IA AML che utilizzano un set di dati richiedono di specificare un'ora di fine. Questo campo viene utilizzato per controllare quali mesi del set di dati vengono utilizzati per generare esempi di addestramento o valutazione e output del modello.

L'ora di fine e tutti i mesi utilizzati per un'operazione devono rientrare nell'intervallo di date del set di dati associato.

Ad esempio, un'operazione di addestramento richiede una finestra temporale principale di 15 mesi. Se utilizzi un set di dati con un intervallo di date compreso tra il 15 ottobre 2021 e il 21 maggio 2023 e un'ora di fine pari al 12 aprile 2023, l'addestramento utilizza esempi dei mesi di calendario da gennaio 2022 a marzo 2023, che rientrano nell'intervallo di date del set di dati.

engine config

Una risorsa EngineConfig di AML AI (nota anche come "configurazione dell'engine") specifica i parametri per la generazione e la valutazione di un modello AML AI, nonché per la generazione di punteggi di rischio e di esplicabilità.

Alcuni di questi parametri vengono specificati nella chiamata API per creare un'impostazione motore, ad esempio la versione del motore e il volume di indagini previsto. Altri parametri vengono generati automaticamente dall'IA AML utilizzando un set di dati specificato, ad esempio gli iperparametri ottimizzati.

Per saperne di più, consulta Configurare un motore.

versione del motore

Una risorsa EngineVersion dell'AI AML (nota anche come "versione del motore") definisce aspetti del modo in cui l'AI AML rileva il rischio, che include l'ottimizzazione, l'addestramento e la valutazione del modello, nonché il modello dei dati AML complessivo e le famiglie di funzionalità.

La configurazione di un motore AI AML richiede di specificare una versione del motore da utilizzare. La versione del motore viene poi impiegata per addestrare e valutare i modelli con la relativa configurazione e per generare punteggi di rischio e spiegabilità.

La denominazione delle versioni dell'engine è strutturata come segue, con il tipo di engine che esprime la linea di business supportata e il sottotipo di engine, la messa a punto, la versione principale e la versione secondaria aggiornate man mano che vengono implementati nuovi comportamenti.

Ecco alcuni esempi di versioni:

  • aml-retail.default.v004.000.202312-000
  • aml-commercial.default.v004.000.202312-000
Controllo delle versioni del motore

Per saperne di più sulla gestione delle versioni del motore, consulta Gestire le versioni del motore.

valutazione

Vedi anche backtesting.

Esplicabilità

I modelli AML AI vengono utilizzati per identificare le parti che mostrano comportamenti o caratteristiche con un rischio elevato di riciclaggio di denaro. L'esplicabilità indica quali comportamenti o caratteristiche hanno contribuito maggiormente a un punteggio di rischio elevato per una determinata parte.

Per ulteriori informazioni, consulta Informazioni sugli output di previsione.

Vedi anche previsione.

esportare i metadati

Diverse risorse di IA AML memorizzano informazioni aggiuntive relative al rendimento e alla qualità dei dati a cui è possibile accedere utilizzando l'operazione di esportazione dei metadati.

Per ulteriori informazioni, consulta Modello dei dati di output AML.

V

feature family
Le famiglie di elementi sono raccolte di elementi di ML correlati, che forniscono una classificazione semplice e comprensibile per informare gli investigatori e i team di revisione interna.

I

entità immutabile

L'AI AML deve essere in grado di ricreare visualizzazioni dei dati in diversi momenti per l'ottimizzazione, l'addestramento e il backtesting. Per ottenere questo risultato, l'AI AML distingue le entità mutabili (che possono cambiare valore nel tempo) dalle entità immutabili (che non cambiano).

Ad esempio, un'entità mutabile potrebbe essere il saldo del tuo conto corrente, che può cambiare nel tempo, mentre un'entità immutabile potrebbe essere un evento, come il prelievo di 50 $il 2 luglio 2024 alle 00:00:00 dal tuo conto corrente, che non cambia poiché si tratta di uno snapshot nel tempo.

Nel modello dei dati di input AML, le tabelle che rappresentano entità immutabili non hanno i campi validity_start_time e is_entity_deleted. È inclusa la tabella RiskCaseEvent.

Per ulteriori informazioni, vedi Informazioni sulle variazioni dei dati nel tempo.

Vedi anche entità mutabile.

instance

Una risorsa istanza AML AI (nota anche come "istanza") si trova alla radice di tutte le altre risorse AML AI e deve essere creata prima di poter utilizzare altre risorse AML AI. È possibile creare più istanze nella stessa regione all'interno di un progetto.

Per ulteriori informazioni, consulta Creare un'istanza AML AI.

procedura di indagine

Un processo di indagine copre l'intera indagine o sequenza di indagini attivate da un avviso. Il processo inizia quando viene avviata la prima parte di un'indagine e termina quando non sono previsti ulteriori risultati da questa indagine.

Per ulteriori informazioni, consulta la sezione Ciclo di vita di una richiesta relativa a rischi.

L

LOB
La linea di business (LOB) distingue i clienti bancari retail e commerciali nell'IA AML. I set di dati, le versioni del motore e la registrazione delle parti sono collegati a una specifica attività commerciale, di vendita al dettaglio o commerciale.
Finestra temporale

Oltre alla finestra temporale principale, le operazioni di IA AML richiedono che i set di dati includano una finestra di panoramica per consentire la generazione di funzionalità che monitorano il comportamento nel tempo.

Per ulteriori informazioni, consulta Informazioni sull'ambito e sulla durata dei dati.

LRO

Diverse operazioni di AML AI, tra cui configurazione dell'engine, addestramento, backtesting e previsione, avviano un'operazione a lunga esecuzione (LRO).

Per ulteriori informazioni, consulta Gestire le operazioni che richiedono molto tempo.

M

Mancanza

La metrica di mancanza viene calcolata per tutte le famiglie di funzionalità durante la creazione delle seguenti risorse di AI AML: configurazione dell'engine, modello, risultati del backtest e risultati di previsione.

Questa metrica mostra la percentuale di valori mancanti in tutte le funzionalità di una famiglia di funzionalità. Una variazione significativa dell'assenza per qualsiasi famiglia di funzionalità tra ottimizzazione, addestramento, valutazione e previsione può indicare incoerenza nei set di dati utilizzati.

model

Una risorsa modello di IA AML (nota anche come "modello") rappresenta un modello addestrato che può essere utilizzato per generare punteggi di rischio e spiegabilità.

entità mutabile

L'AI AML deve essere in grado di ricreare visualizzazioni dei dati in diversi momenti per l'ottimizzazione, l'addestramento e il backtesting. Per ottenere questo risultato, l'AI AML distingue le entità mutabili (che possono cambiare valore nel tempo) dalle entità immutabili (che non cambiano).

Ad esempio, un'entità mutabile potrebbe essere il saldo del tuo conto corrente, che può cambiare nel tempo, mentre un'entità immutabile potrebbe essere un evento, come il prelievo di 50 $il 2 luglio 2024 alle 00:00:00 dal tuo conto corrente, che non cambia poiché si tratta di uno snapshot nel tempo.

Nel modello dei dati di input AML, le tabelle che rappresentano entità mutevoli hanno i campi validity_start_time e is_entity_deleted. Sono incluse le tabelle Party, AccountPartyLink, Transaction e PartySupplementaryData.

Per ulteriori informazioni, vedi Informazioni sulle variazioni dei dati nel tempo.

Vedi anche entità immutabile.

O

ricordo-osservato

L'IA AML misura le prestazioni del modello sui dati storici utilizzando la metrica Recall osservato.

Questa metrica mostra la proporzione di parti con etichetta positiva (ad es. abbandoni dei clienti) di un periodo selezionato che sarebbero state identificate come ad alto rischio durante un periodo di attività sospette dal modello in fase di valutazione.

P

festa

Nel modello dei dati di input AML, una parte rappresenta un cliente della banca. Una parte può essere una persona fisica o una persona giuridica.

Per ulteriori informazioni, consulta la tabella Partito.

Vedi anche parte registrata.

previsione

La previsione consiste nell'utilizzare un modello per generare punteggi di rischio e esplicabilità che possono essere utilizzati nella procedura di indagine AML.

risultati di previsione

Una risorsa PredictionResult di IA AML (nota anche come "risultati di previsione") è il risultato dell'utilizzo di un modello per creare le previsioni.

Per ulteriori dettagli su come generare punteggi di rischio e spiegabilità, nonché su come utilizzarli nella procedura di indagine, consulta le pagine della sezione Generare punteggi di rischio e spiegabilità.

R

Partito registrato
Prima che un partito possa essere utilizzato per creare risultati di previsione (ad esempio, punteggi di rischio e spiegabilità a livello di partito), il partito deve essere registrato per la linea di business corrispondente.
Caso di rischio

Una richiesta di rischio riguarda una procedura di indagine o un gruppo di procedure di indagine correlate per parti diverse.

Consulta la tabella RiskCaseEvent.

Dati relativi alle indagini sui rischi

I dati delle indagini sui rischi vengono utilizzati dall'AI AML per comprendere la procedura e i risultati delle indagini sui rischi e per generare etichette di addestramento.

punteggio di rischio

I modelli AML AI vengono utilizzati per identificare le parti che mostrano comportamenti o caratteristiche con un rischio elevato di riciclaggio di denaro. Ciò avviene tramite un punteggio di rischio.

I punteggi di rischio variano da 0 a 1. Un punteggio più alto indica un rischio maggiore. Tuttavia, gli score di rischio non devono essere interpretati direttamente come probabilità di attività di lavaggio di denaro.

Per ulteriori informazioni, consulta Informazioni sugli output di previsione.

tipologia di rischio

L'AML AI può identificare il rischio di riciclaggio di denaro in cinque principali tipologie di rischio AML relative al monitoraggio delle transazioni.

Con dati sufficienti delle parti e dati supplementari (vedi le tabelle Dati supplementari), l'IA AML può coprire più tipologie.

S

Dati supplementari

I dati supplementari sono dati aggiuntivi, oltre a quelli contenuti nelle aree core banking e dati di indagine sui rischi dello schema AML AI, pertinenti alla previsione del rischio di riciclaggio di denaro.

Ad esempio, potresti identificare e aggiungere un indicatore di rischio che aiuti i modelli a predire meglio una tipologia di rischio che altrimenti non è ben coperta.

I dati supplementari possono essere aggiunti a un set di dati utilizzando la tabella PartySupplementaryData.

periodo di attività sospetta

Un periodo di attività sospette è un periodo di tempo in cui ritieni che una parte indagata abbia mostrato un comportamento sospetto. Viene utilizzato nella valutazione del modello (ad esempio, la metrica di richiamo per i risultati del backtest) per confermare che i clienti ad alto rischio vengono identificati nei mesi in cui hanno avuto attività sospette.

Per ulteriori informazioni, consulta la sezione Ciclo di vita di una richiesta relativa a rischi.

T

formazione
L'AML AI esegue l'addestramento nell'ambito della creazione di un modello utilizzando gli iperparametri (vedi ottimizzazione) da una configurazione dell'engine specificata.
tuning
L'ottimizzazione è l'ottimizzazione degli iperparametri del modello. L'AI AML esegue l'ottimizzazione durante la creazione di una configurazione del motore.

V

validity start time

L'ora di inizio della validità di un'entità mutabile viene utilizzata dall'AI AML per creare una visualizzazione di ciò che era noto alla banca in un determinato momento. In questo modo, l'IA AML può addestrare con precisione modelli che possono essere riutilizzati sui dati più recenti (ovvero quelli noti alla banca) per produrre punteggi di rischio ad alta fedeltà.

L'ora di inizio della validità per una determinata riga rappresenta la prima ora in cui la banca ha conosciuto i dati contenuti in questa riga e li ha ritenuti corretti.

Per ulteriori informazioni, vedi Informazioni sulle variazioni dei dati nel tempo.