Comprendere l'ambito e la durata dei dati

L'AML AI è configurata per valutare il rischio di riciclaggio di denaro per una linea di business. Un'attività commerciale è associata a uno dei tuoi clienti commerciali o di vendita al dettaglio.

Quando crei un set di dati da utilizzare con un'unità di business, devi includere diverse tabelle. Ogni tabella deve coprire un intervallo di tempo sufficiente. Questa pagina fornisce una panoramica delle tabelle di cui avrai bisogno e mostra come determinare l'intervallo di tempo che ciascuna deve coprire.

Tabelle da utilizzare

Il set di dati BigQuery utilizzato con l'AI AML deve contenere le seguenti tabelle:

  • Parte: tutte le parti pertinenti per la LoB
    • LoB di vendita al dettaglio: tutti i clienti di servizi bancari al dettaglio che hanno aperto un conto in qualsiasi momento nell'intervallo di tempo richiesto
    • LoB commerciale: tutti i clienti bancari commerciali (persone giuridiche e fisiche) che hanno aperto un conto in qualsiasi momento nell'intervallo di tempo richiesto
  • AccountPartyLink: cronologia completa degli account posseduti dalle parti. Dovrebbe coprire tutti gli account per prodotti e servizi quando qualsiasi entità nella tabella Parti era il titolare dell'account principale in qualsiasi momento nell'intervallo di tempo richiesto.
  • Transazione: tutte le transazioni per gli account nella tabella AccountPartyLink per l'intervallo di tempo richiesto.
  • RiskCaseEvent: tutti gli eventi relativi alle segnalazioni di rischio (vedi i valori di tipo di evento) per qualsiasi segnalazione di rischio e parte nella tabella Party con un valore AML_PROCESS_START (inizio dell'indagine) nell'intervallo di tempo richiesto. Questa tabella può includere eventi con un orario precedente o successivo all'intervallo di tempo richiesto.
  • PartySupplementaryData: (se utilizzato) per valori particolari di party_supplementary_data_id da 0 a 100, includi una cronologia completa dei valori di questi campi per tutti i partiti nella tabella Party per l'intervallo di tempo richiesto.

Utilizzo di dati aggiuntivi

Consulta la sezione Dati supplementari se disponi di dati aggiuntivi sulle parti (non coperti in altro modo dallo schema) pertinenti per identificare il rischio di riciclaggio di denaro.

Intervallo di tempo del set di dati

L'intervallo di tempo che deve coprire qualsiasi tabella di un set di dati può essere calcolato come segue per qualsiasi operazione. Devi sapere:

  • L'ora di fine. Si tratta dell'ora più recente a partire dalla quale vengono utilizzate le etichette e i dati per generare funzionalità di ottimizzazione.
  • La versione del motore (vedi l'elenco delle versioni del motore) che utilizzerai.
  • L'operazione che eseguirai: ottimizzazione, addestramento, previsione o backtest.
  • Per le operazioni di previsione o di backtest, il numero di periodi per i quali eseguirai l'operazione, da specificare nella chiamata API.

Informazioni sulla durata dell'ambito dei dati

Innanzitutto, devi calcolare il numero di periodi che verranno utilizzati dall'operazione. Si tratta del numero di mesi consecutivi che terminano nell'ultimo mese di calendario completo precedente all'ora di fine specificata, per i quali l'AI AML valuterà le funzionalità del modello.

  • Per le operazioni di previsione e backtest, si tratta del numero di periodi di previsione o di backtest specificati nella chiamata API.
  • Per altre operazioni, dipende dalla versione del motore e dall'operazione. Ad esempio, le versioni del motore v004.004 utilizzano 18 periodi per l'ottimizzazione e 15 per la formazione.

A questo punto devi calcolare la finestra temporale per ogni tabella. Si tratta del numero massimo di mesi di dati necessari da quella tabella per consentire all'AI AML di calcolare le funzionalità del modello per un determinato periodo.

  • Ad esempio, per le versioni del motore v004.004, sono 13 mesi per le tabelle Transaction e AccountPartyLink, 12 mesi per la tabella RiskCaseEvent e 0 mesi per le tabelle Party e PartySupplementaryData.

Il set di dati dovrà coprire il periodo di tempo di tutti i periodi utilizzati dall'operazione scelta. Puoi calcolare il numero di mesi di calendario interi di dati precedenti all'ora di fine di cui avrai bisogno per una determinata operazione con la seguente formula:

  • numero di periodi + finestra temporale -1

Ad esempio, per le versioni del motore v004.00X che eseguono l'ottimizzazione, sono necessari:

  • 18 + 13 - 1 = 30 mesi di dati delle tabelle Transaction e AccountPartyLink,
  • 18 + 12 - 1 = 29 mesi di dati della tabella Eventi relativi ai casi di rischio, nonché eventuali eventi più recenti per i casi di rischio nella tabella,
  • Inoltre, 18 + 0 - 1 = 17 mesi di dati dalle tabelle Party e PartySupplementaryData.