Umfang und Dauer der Daten

AML AI ist so eingerichtet, dass das Geldwäscherisiko für eine Branche bewertet wird. Eine Geschäftseinheit ist mit einem Ihrer Einzelhändler oder Geschäftskunden verknüpft.

Wenn Sie einen Datensatz für die Verwendung mit einer Fachabteilung erstellen, müssen Sie mehrere Tabellen angeben. Jede Tabelle sollte einen ausreichenden Zeitraum abdecken. Auf dieser Seite finden Sie einen Überblick über die benötigten Tabellen und erfahren, wie Sie den Zeitraum für jede Tabelle festlegen.

Zu verwendende Tabellen

Das BigQuery-Dataset, das mit AML AI verwendet wird, sollte die folgenden Tabellen enthalten:

  • Partei: Alle für diese Geschäftseinheit relevanten Parteien
    • Retail LoB: Alle Privatkunden, die im angegebenen Zeitraum Konten hatten
    • Commercial LoB: Alle Kunden des kommerziellen Bankgewerbes (Rechtssubjekte und natürliche Personen), die in dem erforderlichen Zeitraum Konten hatten
  • AccountPartyLink: Vollständiger Verlauf, welche Konten von welchen Parteien gehalten wurden. Dies sollte alle Konten für Produkte und Dienstleistungen abdecken, wenn eine Partei in der Tabelle „Party“ zu irgendeinem Zeitpunkt im erforderlichen Zeitraum der Hauptkontoinhaber war.
  • Transaktion: Alle Transaktionen für Konten in der Tabelle „AccountPartyLink“ für den angegebenen Zeitraum.
  • RiskCaseEvent: Alle Risikofallereignisse (siehe Ereignistypwerte) für jeden Risikofall und jede Partei in der Tabelle „Party“ mit einem AML_PROCESS_START (Beginn der Prüfung) im erforderlichen Zeitraum. Diese Tabelle kann Ereignisse enthalten, deren Ereigniszeit vor oder nach dem erforderlichen Zeitraum liegt.
  • PartySupplementaryData: (falls verwendet) Geben Sie für 0 bis 100 eindeutige Werte für „party_supplementary_data_id“ einen vollständigen Verlauf der Werte dieser Felder für alle Parteien in der Tabelle „Party“ für den erforderlichen Zeitraum an.

Zusätzliche Daten verwenden

Weitere Informationen finden Sie unter Ergänzende Daten, wenn Sie zusätzliche Daten zu den Parteien haben (die im Schema nicht anderweitig abgedeckt sind), die für die Identifizierung des Risikos von Geldwäsche relevant sind.

Zeitspanne des Datensatzes

Der Zeitraum, den eine Tabelle in einem Datensatz abdecken sollte, kann für jeden Vorgang so ermittelt werden: Sie benötigen folgende Informationen:

  • Die Endzeit. Das ist das Datum, ab dem Labels und Daten zum Generieren von Funktionen für die Optimierung verwendet werden.
  • Die von Ihnen verwendete Engine-Version (siehe Liste der Engine-Versionen).
  • Die durchzuführende Operation: Optimieren, trainieren, vorhersagen oder Backtest
  • Bei Vorhersage- oder Backtest-Vorgängen muss im API-Aufruf die Anzahl der Zeiträume angegeben werden, für die der Vorgang ausgeführt werden soll.

Dauer des Datenumfangs

Bestimmen Sie zuerst die Anzahl der Zeiträume, die für die Operation verwendet werden sollen. Das ist die Anzahl der aufeinanderfolgenden Monate, die mit dem letzten vollen Kalendermonat vor dem angegebenen Endzeitpunkt enden und für die die AML-KI die Modellfunktionen bewertet.

  • Bei Vorhersage- und Backtest-Vorgängen ist dies die Anzahl der im API-Aufruf angegebenen Vorhersage- oder Backtestzeiträume.
  • Bei anderen Vorgängen hängt dies von der Engine-Version und dem Vorgang ab. Bei der Engine-Version v004.004 werden beispielsweise 18 Perioden für die Optimierung und 15 für das Training verwendet.

Als Nächstes sollten Sie das Lookback-Window für jede Tabelle ermitteln. Das ist die maximale Anzahl von Monaten an Daten aus dieser Tabelle, die für die AML-KI erforderlich sind, um Modellmerkmale für einen bestimmten Zeitraum zu berechnen.

  • Bei der Engine-Version v004.004 sind das beispielsweise 13 Monate für die Tabellen „Transaction“ und „AccountPartyLink“, 12 Monate für die Tabelle „RiskCaseEvent“ und 0 Monate für die Tabellen „Party“ und „PartySupplementaryData“.

Der Datensatz muss das Rückschaufenster für alle Zeiträume abdecken, die für den ausgewählten Vorgang verwendet werden. Mit der folgenden Formel können Sie die Anzahl der vollständigen Kalendermonate mit Daten vor dem Endzeitpunkt berechnen, die Sie für einen bestimmten Vorgang benötigen:

  • Anzahl der Zeiträume + Lookback-Window – 1

Für die Optimierung von Engine-Versionen vom Typ v004.00X benötigen Sie beispielsweise:

  • 18 + 13 − 1 = 30 Monate Daten aus den Tabellen „Transaction“ und „AccountPartyLink“,
  • 18 + 12 − 1 = 29 Monate Daten aus der Tabelle „Ereignisse für Risikofälle“ sowie alle neueren Ereignisse für Risikofälle in der Tabelle,
  • Und 18 + 0 - 1 = 17 Monate Daten aus den Tabellen „Party“ und „PartySupplementaryData“.