Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
AML AI disiapkan untuk menilai risiko pencucian uang untuk satu
lini bisnis. LoB dikaitkan dengan salah satu pelanggan retail atau
komersial Anda.
Saat membuat set data untuk digunakan dengan LoB, Anda harus menyertakan beberapa tabel. Setiap tabel harus mencakup rentang waktu yang memadai. Halaman ini memberikan ringkasan tabel yang akan Anda perlukan dan menunjukkan cara menentukan rentang waktu yang harus dicakup oleh setiap tabel.
Tabel yang akan digunakan
Set data BigQuery yang digunakan dengan AML AI harus berisi tabel berikut:
Pihak: Semua pihak yang relevan dengan LoB tersebut
LoB Retail: Semua pelanggan perbankan retail yang telah memiliki akun pada
waktu kapan pun dalam rentang waktu yang diperlukan
LoB Komersial: Semua pelanggan perbankan komersial (entitas badan hukum dan
perorangan) yang telah memiliki akun kapan saja dalam rentang waktu yang diperlukan
AccountPartyLink: Histori lengkap akun yang dimiliki oleh pihak mana. Hal ini harus mencakup semua akun untuk produk dan
layanan jika pihak mana pun dalam tabel Pihak adalah pemegang akun utama pada
waktu kapan pun dalam rentang waktu yang diperlukan.
Transaksi: Semua transaksi untuk akun dalam
tabel AccountPartyLink untuk rentang waktu yang diperlukan.
RiskCaseEvent: Semua peristiwa kasus risiko (lihat nilai jenis peristiwa) untuk setiap kasus risiko dan pihak dalam tabel Pihak dengan AML_PROCESS_START (awal investigasi) dalam rentang waktu yang diperlukan. Tabel ini
dapat menyertakan peristiwa yang memiliki waktu peristiwa lebih awal atau lebih lama dari
rentang waktu yang diperlukan.
PartySupplementaryData: (Jika digunakan) Untuk 0 hingga 100 nilai
party_supplementary_data_id unik, sertakan histori lengkap nilai
kolom ini untuk semua pihak dalam tabel Pihak untuk rentang waktu yang diperlukan.
Menggunakan data tambahan
Lihat Data tambahan jika Anda memiliki data tambahan tentang pihak
(yang tidak tercakup dalam skema) yang relevan untuk mengidentifikasi risiko
pencucian uang.
Rentang waktu set data
Rentang waktu yang harus dicakup oleh tabel dalam set data dapat dihitung sebagai berikut untuk operasi tertentu. Anda perlu mengetahui:
Waktu berakhir. Ini adalah waktu terbaru saat label digunakan dan data digunakan untuk menghasilkan fitur untuk penyesuaian.
Operasi yang akan Anda lakukan: menyesuaikan, melatih, memprediksi, atau melakukan pengujian balik.
Untuk operasi prediksi atau uji coba balik, jumlah periode yang akan Anda gunakan untuk melakukan operasi, yang akan ditentukan dalam panggilan API.
Pertama, Anda harus menghitung jumlah periode yang akan digunakan operasi. Ini adalah
jumlah bulan berturut-turut yang berakhir pada bulan kalender penuh terakhir sebelum
waktu akhir yang ditentukan, yang akan dievaluasi oleh AML AI untuk fitur model.
Untuk operasi prediksi dan uji coba balik, ini adalah jumlah periode prediksi atau periode uji coba balik yang ditentukan dalam panggilan API.
Untuk operasi lainnya, hal ini bergantung pada Versi Mesin dan operasi.
Misalnya, Versi Mesin v004.004 menggunakan 18 periode untuk penyesuaian dan 15 untuk
pelatihan.
Selanjutnya, Anda harus menentukan periode lihat balik untuk setiap tabel. Ini adalah jumlah maksimum
bulan data yang diperlukan dari tabel tersebut agar AI AML dapat menghitung fitur
model selama jangka waktu tertentu.
Misalnya, untuk Versi Mesin v004.004, periode ini adalah 13 bulan untuk tabel Transaction dan AccountPartyLink, 12 bulan untuk tabel RiskCaseEvent, dan 0 bulan untuk tabel Party dan PartySupplementaryData.
Set data harus mencakup periode lihat balik untuk semua periode yang digunakan
oleh operasi yang dipilih. Anda dapat menghitung jumlah data bulan kalender penuh
sebelum waktu akhir yang diperlukan untuk operasi tertentu dengan
formula berikut:
jumlah periode + periode lihat balik -1
Misalnya, untuk Versi Mesin v004.00X yang melakukan penyesuaian, Anda memerlukan:
18 + 13 - 1 = 30 bulan data dari tabel Transaction dan AccountPartyLink,
18 + 12 - 1 = 29 bulan data dari tabel Peristiwa Kasus Risiko serta
peristiwa terbaru untuk kasus risiko dalam tabel,
Dan 18 + 0 - 1 = 17 bulan data dari tabel Party dan PartySupplementaryData.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-09-01 UTC."],[[["\u003cp\u003eAML AI assesses money laundering risk for a specific Line of Business (LoB), associated with either retail or commercial customers.\u003c/p\u003e\n"],["\u003cp\u003eCreating a dataset for AML AI requires including several tables: Party, AccountPartyLink, Transaction, RiskCaseEvent, and optionally PartySupplementaryData, each with defined content requirements.\u003c/p\u003e\n"],["\u003cp\u003eThe required time range for each table in the dataset is determined by the operation type (tune, train, predict, or backtest), the engine version, the end time, the number of periods, and the lookback window specific to each table.\u003c/p\u003e\n"],["\u003cp\u003eFor predict and backtest operations, the number of periods is defined in the API call, while for other operations, it is determined by the engine version.\u003c/p\u003e\n"],["\u003cp\u003eFor v004.00X Engine Versions conducting tuning, the dataset will need 30 months of data from Transaction and AccountPartyLink, 29 months from Risk Case Events and 17 from Party and PartySupplementaryData tables, at minimum.\u003c/p\u003e\n"]]],[],null,["# Understand data scope and duration\n\nAML AI is set up to assess money laundering risk for one\n[line of business](/financial-services/anti-money-laundering/docs/concepts/glossary#lob). An LoB is associated with one of your retail or\ncommercial customers.\n\nWhen creating a dataset for use with an LoB, you will need to include several\ntables. Each table should cover a sufficient time range. This page gives an\noverview of the tables you will need and shows how to determine the time range\nthat each should cover.\n\nTables to use\n-------------\n\nThe BigQuery dataset used with AML AI should contain the following tables:\n\n- **[Party](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#party)** : All parties relevant to that LoB\n - **Retail LoB**: All retail banking customers that have held accounts at any point in the required time range\n - **Commercial LoB**: All commercial banking customers (legal and natural entities) that have held accounts at any point in the required time range\n- **[AccountPartyLink](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#accountpartylink)**: Full history of which accounts were held by which parties. This should cover all accounts for products and services when any party in the Party table was the primary account holder at any point in the required time range.\n- **[Transaction](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#transaction)**: All transactions for accounts in the AccountPartyLink table for the required time range.\n- **[RiskCaseEvent](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#riskcaseevent)**: All risk case events (see event type values) for any risk case and party in the Party table with an AML_PROCESS_START (start of investigation) in the required time range. This table may include events that have an event time earlier or later than the required time range.\n- **[PartySupplementaryData](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#partysupplementarydata)**: (If used) For 0 to 100 unique party_supplementary_data_id values, include a full history of the values of these fields for all parties in the Party table for the required time range.\n\nUsing additional data\n---------------------\n\nSee [Supplementary data](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#supplementary-data-tables) if you have additional data on parties\n(not otherwise covered in the schema) that is relevant to identifying money\nlaundering risk.\n\nDataset time range\n------------------\n\nThe time range that any table in a dataset should cover can be worked out as\nfollows for any given operation. You will need to know:\n\n- The end time. This is the latest time from which labels are used and from which data is used to generate features for tuning.\n- The Engine Version (See [list of engine versions](/financial-services/anti-money-laundering/docs/private/engine-versions)) you will use.\n- The operation you will conduct: tune, train, predict or backtest.\n- For predict or backtest operations, the number of periods for which you will conduct the operation, to be specified in the API call.\n\nFirst you should work out the number of periods the operation will use. This is\nthe number of consecutive months ending in the last full calendar month prior to\nthe specified end time, for which AML AI will evaluate model features.\n\n- For predict and backtest operations, this is the number of prediction periods or backtest periods specified in the API call.\n- For other operations this depends on the Engine Version and the operation. For example, v004.004 Engine Versions use 18 periods for tuning and 15 for training.\n\nNext you should work out the lookback window for each table. This is the maximum\nnumber of months of data needed from that table for AML AI to calculate model\nfeatures for a given period.\n\n- For example, for v004.004 Engine Versions, this is 13 months for Transaction and AccountPartyLink tables, 12 months for the RiskCaseEvent table and 0 months for Party and PartySupplementaryData tables.\n\nThe dataset will need to cover the lookback window for all of the periods used\nby the chosen operation. You can calculate the number of full calendar months of\ndata prior to the end time that you will need for a given operation with the\nfollowing formula:\n\n- **number of periods + lookback window -1**\n\nFor example, for v004.00X Engine Versions conducting tuning, you require:\n\n- 18 + 13 - 1 = 30 months of data from the Transaction and AccountPartyLink tables,\n- 18 + 12 - 1 = 29 months of data from the Risk Case Events table as well as any more recent events for risk cases in the table,\n- And 18 + 0 - 1 = 17 months of data from the Party and PartySupplementaryData tables."]]