Glosarium AML AI

Glosarium ini mendefinisikan istilah khusus untuk AML AI. Untuk istilah machine learning umum, lihat Glosarium Machine Learning.

B

pengujian data

Pengujian ulang menggunakan data historis untuk mengevaluasi performa (perolehan yang diamati) suatu model dengan membandingkan skor risiko yang dihasilkannya dengan hasil investigasi historis yang sebenarnya.

hasil backtest

Resource BacktestResult AML AI (juga dikenal sebagai "hasil backtest") dibuat untuk menguji performa model pada set data. Untuk mengetahui informasi selengkapnya, lihat Mengevaluasi model.

C

data perbankan inti

Data perbankan inti mencakup data pihak, transaksi, dan penyimpanan rekening. Fitur ini membantu AML AI memahami pelanggan dan aktivitas perbankan mereka untuk mendeteksi karakteristik dan perilaku yang berisiko.

periode waktu bagian tengah tubuh

Periode waktu inti mengacu pada rentang waktu yang digunakan dalam operasi AML AI (konfigurasi mesin, pelatihan, pengujian sebelumnya, dan prediksi) untuk menghasilkan pelatihan, contoh evaluasi, atau output model. Rentang waktu ini harus dicakup oleh semua tabel dalam set data.

Operasi API yang berbeda memiliki persyaratan yang berbeda pula dalam jangka waktu inti untuk membuat fitur dan label. Untuk mengetahui informasi selengkapnya, lihat Memahami cakupan dan durasi data.

D

dataset

Resource set data AML AI (atau hanya "set data") digunakan untuk menentukan data, yang sesuai dengan model data input AML, yang dapat digunakan dalam menghasilkan model, mengevaluasi performa model, dan menghasilkan skor risiko serta penjelasan per pihak. Untuk mengetahui informasi selengkapnya, lihat Memahami model dan persyaratan data AML.

validasi data

AML AI melakukan pemeriksaan validasi data saat membuat set data, konfigurasi mesin, model, hasil backtest, atau hasil prediksi. Jika set data yang ditentukan tidak lulus validasi data, resource tidak akan dibuat dan error validasi data akan muncul (menunjukkan sifat masalah). Untuk mengetahui informasi selengkapnya, lihat Error validasi data.

E

waktu berakhir

Operasi AML AI yang menggunakan set data mengharuskan Anda menentukan waktu berakhir. Kolom ini digunakan untuk mengontrol bulan mana dalam set data yang digunakan untuk membuat contoh pelatihan atau evaluasi, dan output model.

Waktu berakhir dan semua bulan yang digunakan untuk operasi harus berada dalam rentang tanggal set data terkait. Misalnya, operasi pelatihan memerlukan periode waktu inti selama 15 bulan. Jika Anda menggunakan set data dengan rentang tanggal dari 15 Oktober 2021 hingga 21 Mei 2023 dan waktu berakhir pada 12 April 2023, pelatihan menggunakan contoh dari bulan kalender Januari 2022 hingga Maret 2023, yang berada dalam rentang tanggal set data.

konfigurasi mesin

Resource EngineConfig AML AI (juga dikenal sebagai "konfigurasi mesin") menentukan parameter dalam membuat dan mengevaluasi model AML AI serta menghasilkan skor dan penjelasan risiko.

Beberapa parameter ini ditetapkan dalam panggilan API untuk membuat konfigurasi mesin, seperti versi mesin dan volume investigasi yang diharapkan. Parameter lain otomatis dihasilkan oleh AML AI menggunakan set data yang ditentukan, misalnya, hyperparameter yang disesuaikan. Untuk informasi selengkapnya, lihat Mengonfigurasi mesin.

versi mesin

Resource EngineVersion AML AI (juga dikenal sebagai "versi mesin") menentukan aspek cara AML AI mendeteksi risiko, yang mencakup penyesuaian, pelatihan, dan evaluasi model serta keseluruhan model data AML dan kelompok fitur.

Untuk mengonfigurasi mesin AML AI, Anda harus menentukan versi mesin yang akan digunakan. Versi mesin kemudian digunakan untuk melatih dan mengevaluasi model dengan konfigurasi mesin tersebut dan untuk menghasilkan skor risiko dan penjelasan.

Penamaan versi mesin disusun sebagai berikut, dengan jenis mesin yang menyatakan lini bisnis yang didukung, dan versi subjenis mesin, tuning, utama, dan versi minor akan diperbarui saat perilaku baru diterapkan. Versi contoh mencakup aml-retail.default.v004.000.202312-000 dan aml-Commercial.default.v004.000.202312-000.

Pembuatan versi mesin

Untuk informasi selengkapnya tentang mengelola versi mesin, lihat Mengelola versi mesin.

evaluasi

Lihat pengujian sebelumnya.

kemampuan menjelaskan

Model AML AI digunakan untuk mengidentifikasi pihak yang menunjukkan perilaku atau karakteristik dengan risiko pencucian uang yang tinggi. Penjelasan menunjukkan perilaku atau karakteristik mana yang paling berkontribusi pada skor risiko tinggi untuk pihak tertentu. Untuk mengetahui informasi selengkapnya, lihat Memahami output prediksi.

ekspor metadata

Beberapa resource AML AI menyimpan informasi tambahan terkait performa dan kualitas data yang dapat diakses menggunakan operasi metadata ekspor. Untuk mengetahui informasi selengkapnya, lihat model data output AML.

F

kelompok fitur

Kelompok fitur adalah kumpulan fitur ML terkait, yang memberikan kategorisasi sederhana yang dapat dipahami manusia sebagai informasi bagi penyelidik dan tim audit internal.

I

entity tidak dapat diubah

AML AI harus dapat membuat ulang tampilan data pada waktu yang berbeda untuk tuning, pelatihan, dan backtesting. Untuk mencapai hal ini, AML AI membedakan antara entity yang dapat berubah, yaitu entity yang dapat mengubah nilai dari waktu ke waktu, dan entity yang tidak dapat diubah, seperti peristiwa, yang setelah ada atau terjadi, tidak berubah secara wajar.

Dalam model data input AML, tabel yang merepresentasikan entity yang tidak dapat diubah tidak memiliki kolom validity_start_time dan is_entity_deleted. Ini termasuk tabel RiskCaseEvent. Untuk informasi selengkapnya, lihat Memahami perubahan data dari waktu ke waktu.

Lihat juga entity yang dapat berubah.

instance

Resource instance AML AI (juga dikenal sebagai "instance") berada di root semua resource AML AI lainnya dan harus dibuat sebelum Anda dapat menggunakan resource AML AI lainnya. Beberapa instance dapat dibuat di region yang sama dalam sebuah project. Untuk mengetahui informasi selengkapnya, lihat Membuat instance AML AI.

proses investigasi

Proses investigasi mencakup seluruh investigasi atau urutan investigasi yang dipicu oleh pemberitahuan. Prosesnya dimulai saat bagian pertama investigasi dimulai dan berakhir saat tidak ada hasil lebih lanjut yang diharapkan dari investigasi ini. Untuk mengetahui informasi selengkapnya, lihat Siklus proses kasus risiko.

L

lini bisnis (LOB)

Lini bisnis ini membedakan pelanggan perbankan retail dan komersial dalam AML AI. Set data, versi mesin, dan pendaftaran pihak ditautkan ke lini bisnis, retail, atau komersial tertentu.

operasi yang berjalan lama (LRO)

Beberapa operasi AML AI, termasuk konfigurasi mesin, pelatihan, pengujian kembali, dan prediksi, memulai operasi yang berjalan lama (LRO). Untuk informasi selengkapnya, lihat Mengelola operasi yang berjalan lama.

periode lihat balik

Selain periode waktu inti, operasi AML AI mengharuskan set data menyertakan periode lihat balik untuk memungkinkan pembuatan fitur yang melacak perilaku dari waktu ke waktu. Untuk mengetahui informasi selengkapnya, lihat Memahami cakupan dan durasi data.

M

Hilang

Metrik Hilangnya dihitung untuk semua kelompok fitur saat membuat resource AI AML berikut: konfigurasi mesin, model, hasil backtest, dan hasil prediksi.

Metrik ini menunjukkan pangsa nilai yang tidak ada di semua fitur dalam kelompok fitur. Perubahan signifikan pada "Tidak ada" untuk setiap kelompok fitur antara penyesuaian, pelatihan, evaluasi, dan prediksi dapat menunjukkan inkonsistensi dalam set data yang digunakan.

model

Resource Model AML AI (juga dikenal sebagai "model") mewakili model terlatih yang dapat digunakan untuk menghasilkan skor risiko dan penjelasan.

entitas yang dapat berubah

AML AI harus dapat membuat ulang tampilan data pada waktu yang berbeda untuk tuning, pelatihan, dan backtesting. Untuk mencapai hal ini, AML AI membedakan antara entity yang dapat mengubah nilai dari waktu ke waktu dan entity yang tidak dapat diubah, seperti peristiwa, yang jika ada atau terjadi, tidak akan berubah secara wajar.

Dalam model data input AML, tabel yang mewakili entity yang dapat berubah memiliki kolom validity_start_time dan is_entity_deleted. Hal ini termasuk tabel Party, AccountPartyLink, Transaksi, dan PartySupplementaryData. Untuk informasi selengkapnya, lihat Memahami perubahan data dari waktu ke waktu.

Lihat juga entitas yang tidak dapat diubah.

O

penarikan yang diamati

AML AI mengukur performa model pada data historis menggunakan metrik Recalld Recall.

Metrik ini menunjukkan proporsi pihak berlabel positif (misalnya, keluar pelanggan) dari periode yang dipilih yang akan diidentifikasi selama periode aktivitas yang mencurigakan sebagai berisiko tinggi oleh model yang dievaluasi.

P

pihak

Dalam model data input AML, salah satu pihak mewakili pelanggan bank. Pihak dapat berupa individu atau entitas hukum. Untuk informasi selengkapnya, lihat tabel Party. Lihat juga pihak yang terdaftar.

prediksi

Prediksi menggunakan model untuk menghasilkan skor risiko dan penjelasan yang dapat digunakan dalam proses investigasi AML Anda.

hasil prediksi

Resource PredictionsResult AML AI (juga dikenal sebagai "hasil prediksi") adalah hasil dari penggunaan model untuk membuat prediksi. Untuk mengetahui detail selengkapnya tentang cara membuat skor risiko dan penjelasan, serta cara menggunakannya dalam proses investigasi, lihat halaman di bagian Membuat skor risiko dan penjelasannya.

R

pihak terdaftar

Sebelum pihak dapat digunakan untuk membuat hasil prediksi (misalnya, skor risiko dan penjelasan risiko tingkat pihak), pihak tersebut harus terdaftar untuk lini bisnis yang sesuai.

kasus risiko

Kasus risiko mencakup proses investigasi atau sekelompok proses investigasi terkait untuk berbagai pihak.

Lihat tabel RiskCaseEvent.

data investigasi risiko

Data investigasi risiko digunakan oleh AML AI untuk memahami proses dan hasil investigasi risiko Anda dan untuk membuat label pelatihan.

skor risiko

Model AML AI digunakan untuk mengidentifikasi pihak yang menunjukkan perilaku atau karakteristik dengan risiko pencucian uang yang tinggi. Hal ini dilakukan melalui skor risiko.

Skor risiko bervariasi dari 0 hingga 1. Skor yang lebih tinggi menunjukkan risiko yang lebih tinggi. Namun, skor risiko tidak boleh ditafsirkan secara langsung sebagai kemungkinan aktivitas pencucian uang. Untuk mengetahui informasi selengkapnya, lihat Memahami output prediksi.

tipologi risiko

AML AI dapat mengidentifikasi risiko pencucian uang di lima tipologi risiko AML inti yang terkait dengan pemantauan transaksi.

Dengan penyelidikan yang memadai dan data pihak tambahan (lihat tabel Data tambahan), AML AI dapat mencakup lebih banyak tipologi.

S

data pelengkap

Data tambahan adalah data tambahan, di luar apa yang terdapat dalam area data perbankan inti dan data investigasi risiko dari skema AI ML, yang relevan dengan memprediksi risiko pencucian uang. Misalnya, Anda dapat mengidentifikasi dan menambahkan indikator risiko yang membantu model memprediksi tipologi risiko yang tidak tercakup dengan baik dengan lebih baik.

Data tambahan dapat ditambahkan ke set data menggunakan tabel PartySupplementaryData.

periode aktivitas mencurigakan

Periode aktivitas yang mencurigakan adalah periode waktu saat Anda meyakini bahwa pihak yang diselidiki menunjukkan perilaku yang mencurigakan. Hal ini digunakan dalam evaluasi model (misalnya, metrik recall untuk hasil backtest) untuk mengonfirmasi bahwa pelanggan berisiko tinggi diidentifikasi selama beberapa bulan saat mereka memiliki aktivitas yang mencurigakan. Untuk mengetahui informasi selengkapnya, lihat Siklus proses kasus risiko.

T

training

AML AI melakukan pelatihan sebagai bagian dari pembuatan model menggunakan hyperparameter (lihat tuning) dari konfigurasi mesin yang ditentukan.

penyesuaian

Penyesuaian adalah pengoptimalan hyperparameter model. AML AI melakukan penyesuaian sebagai bagian dari pembuatan konfigurasi mesin.

V

waktu mulai validitas

Waktu mulai validitas untuk entity yang dapat berubah digunakan oleh AML AI untuk membuat tampilan tentang hal yang diketahui oleh bank pada titik waktu tertentu. Hal ini memungkinkan AML AI secara akurat melatih model yang dapat digunakan kembali pada data terbaru (yaitu yang saat ini diketahui oleh bank) untuk menghasilkan skor risiko fidelitas tinggi. Waktu mulai validitas untuk baris tertentu menunjukkan waktu paling awal saat data dalam baris ini diketahui oleh bank dan benar. Untuk informasi selengkapnya, lihat Memahami perubahan data dari waktu ke waktu.