Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Halaman ini membahas konsep di balik pelatihan model secara singkat. Resource model
AML AI mewakili model terlatih yang dapat digunakan untuk menghasilkan skor
risiko dan kemampuan menjelaskan.
Kapan harus melatih atau melatih ulang
AML AI melatih model sebagai bagian dari pembuatan
Resource model. Model
harus dilatih sebelum dapat dievaluasi (yaitu, diuji balik) atau digunakan untuk
menghasilkan hasil prediksi.
Untuk performa terbaik dan mempertahankan model terbaru, pertimbangkan
pelatihan ulang bulanan. Namun, versi mesin tertentu mendukung pembuatan
hasil prediksi selama 12 bulan sejak
rilis versi mesin minor yang lebih baru.
Tentukan set data dan waktu akhir dalam rentang tanggal set data.
Pelatihan menggunakan label dan fitur berdasarkan bulan kalender lengkap hingga,
tetapi tidak termasuk, bulan waktu akhir yang dipilih. Untuk mengetahui informasi selengkapnya,
lihat
Rentang waktu set data.
Pelatihan menghasilkan
Resource model, yang dapat
digunakan untuk melakukan hal berikut:
Membuat hasil pengujian balik, yang digunakan untuk mengevaluasi performa model menggunakan
positif benar yang saat ini diketahui
Membuat hasil prediksi, yang digunakan setelah Anda siap untuk mulai
meninjau kasus baru untuk potensi pencucian uang
Metadata model berisi metrik missingness, yang dapat digunakan untuk menilai konsistensi set data (misalnya, dengan membandingkan nilai ketidaklengkapan keluarga fitur dari operasi yang berbeda)
Nama metrik
Deskripsi metrik
Contoh nilai metrik
Ketidaklengkapan
Pangsa nilai yang tidak ada di semua fitur dalam setiap keluarga fitur.
Idealnya, semua keluarga fitur AI AML harus memiliki
Missingness mendekati 0. Pengecualian dapat terjadi jika data yang mendasari
keluarga fitur tersebut tidak tersedia untuk integrasi.
Perubahan yang signifikan pada nilai ini untuk setiap keluarga fitur antara penyesuaian,
pelatihan, evaluasi, dan prediksi dapat menunjukkan inkonsistensi dalam
set data yang digunakan.
Metrik yang menunjukkan pentingnya keluarga fitur terhadap model. Nilai yang lebih tinggi menunjukkan penggunaan keluarga fitur yang lebih signifikan dalam model. Keluarga fitur yang tidak digunakan dalam model tidak memiliki kepentingan.
Nilai penting dapat digunakan saat memprioritaskan tindakan berdasarkan hasil kemiringan keluarga. Misalnya, nilai skew yang sama untuk keluarga dengan tingkat kepentingan yang lebih tinggi terhadap model lebih mendesak untuk diselesaikan.
Metadata model tidak berisi metrik recall dari set pengujian. Untuk membuat
pengukuran recall selama jangka waktu tertentu (misalnya, set pengujian), lihat
Mengevaluasi model.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-09-01 UTC."],[[["\u003cp\u003eAML AI model training creates a Model resource that can generate risk scores and provide explainability.\u003c/p\u003e\n"],["\u003cp\u003eModel training is necessary before evaluation (backtesting) or generating prediction results, and monthly retraining is recommended for optimal performance.\u003c/p\u003e\n"],["\u003cp\u003eTraining involves selecting a dataset with a specified end time and an engine configuration based on a consistent dataset.\u003c/p\u003e\n"],["\u003cp\u003eThe training process outputs a Model resource that facilitates creating backtest results for performance evaluation and prediction results for reviewing potential money laundering cases.\u003c/p\u003e\n"],["\u003cp\u003eModel metadata includes the \u003ccode\u003emissingness\u003c/code\u003e metric to assess dataset consistency and an importance metric that indicates the influence of a feature family on the model, which is available for specific engine versions.\u003c/p\u003e\n"]]],[],null,["# Generate a model\n\nThis page briefly covers concepts behind model training. An AML AI\nmodel resource represents a trained model that can be used to generate risk\nscores and explainability.\n\nWhen to train or re-train\n-------------------------\n\nAML AI trains a model as part of creating a\n[Model resource](/financial-services/anti-money-laundering/docs/reference/rest/v1/projects.locations.instances.models). The model\nmust be trained before it can be evaluated (that is, backtested) or used to\ngenerate prediction results.\n\nFor best performance and to maintain the most up-to-date models, consider\nmonthly re-training. However, a given engine version supports generating\nprediction results for 12 months from the\nrelease of a newer minor engine version.\n| **Note:** Training is a billable operation requiring significant compute resources and may take days to complete. For more information, see the [Pricing page](/financial-services/anti-money-laundering/pricing).\n\nHow to train\n------------\n\nTo train a model (that is, create a model), see\n[Create and manage models](/financial-services/anti-money-laundering/docs/create-and-manage-models).\n\nIn particular, you need to select the following:\n\n- **The data to use for training:**\n\n Specify a dataset and an end time within the date range of the dataset.\n\n Training uses labels and features based on complete calendar months up to,\n but not including, the month of the selected end time. For more information,\n see\n [Dataset time ranges](/financial-services/anti-money-laundering/docs/overview-model-preparation#dataset-time-ranges).\n- **An engine config created using a [consistent dataset](/financial-services/anti-money-laundering/docs/overview-model-preparation#dataset-consistency):**\n\n See\n [Configure an engine](/financial-services/anti-money-laundering/docs/configure-engine).\n\nTraining output\n---------------\n\nTraining generates a\n[Model resource](/financial-services/anti-money-laundering/docs/reference/rest/v1/projects.locations.instances.models), which can\nbe used to do the following:\n\n- Create backtest results, which are used to evaluate model performance using currently-known true positives\n- Create prediction results, which are used once you are ready to start reviewing new cases for potential money laundering\n\nThe\n[model metadata](/financial-services/anti-money-laundering/docs/create-and-manage-models#export-metadata)\ncontains the `missingness` metric, which can be used to assess\n[dataset consistency](/financial-services/anti-money-laundering/docs/overview-model-preparation#dataset-consistency)\n(for example, by comparing the missingness values of feature families from\ndifferent operations)\n\nModel metadata does not contain recall metrics from a test set. To generate\nrecall measurements for a specific time period (for example, the test set), see\n[Evaluate a model](/financial-services/anti-money-laundering/docs/evaluate-model)."]]