Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Esta página aborda brevemente os conceitos por trás do treinamento de modelo. Um recurso de modelo de IA
de AML representa um modelo treinado que pode ser usado para gerar escores de risco e explicabilidade.
Quando treinar ou treinar novamente
A IA de AML treina um modelo como parte da criação de um recurso de modelo. O modelo
precisa ser treinado antes de ser avaliado (ou seja, testado anteriormente) ou usado para
gerar resultados de previsão.
Para ter a melhor performance e manter os modelos mais atualizados, considere
o treinamento mensal. No entanto, uma determinada versão do mecanismo pode gerar
resultados de previsão por 12 meses a partir do
lançamento de uma versão secundária mais recente.
Mais especificamente, você precisa selecionar o seguinte:
Os dados a serem usados para treinamento:
Especifique um conjunto de dados e um horário de término dentro do período do conjunto de dados.
O treinamento usa rótulos e recursos com base em meses completos até o mês da data de término selecionada, mas não incluindo esse mês. Para mais informações, consulte Intervalos de tempo do conjunto de dados.
O treinamento gera um recurso de modelo, que pode ser usado para fazer o seguinte:
Criar resultados de backtest, que são usados para avaliar a performance do modelo usando
verdadeiros positivos conhecidos
Crie resultados de previsão, que são usados quando você está pronto para começar
a analisar novos casos em busca de possíveis casos de lavagem de dinheiro.
Os
metadados do modelo
contêm a métrica missingness, que pode ser usada para avaliar a
consistência do conjunto de dados, por exemplo, comparando os valores de ausência de famílias de recursos de
operações diferentes.
Nome da métrica
Descrição da métrica
Exemplo de valor da métrica
Ausência
Porcentagem de valores ausentes em todos os atributos em cada família de atributos.
O ideal é que todas as famílias de recursos de IA de AML tenham uma
falta próxima de 0. Exceções podem ocorrer quando os dados subjacentes
dessas famílias de recursos não estão disponíveis para integração.
Uma mudança significativa nesse valor para qualquer família de recursos entre o ajuste, o treinamento, a avaliação e a previsão pode indicar inconsistência nos conjuntos de dados usados.
Uma métrica que mostra a importância de uma família de recursos para o modelo. Valores mais altos indicam um uso mais significativo da família de recursos no modelo. Uma família de recursos que não é usada no modelo tem importância zero.
Os valores de importância podem ser usados ao priorizar a ação em resultados de distorção familiar. Por exemplo, o mesmo valor de distorção para uma família com maior importância para o modelo é mais urgente de resolver.
Os metadados do modelo não contêm métricas de recuperação de um conjunto de testes. Para gerar
medições de recuperação de um período específico (por exemplo, o conjunto de teste), consulte
Avaliar um modelo.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-17 UTC."],[[["\u003cp\u003eAML AI model training creates a Model resource that can generate risk scores and provide explainability.\u003c/p\u003e\n"],["\u003cp\u003eModel training is necessary before evaluation (backtesting) or generating prediction results, and monthly retraining is recommended for optimal performance.\u003c/p\u003e\n"],["\u003cp\u003eTraining involves selecting a dataset with a specified end time and an engine configuration based on a consistent dataset.\u003c/p\u003e\n"],["\u003cp\u003eThe training process outputs a Model resource that facilitates creating backtest results for performance evaluation and prediction results for reviewing potential money laundering cases.\u003c/p\u003e\n"],["\u003cp\u003eModel metadata includes the \u003ccode\u003emissingness\u003c/code\u003e metric to assess dataset consistency and an importance metric that indicates the influence of a feature family on the model, which is available for specific engine versions.\u003c/p\u003e\n"]]],[],null,["# Generate a model\n\nThis page briefly covers concepts behind model training. An AML AI\nmodel resource represents a trained model that can be used to generate risk\nscores and explainability.\n\nWhen to train or re-train\n-------------------------\n\nAML AI trains a model as part of creating a\n[Model resource](/financial-services/anti-money-laundering/docs/reference/rest/v1/projects.locations.instances.models). The model\nmust be trained before it can be evaluated (that is, backtested) or used to\ngenerate prediction results.\n\nFor best performance and to maintain the most up-to-date models, consider\nmonthly re-training. However, a given engine version supports generating\nprediction results for 12 months from the\nrelease of a newer minor engine version.\n| **Note:** Training is a billable operation requiring significant compute resources and may take days to complete. For more information, see the [Pricing page](/financial-services/anti-money-laundering/pricing).\n\nHow to train\n------------\n\nTo train a model (that is, create a model), see\n[Create and manage models](/financial-services/anti-money-laundering/docs/create-and-manage-models).\n\nIn particular, you need to select the following:\n\n- **The data to use for training:**\n\n Specify a dataset and an end time within the date range of the dataset.\n\n Training uses labels and features based on complete calendar months up to,\n but not including, the month of the selected end time. For more information,\n see\n [Dataset time ranges](/financial-services/anti-money-laundering/docs/overview-model-preparation#dataset-time-ranges).\n- **An engine config created using a [consistent dataset](/financial-services/anti-money-laundering/docs/overview-model-preparation#dataset-consistency):**\n\n See\n [Configure an engine](/financial-services/anti-money-laundering/docs/configure-engine).\n\nTraining output\n---------------\n\nTraining generates a\n[Model resource](/financial-services/anti-money-laundering/docs/reference/rest/v1/projects.locations.instances.models), which can\nbe used to do the following:\n\n- Create backtest results, which are used to evaluate model performance using currently-known true positives\n- Create prediction results, which are used once you are ready to start reviewing new cases for potential money laundering\n\nThe\n[model metadata](/financial-services/anti-money-laundering/docs/create-and-manage-models#export-metadata)\ncontains the `missingness` metric, which can be used to assess\n[dataset consistency](/financial-services/anti-money-laundering/docs/overview-model-preparation#dataset-consistency)\n(for example, by comparing the missingness values of feature families from\ndifferent operations)\n\nModel metadata does not contain recall metrics from a test set. To generate\nrecall measurements for a specific time period (for example, the test set), see\n[Evaluate a model](/financial-services/anti-money-laundering/docs/evaluate-model)."]]