Nesta página, abordamos brevemente conceitos por trás do treinamento de modelo. Um recurso de modelo de IA de AML representa um modelo treinado que pode ser usado para gerar pontuações de risco e explicabilidade.
Quando treinar ou treinar novamente
A IA antilavagem de dinheiro treina um modelo como parte da criação Recurso Model. O modelo precisa ser treinado antes de ser avaliado (ou seja, testado anteriormente) ou usado para gerar resultados de previsão.
Para ter a melhor performance e manter os modelos mais atualizados, considere o treinamento mensal. No entanto, uma determinada versão do mecanismo oferece suporte à geração de resultados de previsão por 12 meses a partir do lançamento de uma versão secundária mais recente.
Como treinar
Para treinar um modelo, consulte Criar e gerenciar modelos.
Mais especificamente, você precisa selecionar o seguinte:
Os dados a serem usados para treinamento:
Especifique um conjunto de dados e um horário de término dentro do período do conjunto de dados.
O treinamento usa marcadores e recursos com base nos meses completos do calendário até, mas sem incluir o mês do horário de término selecionado. Para mais informações, ver Intervalos de tempo do conjunto de dados.
Uma configuração de mecanismo criada usando um conjunto de dados consistente:
Consulte Configure um mecanismo.
Saída de treinamento
O treinamento gera Recurso Model, que pode ser usada para fazer o seguinte:
- Criar resultados de backtest, que são usados para avaliar o desempenho do modelo usando verdadeiros positivos conhecidos atualmente
- Crie resultados de previsão, que são usados quando você está pronto para começar a analisar novos casos de possível lavagem de dinheiro.
Os metadados do modelo contêm a métrica missingness
, que pode ser usada para avaliar a consistência do conjunto de dados, por exemplo, comparando os valores de ausência de famílias de recursos de diferentes operações.
Nome da métrica | Descrição da métrica | Exemplo de valor da métrica |
---|---|---|
Ausência |
Compartilhamento de valores ausentes entre todos os atributos em cada família de atributos. O ideal é que todas as famílias de recursos de IA de AML tenham uma falta próxima de 0. Pode haver exceções quando os dados essas famílias de recursos não estão disponíveis para integração. Uma mudança significativa nesse valor para qualquer família de atributos entre o ajuste, treinamento, avaliação e previsão podem indicar inconsistências dos conjuntos de dados usados. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Importância |
Uma métrica que mostra a importância de uma família de recursos para o modelo. Valores maiores indicam um uso mais significativo da família de atributos no modelo. Uma família de atributos que não é usada no modelo tem importância zero. Os valores de importância podem ser usados ao priorizar a ação em resultados de distorção familiar. Por exemplo, o mesmo valor de distorção para uma família com maior importância para o modelo é mais urgente de resolver. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "importanceValue": 459761000000, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "importanceValue": 27492, }, ], } |
Os metadados do modelo não contêm métricas de recuperação de um conjunto de teste. Para gerar medições de recuperação de um período específico (por exemplo, o conjunto de testes), consulte Avaliar um modelo.