Generar un modelo

En esta página se explican brevemente los conceptos relacionados con el entrenamiento de modelos. Un recurso de modelo de IA de AML representa un modelo entrenado que se puede usar para generar puntuaciones de riesgo y explicaciones.

Cuándo entrenar o volver a entrenar

AML AI entrena un modelo como parte de la creación de un recurso Model. El modelo debe entrenarse antes de poder evaluarse (es decir, someterse a una prueba retrospectiva) o usarse para generar resultados de predicción.

Para obtener el mejor rendimiento y mantener los modelos más actualizados, te recomendamos que los vuelvas a entrenar cada mes. Sin embargo, una versión de motor determinada admite la generación de resultados de predicción durante 12 meses a partir del lanzamiento de una versión secundaria más reciente del motor.

Cómo entrenar

Para entrenar un modelo (es decir, crear un modelo), consulta el artículo Crear y gestionar modelos.

En concreto, debes seleccionar lo siguiente:

  • Los datos que se usarán para el entrenamiento:

    Especifica un conjunto de datos y una hora de finalización dentro del periodo del conjunto de datos.

    El entrenamiento usa etiquetas y funciones basadas en meses naturales completos hasta el mes de la hora de finalización seleccionada, pero sin incluirlo. Para obtener más información, consulta Intervalos de tiempo de los conjuntos de datos.

  • Una configuración de buscador creada con un conjunto de datos coherente:

    Consulta Configurar un motor.

Salida de preparación

El entrenamiento genera un recurso de modelo, que se puede usar para lo siguiente:

  • Crea resultados de pruebas retrospectivas, que se usan para evaluar el rendimiento del modelo con los verdaderos positivos que se conocen actualmente.
  • Crea resultados de predicción, que se usan cuando estés listo para empezar a revisar nuevos casos de posible blanqueo de dinero.

Los metadatos del modelo contienen la métrica missingness, que se puede usar para evaluar la coherencia del conjunto de datos (por ejemplo, comparando los valores de falta de datos de familias de características de diferentes operaciones).

Nombre de la métrica Descripción de la métrica Valor de métrica de ejemplo
Faltan datos

Porcentaje de valores que faltan en todas las funciones de cada familia de funciones.

Lo ideal es que todas las familias de funciones de IA de AML tengan un valor de Missingness cercano a 0. Puede haber excepciones en las que los datos subyacentes de esas familias de funciones no estén disponibles para la integración.

Un cambio significativo en este valor para cualquier familia de funciones entre la optimización, el entrenamiento, la evaluación y la predicción puede indicar una incoherencia en los conjuntos de datos utilizados.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Importancia

Métrica que muestra la importancia de una familia de características para el modelo. Los valores más altos indican un uso más significativo de la familia de funciones en el modelo. Una familia de características que no se usa en el modelo tiene una importancia nula.

Los valores de importancia se pueden usar para priorizar las acciones en función de los resultados de la asimetría familiar. Por ejemplo, el mismo valor de asimetría para una familia con mayor importancia para el modelo es más urgente de resolver.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

Los metadatos del modelo no contienen métricas de recuperación de un conjunto de pruebas. Para generar mediciones de recuerdo de un periodo específico (por ejemplo, el conjunto de pruebas), consulta Evaluar un modelo.