Descripción general del proceso

Información general

En esta página se ofrece una descripción general de los procesos de IA contra el blanqueo de capitales y se explican los conceptos clave que deben conocer los clientes. Está dirigido principalmente a equipos que usarán la IA de AML para entrenar, probar e implementar modelos.

AML AI permite a los bancos entrenar, probar y desplegar automáticamente modelos para detectar el blanqueo de dinero. Las guías de IA de AML se dividen en cinco secciones de navegación de la izquierda que corresponden a los cinco pasos siguientes.

PasoDescripción
1. Configurar AML AI Asegúrate de que tu Google Cloud proyecto está listo para usar AML AI. Habilita los Google Cloud servicios necesarios y configura el registro y las cuotas. Crea una o varias instancias de AML AI.
2. Preparar datos para AML AI Revisa el modelo de datos y el esquema. Prioriza los datos que quieras incluir. Recoger y transformar los datos bancarios básicos necesarios, los datos de investigación de riesgos y cualquier otro dato que necesites. Crea y valida un conjunto de datos.
3. Generar un modelo y evaluar su rendimiento Conocer los motores, los modelos y las pruebas retrospectivas de AML AI.
  1. Configurar un motor
  2. Preparar un modelo
  3. Evaluar el rendimiento de un modelo
4. Generar puntuaciones de riesgo y explicaciones Registre a sus clientes de banca minorista y comercial. Usar un modelo para generar puntuaciones de riesgo por tercero y explicaciones para:
  • Análisis y pruebas para la gestión de riesgos
  • Uso en preproducción y producción
5. Prepararse para la gobernanza de modelos y riesgos Combina los resultados de la IA de AML procedentes de la optimización, el entrenamiento, la evaluación y la predicción con la documentación de conceptos y productos de AML para cumplir los requisitos de tu proceso de gestión de riesgos de modelos.

Estas son las operaciones técnicas principales de IA de AML para crear, probar e implementar modelos. Estos pasos corresponden a los pasos 2-4 de la tabla anterior.

  1. Crear conjunto de datos de AML AI: crea un conjunto estructurado de tablas de datos de entrada de BigQuery para AML AI.
  2. Configuración del motor: ajusta un motor de IA de AML a un conjunto de datos de IA de AML, incluido el ajuste de hiperparámetros.
  3. Entrenamiento del modelo: entrena un modelo de IA de lucha contra el blanqueo de dinero con una configuración de Engine y un conjunto de datos.
  4. Prueba retrospectiva: prueba un modelo de IA de lucha contra el blanqueo de dinero con datos históricos de un conjunto de datos y resume el rendimiento.
  5. Registrar participantes: registra a los participantes (clientes del banco que tienen productos bancarios y envían o reciben transacciones) para que se les pueda asignar una puntuación en la predicción.
  6. Predicción: genera puntuaciones de las partes y explicaciones para usarlas en producción.

Las operaciones Configuración del motor, Entrenamiento del modelo, Retrospectiva del modelo y Predicción del modelo requieren un conjunto de datos de IA de AML como entrada y devuelven los artefactos correspondientes, que se usan en otras operaciones. Por ejemplo, Model Training devuelve una referencia a un modelo de IA de AML entrenado que se puede usar para hacer pruebas retrospectivas o predicciones. Para obtener información técnica sobre las operaciones, consulta la descripción general de la referencia de REST.

Árbol de dependencias de los procesos de AML AI

Árbol de dependencias de los procesos de AML AI

Consideraciones importantes al usar la IA de lucha contra el blanqueo de capitales

Esta sección se ha diseñado para presentar a los clientes los conceptos clave de la IA contra el blanqueo de capitales y ofrecerles algunas prácticas recomendadas. Los temas que se tratan aquí se explican con más detalle en guías específicas y se proporcionan enlaces para obtener más información.

Coherencia de las fechas

La IA de AML usa periodos diferentes para distintas operaciones. Debes tener cuidado con las fechas seleccionadas para cada operación para asegurarte de que los resultados sean fiables. En concreto, para evitar sesgos en los resultados, es importante que los meses utilizados para entrenar un modelo de IA de AML no se solapen con los meses utilizados para las pruebas retrospectivas.

Como un conjunto de datos de IA de AML contiene datos de muchos meses, los conjuntos de datos se pueden usar para varias operaciones, siempre que se seleccionen las fechas correctas. En el siguiente diagrama se ilustra un ciclo de desarrollo con la IA de AML, en el que se utilizan diferentes periodos de tiempo de un mismo conjunto de datos que abarca 42 meses para configurar un motor (ajuste de hiperparámetros), entrenar y hacer pruebas retrospectivas. Todos estos procesos usan ventanas retrospectivas que proporcionan contexto al modelo y pueden superponerse de forma segura con los datos utilizados en otras operaciones.

Para obtener más información sobre los conjuntos de datos y los periodos de tiempo de AML AI para diferentes operaciones, consulta Información sobre el ámbito y la duración de los datos.

Para asegurarse de que registra correctamente los cambios en sus datos a lo largo del tiempo, consulte Cambios en los datos a lo largo del tiempo.

Crear un conjunto de datos de AML AI (pasos del 1 al 4)

Frecuencia de lotes de producción

En la predicción, la IA de lucha contra el blanqueo de dinero genera puntuaciones de riesgo de lucha contra el blanqueo de dinero mensualmente. Los clientes suelen usar la IA de AML como parte de un proceso por lotes mensual y se les recomienda que hagan predicciones en los meses con datos de transacciones completos siempre que sea posible.

Coherencia de los campos

Al igual que en cualquier proceso de aprendizaje automático, los datos deben ser lo más coherentes posible entre los datos de entrenamiento y los datos de prueba. Si los campos no se rellenan de forma coherente, los cambios pueden provocar resultados poco fiables. Es muy recomendable que se tomen medidas para asegurarse de que los campos se rellenan de forma coherente en cada operación de un ciclo de desarrollo, sobre todo si se utilizan conjuntos de datos diferentes para cada operación. Para obtener más información, consulta Coherencia de los conjuntos de datos.

Configuraciones del motor

Una vez que se ha creado una configuración de buscador, normalmente no es necesario volver a crearla para cada nuevo conjunto de datos o en cada ciclo de desarrollo. Los hiperparámetros elegidos en una configuración de motor para un conjunto de datos suelen funcionar bien en conjuntos de datos similares.

Los ciclos de desarrollo iterativos se ilustran en el siguiente diagrama, mientras que el diagrama anterior usa un solo conjunto de datos para las operaciones de entrenamiento de modelos y de prueba retrospectiva.

Para obtener más información, consulta cuándo ajustar o heredar.

Crear un conjunto de datos de AML AI (pasos 3 y 4)

Linaje de datos

La mayoría de las políticas de gobernanza de modelos definen un requisito para hacer un seguimiento del linaje de los datos utilizados en todas las operaciones de aprendizaje automático, desde la configuración del motor, el entrenamiento, la evaluación y la predicción. Los clientes son responsables de hacer un seguimiento de este linaje de datos.

Te recomendamos que uses un identificador único en los nombres de todos los datos de entrada, los recursos de IA de AML y los datos de salida para monitorizar el linaje en las distintas fases. De esta forma, se asegura una vinculación sólida entre los recursos de una ejecución concreta. Los clientes también pueden etiquetar todos los recursos de IA de AML para cumplir los requisitos de linaje.

Además, te recomendamos que uses las instantáneas de BigQuery en las solicitudes de la API para asegurarte de que el linaje de datos sea preciso.

Esta configuración ayuda a responder a preguntas como "¿de dónde procede esta configuración del motor?" y "¿de dónde procede este modelo?", al tiempo que ayuda a investigar y resolver incidentes.

Para obtener información sobre cómo crear y gestionar recursos de IA de AML, consulta las páginas de la API REST.

Crear un conjunto de datos de AML AI (pasos 3 y 4)