Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
A IA antilavagem de dinheiro é configurada para avaliar o risco de lavagem de dinheiro de uma
linha de negócios. Um LoB está associado a um dos seus clientes de varejo ou
comercial.
Ao criar um conjunto de dados para uso com um LoB, é necessário incluir várias
tabelas. Cada tabela precisa abranger um período de tempo suficiente. Esta página oferece uma visão geral das tabelas necessárias e mostra como determinar o período que cada uma delas precisa abranger.
Tabelas a serem usadas
O conjunto de dados do BigQuery usado com a IA de AML precisa conter as seguintes tabelas:
LoB de varejo: todos os clientes de varejo que tiveram contas em qualquer momento do período necessário
LoB comercial: todos os clientes de bancos comerciais (entidades
jurídicas e físicas) que mantiveram contas a qualquer momento no período necessário
AccountPartyLink: histórico completo das contas que foram
detidas por cada parte. Isso deve abranger todas as contas de produtos e
serviços quando qualquer parte na tabela "Parte" for o titular da conta principal em
qualquer momento no período necessário.
Transação: todas as transações de contas na tabela AccountPartyLink para o período necessário.
RiskCaseEvent: todos os eventos de caso de risco (consulte os valores do tipo de evento) para qualquer caso de risco e parte na tabela "Parte" com um
AML_PROCESS_START (início da investigação) no período necessário. Essa
tabela pode incluir eventos com um horário anterior ou posterior ao
intervalo de tempo necessário.
PartySupplementaryData: (se usado) para 0 a 100 valores exclusivos de party_supplementary_data_id, inclua um histórico completo dos valores desses campos para todas as partes na tabela "Party" no período necessário.
Como usar outros dados
Consulte Dados complementares se você tiver dados adicionais sobre partes
(não cobertos pelo esquema) que sejam relevantes para identificar o risco de
lavagem de dinheiro.
Intervalo de tempo do conjunto de dados
O período que qualquer tabela em um conjunto de dados precisa abranger pode ser calculado da seguinte forma para qualquer operação. Você vai precisar saber:
O horário de término. É o horário mais recente em que os rótulos são usados e os dados são usados para gerar recursos de ajuste.
A operação que você vai realizar: ajustar, treinar, prever ou fazer testes retrospectivos.
Para operações de previsão ou backtest, o número de períodos em que você vai realizar a operação, que será especificado na chamada da API.
Primeiro, calcule o número de períodos que a operação vai usar. Esse é
o número de meses consecutivos que terminam no último mês completo antes da
hora de término especificada, para a qual a IA de AML vai avaliar os recursos do modelo.
Para operações de previsão e backtest, esse é o número de períodos
de previsão ou de backtest especificados na chamada de API.
Para outras operações, isso depende da versão do mecanismo e da operação.
Por exemplo, as versões do mecanismo v004.004 usam 18 períodos para ajuste e 15 para
treinamento.
Em seguida, calcule a janela de lookback para cada tabela. Esse é o número máximo
de meses de dados necessários dessa tabela para que a IA de AML calcule os recursos
do modelo em um determinado período.
Por exemplo, para as versões do mecanismo v004.004, são 13 meses para as tabelas Transaction e AccountPartyLink, 12 meses para a tabela RiskCaseEvent e 0 mês para as tabelas Party e PartySupplementaryData.
O conjunto de dados precisa abranger o período de referência de todos os períodos usados
pela operação escolhida. Você pode calcular o número de meses completos de dados
antes do horário de término que vai precisar para uma determinada operação com a
seguinte fórmula:
número de períodos + janela de lookback -1
Por exemplo, para as versões do mecanismo v004.00X que fazem o ajuste, você precisa de:
18 + 13 - 1 = 30 meses de dados das tabelas Transaction e AccountPartyLink.
18 + 12 - 1 = 29 meses de dados da tabela "Eventos de caso de risco", além de
eventos mais recentes para casos de risco na tabela.
E 18 + 0 - 1 = 17 meses de dados das tabelas Party e PartySupplementaryData.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-17 UTC."],[[["\u003cp\u003eAML AI assesses money laundering risk for a specific Line of Business (LoB), associated with either retail or commercial customers.\u003c/p\u003e\n"],["\u003cp\u003eCreating a dataset for AML AI requires including several tables: Party, AccountPartyLink, Transaction, RiskCaseEvent, and optionally PartySupplementaryData, each with defined content requirements.\u003c/p\u003e\n"],["\u003cp\u003eThe required time range for each table in the dataset is determined by the operation type (tune, train, predict, or backtest), the engine version, the end time, the number of periods, and the lookback window specific to each table.\u003c/p\u003e\n"],["\u003cp\u003eFor predict and backtest operations, the number of periods is defined in the API call, while for other operations, it is determined by the engine version.\u003c/p\u003e\n"],["\u003cp\u003eFor v004.00X Engine Versions conducting tuning, the dataset will need 30 months of data from Transaction and AccountPartyLink, 29 months from Risk Case Events and 17 from Party and PartySupplementaryData tables, at minimum.\u003c/p\u003e\n"]]],[],null,["# Understand data scope and duration\n\nAML AI is set up to assess money laundering risk for one\n[line of business](/financial-services/anti-money-laundering/docs/concepts/glossary#lob). An LoB is associated with one of your retail or\ncommercial customers.\n\nWhen creating a dataset for use with an LoB, you will need to include several\ntables. Each table should cover a sufficient time range. This page gives an\noverview of the tables you will need and shows how to determine the time range\nthat each should cover.\n\nTables to use\n-------------\n\nThe BigQuery dataset used with AML AI should contain the following tables:\n\n- **[Party](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#party)** : All parties relevant to that LoB\n - **Retail LoB**: All retail banking customers that have held accounts at any point in the required time range\n - **Commercial LoB**: All commercial banking customers (legal and natural entities) that have held accounts at any point in the required time range\n- **[AccountPartyLink](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#accountpartylink)**: Full history of which accounts were held by which parties. This should cover all accounts for products and services when any party in the Party table was the primary account holder at any point in the required time range.\n- **[Transaction](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#transaction)**: All transactions for accounts in the AccountPartyLink table for the required time range.\n- **[RiskCaseEvent](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#riskcaseevent)**: All risk case events (see event type values) for any risk case and party in the Party table with an AML_PROCESS_START (start of investigation) in the required time range. This table may include events that have an event time earlier or later than the required time range.\n- **[PartySupplementaryData](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#partysupplementarydata)**: (If used) For 0 to 100 unique party_supplementary_data_id values, include a full history of the values of these fields for all parties in the Party table for the required time range.\n\nUsing additional data\n---------------------\n\nSee [Supplementary data](/financial-services/anti-money-laundering/docs/reference/schemas/aml-input-data-model#supplementary-data-tables) if you have additional data on parties\n(not otherwise covered in the schema) that is relevant to identifying money\nlaundering risk.\n\nDataset time range\n------------------\n\nThe time range that any table in a dataset should cover can be worked out as\nfollows for any given operation. You will need to know:\n\n- The end time. This is the latest time from which labels are used and from which data is used to generate features for tuning.\n- The Engine Version (See [list of engine versions](/financial-services/anti-money-laundering/docs/private/engine-versions)) you will use.\n- The operation you will conduct: tune, train, predict or backtest.\n- For predict or backtest operations, the number of periods for which you will conduct the operation, to be specified in the API call.\n\nFirst you should work out the number of periods the operation will use. This is\nthe number of consecutive months ending in the last full calendar month prior to\nthe specified end time, for which AML AI will evaluate model features.\n\n- For predict and backtest operations, this is the number of prediction periods or backtest periods specified in the API call.\n- For other operations this depends on the Engine Version and the operation. For example, v004.004 Engine Versions use 18 periods for tuning and 15 for training.\n\nNext you should work out the lookback window for each table. This is the maximum\nnumber of months of data needed from that table for AML AI to calculate model\nfeatures for a given period.\n\n- For example, for v004.004 Engine Versions, this is 13 months for Transaction and AccountPartyLink tables, 12 months for the RiskCaseEvent table and 0 months for Party and PartySupplementaryData tables.\n\nThe dataset will need to cover the lookback window for all of the periods used\nby the chosen operation. You can calculate the number of full calendar months of\ndata prior to the end time that you will need for a given operation with the\nfollowing formula:\n\n- **number of periods + lookback window -1**\n\nFor example, for v004.00X Engine Versions conducting tuning, you require:\n\n- 18 + 13 - 1 = 30 months of data from the Transaction and AccountPartyLink tables,\n- 18 + 12 - 1 = 29 months of data from the Risk Case Events table as well as any more recent events for risk cases in the table,\n- And 18 + 0 - 1 = 17 months of data from the Party and PartySupplementaryData tables."]]