Detecção de campo derivado e assinatura
O recurso de acesso antecipado público de campos derivados permite que os clientes da Document AI configurem um campo para ser preenchido por inferência ou geração inteligente com base no contexto do documento, em vez de extração direta de texto.
Esta versão também adiciona outro recurso para detectar a presença de assinaturas em
documentos. Você pode usar o novo tipo de entidade signature
para especificar um esquema para
essas entidades. As entidades de assinatura são derivadas usando pistas visuais do documento.
Campos derivados no extrator personalizado
O extrator personalizado é compatível com campos derivados nos seguintes modelos:
pretrained-foundation-model-v1.4-2025-02-05
como disponibilidade geral (GA)pretrained-foundation-model-v1.5-2025-05-05
como préviapretrained-foundation-model-v1.5-pro-2025-06-20
como prévia
É possível ativar esses recursos na UI do console ao criar ou editar rótulos no esquema do documento.
Os campos derivados são um recurso eficiente que permite extrair informações não escritas explicitamente em um documento. Assim, é possível configurar um campo para ser preenchido por inferência ou geração inteligente com base no contexto geral do documento. Isso vai além da extração de texto rudimentar e oferece suporte a casos de uso avançados, como:
- Deduzir o país de um endereço.
- Contar o número total de itens em uma tabela.
- Detectar se um documento de identificação é um "Real ID".
Exemplo de criação de esquema
Confira um exemplo de criação de um esquema para campos derivados em casos de uso como esse e a saída esperada, usando uma carteira de motorista dos EUA.
Selecione o método
Derived
ao criar um elemento de esquema.Adicione rótulos descritivos para melhorar a performance.
Campos derivados, como assinaturas, não exigem a definição de caixas delimitadoras ao rotular documentos. Em Valor, selecione Detectado.
Para campos derivados que não sejam assinaturas, é possível inserir qualquer Valor como parte da rotulagem para definir as possíveis saídas.
A saída esperada será semelhante a esta, com a presença de uma assinatura retornada como "Detected" ou "", e campos derivados retornados como texto, conforme a descrição do rótulo solicita.
Visão geral de extração x derivada
Ao definir uma entidade no esquema do processador, você pode escolher um método para preencher o valor dela.
Extrair:esse é o método padrão. Ele funciona quando o valor da entidade precisa ser extraído diretamente do texto do documento. O sistema identifica o texto e preenche campos como
textAnchor
epageAnchor
para mostrar a localização.Derivado:esse método é usado quando o valor da entidade precisa ser inferido do conteúdo do documento. Como o valor não está diretamente presente no texto, os campos
textAnchor
epageAnchor
não são preenchidos.
Exemplo de caso de uso: encontrar um código de moeda
Imagine que você precisa identificar o código da moeda (por exemplo, USD, CAD, EUR) para transações nos seus documentos.
Quando usar
Extract
: se os documentos contiverem consistentemente símbolos ou códigos de moeda não ambíguos, como "USD" ou "€", use o métodoExtract
para encontrar e extrair esse texto exato.Quando usar
Derived
: se um documento usar um símbolo ambíguo, como "$" (que pode se referir a USD, CAD, AUD etc.) ou não tiver nenhum símbolo, use o métodoDerived
. O modelo analisa o contexto do documento, como um endereço de faturamento ou a localização da empresa, para inferir o código de moeda ISO 4217 correto.
Práticas recomendadas de configuração
Para ter os melhores resultados com campos derivados, recomendamos que você
escreva um description
claro e instrutivo para a propriedade no seu esquema
durante a rotulagem. Isso ajuda a orientar o modelo na tarefa de derivação.
No exemplo de código da moeda, é possível criar um campo com o nome currency_code
e fornecer a seguinte descrição: "Encontre o código da moeda ISO 4217 dos valores no documento usando indicadores contextuais presentes nele, como símbolos de moeda e endereços".
Limitações
Os campos derivados são gerados por página. Isso significa que os casos de uso que exigem informações de várias páginas não são totalmente compatíveis. Por exemplo, se você configurar um campo derivado para resumir um documento, ele vai gerar um resumo separado para cada página individual, em vez de um resumo coeso para o documento inteiro. Essa limitação se aplica a qualquer campo em que o valor precise ser derivado usando informações entre páginas.
Detecção de assinatura no extrator personalizado
O extrator personalizado da Document AI oferece suporte à detecção de assinaturas em modelos de extrator personalizado pretrained-foundation-model-v1.4-2025-02-05
e pretrained-foundation-model-v1.5-2025-05-05
. É possível ativar esse recurso na
UI do console ao criar ou editar rótulos no esquema do documento.
A detecção de assinatura é um recurso que permite determinar se uma assinatura está presente nos seus documentos. Esse recurso verifica se uma assinatura existe analisando pistas visuais, em vez de extrair texto.
Como a detecção de assinatura funciona
Para ativar essa funcionalidade, um tipo de dados signature
está disponível ao definir o esquema do processador. O comportamento do processador depende da detecção ou não de uma assinatura no documento.
Se uma assinatura for encontrada, o extrator vai retornar uma entidade de assinatura na resposta.
Para um campo chamado has_signed
, o objeto de resposta tem a seguinte estrutura:
"has_signed": {
"mention_text": "Detected",
"confidence": <confidence_score_between 0 to 1>,
"normalized_value": {
"text": "Detected",
"signature_value": true
}
}
Se uma assinatura não for encontrada, a entidade não será retornada na resposta do processador.
Configurar e definir requisitos importantes
Para configurar a detecção de assinaturas:
- Defina o esquema:no esquema do processador, adicione uma nova entidade para a assinatura que você quer detectar.
- Definir tipo de dados:selecione "Assinatura" como o tipo de dados para essa nova entidade.
- Defina o método como "derived":as entidades com o tipo de dados
signature
só podem usar o métodoDerived
. Como o modelo infere a presença da assinatura visualmente, ele não extrai um valor de texto. Portanto, campos comotextAnchor
epageAnchor
não são preenchidos para entidades de assinatura.
Exemplo de caso de uso:
Imagine que você está processando contratos e precisa verificar se eles foram assinados.
É possível criar um campo de esquema chamado is_contract_signed
e definir o tipo de dados dele como signature
. Ao processar um contrato assinado, a resposta inclui uma entidade
is_contract_signed
, confirmando a presença da assinatura. Se nenhuma assinatura estiver presente, essa entidade não vai aparecer na resposta. Assim, você pode sinalizar rapidamente
documentos não assinados para revisão.
A seguir
Saiba como treinar um processador especializado.