Comportamento dos divisores de documentos
A saída do processador de divisão contém informações sobre o documento de entrada, incluindo uma pontuação de confiança. A API Document AI gera um objeto JSON Document
, e o formato de saída usa o campo entities
para representar divisões de documentos. Outras informações dependem do tipo específico de divisor.
Entity.type
especifica a classificação do documento. Para ver uma lista completa dos tipos de documentos que podem ser identificados, consulte as listas a seguir.Entity.pageAnchor.pageRefs[]
especifica as páginas que contêm cada subdocumento.pageRefs[].page
é baseado em zero e é o índice no campodocument.pages[]
.
O divisor não foi projetado para dividir documentos lógicos com mais de 30 páginas. Documentos lógicos com mais de 30 páginas (por exemplo, um extrato bancário de 40 páginas) podem ser divididos em dois ou mais documentos e classificados separadamente.
Os divisores identificam os limites da página, mas não dividem o documento de entrada para você. O SDK Document AI Toolbox oferece funções de utilidade que podem dividir o documento de entrada com base na saída de um processador de divisão.
Tipos de documentos identificados
[1] O analisador correspondente a este formulário não é compatível com esse tipo de documento. Isso significa que o divisor pode identificar e classificar documentos desse tipo, mas a Document AI não oferece um analisador para extrair informações.
Exemplos de saída
Processadores | Exemplos de saída |
---|
Exemplos de código
Os divisores identificam os limites da página, mas não dividem o documento de entrada para você. É possível usar a Caixa de ferramentas da Document AI para dividir fisicamente um arquivo PDF usando os limites de página. Os exemplos de código a seguir imprimem os intervalos de páginas sem dividir o PDF:
Java
Para mais informações, consulte a documentação de referência da API Java da Document AI.
Para autenticar na Document AI, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para mais informações, consulte a documentação de referência da API Node.js da Document AI.
Para autenticar na Document AI, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para mais informações, consulte a documentação de referência da API Python da Document AI.
Para autenticar na Document AI, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Document
processado.
Python
Para mais informações, consulte a documentação de referência da API Python da Document AI.
Para autenticar na Document AI, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.