Máximos do conjunto de dados de treinamento: 300 documentos, 300 páginas
Mínimo do conjunto de dados de treinamento: cada rótulo em pelo menos três documentos
Máximos do conjunto de dados de teste: 2.000 documentos; 8.000 páginas
Mínimo do conjunto de dados de teste: cada rótulo em pelo menos três documentos
Máximo de 20 páginas por documento
Limites para treinar um classificador de documentos personalizado (CDC) ou um divisor de documentos personalizado (CDS)
Máximos do conjunto de dados de treinamento: 30.000 documentos; 100.000 páginas
Mínimo do conjunto de dados de treinamento: cada rótulo em pelo menos 10 documentos
Máximos do conjunto de dados de teste: 2.000 documentos; 8.000 páginas
Mínimo do conjunto de dados de teste: cada rótulo em pelo menos dois documentos
Máximo de 200 páginas por documento
Rotulação
Para começar, verifique se os marcadores de documento atendem aos limites mínimos de treinamento e avaliação definidos.
Para começar a avaliar o desempenho do modelo em documentos com variação de layout, rotule pelo menos 100 documentos. Especifique que cada rótulo exista em 50 documentos de treinamento e 50 de avaliação.
Rótulos (campos) máximos permitidos: 150
Limites de tamanho de rótulo (caracteres): itens longos não têm suporte, mas não há limite explícito. Divida os documentos em pedaços de 800 ou 1.000 tokens, com 100 a 200 tokens sobrepostos entre os pedaços. Itens mais longos que a área de sobreposição podem ter problemas de qualidade.
Marcar ocorrências em um documento: sem limite
Cobertura geográfica
Regiões geralmente compatíveis: EUA, UE (multirregião)
Regiões com acessibilidade limitada: Alemanha, Singapura, Reino Unido, Canadá, Índia e Austrália
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-04-02 UTC."],[[["Document AI has fixed system limits that cannot be adjusted, unlike quotas."],["Online processing requests have a maximum file size limit of 20 MB, while batch processing requests can handle files up to 1 GB each."],["The maximum image resolution for uploaded files is 40 megapixels per page, but this does not apply to PDF files."],["Batch processing requests are limited to a maximum of 5,000 files per request, with a maximum of 10 pages per document for Human-in-the-Loop processes."],["Training datasets for Custom Document Extractors, Classifiers, or Splitters have varying maximums, with limits for example, of up to 25,000 documents and 100,000 pages for model based training, with labels needing to be present on a specified minimum amount of documents, and a maximum of 200 pages per document."]]],[]]