Máximos do conjunto de dados de treinamento: 300 documentos, 300 páginas
Mínimo do conjunto de dados de treinamento: cada rótulo em pelo menos três documentos
Máximos do conjunto de dados de teste: 2.000 documentos; 8.000 páginas
Mínimo do conjunto de dados de teste: cada rótulo em pelo menos três documentos
Máximo de 20 páginas por documento
Limites para treinar um classificador de documentos personalizado (CDC) ou um divisor de documentos personalizado (CDS)
Máximos do conjunto de dados de treinamento: 30.000 documentos e 100.000 páginas
Mínimo do conjunto de dados de treinamento: cada rótulo em pelo menos 10 documentos
Máximos do conjunto de dados de teste: 2.000 documentos; 8.000 páginas
Mínimo do conjunto de dados de teste: cada rótulo em pelo menos dois documentos
Máximo de 200 páginas por documento
Rotulação
Para começar, verifique se os rótulos de documentos atendem aos limites mínimos definidos de treinamento e avaliação.
Para começar a avaliar o desempenho do modelo em documentos com variação de layout, rotule pelo menos 100 documentos. Especificamente, verifique se cada rótulo existe em 50 documentos de treinamento e 50 de avaliação.
Número máximo de rótulos (campos) permitidos: 150
Limites de tamanho do rótulo (caracteres): itens longos não são bem aceitos, mas não há um limite explícito. Divida os documentos em partes de 800 ou 1.000 tokens, com 100 a 200 tokens sobrepostos entre os blocos. Itens maiores que a área de sobreposição podem ter problemas de qualidade.
Rotular ocorrências em um documento: sem limite
Cobertura geográfica
Regiões geralmente compatíveis: EUA, UE (multirregional)
Regiões com acessibilidade limitada: Alemanha, Singapura, Reino Unido, Canadá, Índia, Austrália
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-10 UTC."],[],[],null,[]]