Maximale Größe von Trainings-Datasets: 300 Dokumente, 300 Seiten
Mindestanforderung für Trainings-Dataset: Jedes Label muss in mindestens drei Dokumenten vorhanden sein.
Maximale Größe von Test-Datasets: 2.000 Dokumente; 8.000 Seiten
Mindestanforderung für Test-Dataset: Jedes Label muss in mindestens drei Dokumenten enthalten sein.
Maximal 20 Seiten pro Dokument
Grenzwerte für das Trainieren eines benutzerdefinierten Dokumentklassifikators (CDC) oder eines benutzerdefinierten Dokument-Splitters (CDS)
Maximale Größe von Trainingsdatasets: 30.000 Dokumente; 100.000 Seiten
Mindestanforderung für Trainings-Dataset: Jedes Label muss in mindestens 10 Dokumenten vorhanden sein.
Maximale Größe von Test-Datasets: 2.000 Dokumente; 8.000 Seiten
Mindestanforderung für Test-Dataset: Jedes Label muss in mindestens zwei Dokumenten vorhanden sein.
Maximal 200 Seiten pro Dokument
Labeling
Prüfen Sie zuerst, ob die Dokumentlabels die definierten Mindestschwellenwerte für Training und Evaluierung erfüllen.
Wenn Sie die Modellleistung für Dokumente mit Layoutvariationen bewerten möchten, müssen Sie mindestens 100 Dokumente mit Labels versehen. Prüfen Sie insbesondere, ob jedes Label in 50 Dokumenten im Training und in 50 Dokumenten in der Auswertung vorhanden ist.
Maximal zulässige Labels (Felder): 150
Beschriftungsgrößenbeschränkungen (Zeichen): Lange Elemente werden nicht gut unterstützt, es gibt aber keine explizite Beschränkung. Teilen Sie Dokumente in Blöcke mit 800 oder 1.000 Tokens auf. Zwischen den Blöcken sollten sich 100 bis 200 Tokens überschneiden. Bei Elementen, die länger als der überlappende Bereich sind, kann es zu Qualitätsproblemen kommen.
Vorkommen von Labels in einem Dokument: Kein Limit
Geografische Abdeckung
Allgemein unterstützte Regionen: USA, EU (multiregional)
Regionen mit eingeschränkter Verfügbarkeit: Deutschland, Singapur, Vereinigtes Königreich, Kanada, Indien, Australien
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-07-14 (UTC)."],[[["Document AI has fixed system limits that cannot be adjusted, unlike quotas."],["Online processing requests have a maximum file size limit of 20 MB, while batch processing requests can handle files up to 1 GB each."],["The maximum image resolution for uploaded files is 40 megapixels per page, but this does not apply to PDF files."],["Batch processing requests are limited to a maximum of 5,000 files per request, with a maximum of 10 pages per document for Human-in-the-Loop processes."],["Training datasets for Custom Document Extractors, Classifiers, or Splitters have varying maximums, with limits for example, of up to 25,000 documents and 100,000 pages for model based training, with labels needing to be present on a specified minimum amount of documents, and a maximum of 200 pages per document."]]],[]]