Maximale Werte für Trainingsdatensätze: 300 Dokumente, 300 Seiten
Mindestanzahl von Dokumenten im Trainings-Dataset: jedes Label auf mindestens 3 Dokumenten
Maximale Größe des Test-Datasets: 2.000 Dokumente; 8.000 Seiten
Mindestanzahl für Test-Datasets: jedes Label auf mindestens drei Dokumenten
Maximal 20 Seiten pro Dokument
Einschränkungen beim Trainieren eines benutzerdefinierten Dokumentklassifikators (CDC) oder eines benutzerdefinierten Dokument-Splitters (CDS)
Maximale Anzahl von Dokumenten und Seiten im Trainingsdatensatz: 30.000 Dokumente; 100.000 Seiten
Mindestanzahl von Trainingsdokumenten: jedes Label auf mindestens 10 Dokumenten
Maximale Größe des Test-Datasets: 2.000 Dokumente; 8.000 Seiten
Mindestanzahl für Test-Datasets: jedes Label auf mindestens zwei Dokumenten
Maximal 200 Seiten pro Dokument
Labeling
Achten Sie zuerst darauf, dass die Dokumentlabels die definierten Mindestgrenzwerte für Training und Bewertung erfüllen.
Wenn Sie die Modellleistung für Dokumente mit Layoutvarianten bewerten möchten, müssen Sie mindestens 100 Dokumente mit Labels versehen. Achten Sie darauf, dass jedes Label in 50 Dokumenten im Training und in 50 Dokumenten in der Bewertung vorhanden ist.
Maximal zulässige Labels (Felder): 150
Labelgrößenbeschränkungen (Zeichen): Lange Elemente werden nicht gut unterstützt, es gibt jedoch keine explizite Beschränkung. Teilen Sie Dokumente in Blöcke mit 800 oder 1.000 Token auf, wobei sich die Blöcke um 100 bis 200 Token überschneiden. Bei Elementen, die länger als der überlappende Bereich sind, kann es zu Qualitätsproblemen kommen.
Labelvorkommen in einem Dokument: Keine Beschränkung
Geografische Abdeckung
Allgemein unterstützte Regionen: USA, EU (multiregional)
Regionen mit eingeschränkter Verfügbarkeit: Deutschland, Singapur, Vereinigtes Königreich, Kanada, Indien, Australien
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-04-01 (UTC)."],[[["Document AI has fixed system limits that cannot be adjusted, unlike quotas."],["Online processing requests have a maximum file size limit of 20 MB, while batch processing requests can handle files up to 1 GB each."],["The maximum image resolution for uploaded files is 40 megapixels per page, but this does not apply to PDF files."],["Batch processing requests are limited to a maximum of 5,000 files per request, with a maximum of 10 pages per document for Human-in-the-Loop processes."],["Training datasets for Custom Document Extractors, Classifiers, or Splitters have varying maximums, with limits for example, of up to 25,000 documents and 100,000 pages for model based training, with labels needing to be present on a specified minimum amount of documents, and a maximum of 200 pages per document."]]],[]]