Limits

In diesem Dokument sind die Systemlimits für Document AI aufgeführt. Im Gegensatz zu Kontingenten können Systemlimits nicht geändert werden.

Limits für Inhalte

Die folgenden Inhaltslimits gelten für alle Document AI-Prozessoren.

Limit für Inhalte Wert
Maximale Bildauflösung
(Begrenzung gilt nicht für PDF-Dateien)
40 Megapixel (pro Seite, wenn das Bild mehrere Seiten enthält)
Maximale Dateigröße für Anfragen zur Onlineverarbeitung 20 MB
Maximale Dateigröße für Anfragen zur Batchverarbeitung 1 GB
Dateien pro Batchverarbeitungsanfrage 5.000 Dateien
Human-in-the-Loop-Seiten pro Dokument 10 Seiten

Limits für Prozessoren

Limits werden in der aktuellen Liste definiert.

Extraktions-Prozessoren

Prozessor Limits
Benutzerdefinierter Extrahierer
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 30
Formularparser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 100
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 30
Layout-Parser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 500
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 30

Klassifizierungs-Prozessoren

Prozessor Limits
Benutzerdefinierter Klassifikator
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 30
Benutzerdefinierter Splitter
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 1000
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 30

Prozessoren digitalisieren

Prozessor Limits
Enterprise Document OCR (Optische Zeichenerkennung)
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 500
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 30

Vortrainierte Prozessoren

Prozessor Limits
Kontoauszugsparser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 30
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 30
W2-Parser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 15
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 15
Parser für US-amerikanische Reisepässe
Maximale Seiten (online/synchrone Anfragen): 2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 2
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 2
Dienstprogrammparser
Maximale Seiten (online/synchrone Anfragen): 10
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 30
Proofing-Parser für Ausweisdokumente
Maximale Seiten (online/synchrone Anfragen): 2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 2
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 2
Lohnabrechnungsparser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 50
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 30
Parser für US-Führerschein
Maximale Seiten (online/synchrone Anfragen): 2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 2
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 2
Kostenparser
Maximale Seiten (online/synchrone Anfragen): 10
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 10
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 10
Rechnungsparser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Seiten (Online-/synchrone Anfragen im Modus ohne Bilder): 30

Einschränkungen für Document AI

Für Document AI gelten die aktuellen Einschränkungen.

Kriterium Stabile Version – Juli 2023
Dataset
  • Maximal 30.000 Dokumente insgesamt
  • Maximal 250.000 Seiten insgesamt
Dokumentimport
  • Maximal 5.000 Dokumente pro Import
  • Maximal 200 Seiten pro Dokument
Einschränkungen beim Trainieren eines benutzerdefinierten Dokumentextraktors Modellbasiertes Training (allgemein verfügbar)
  • Maximale Größe des Trainings-Datasets: 25.000 Dokumente; 100.000 Seiten
  • Mindestanzahl von Trainingsdaten: Jedes Label muss auf mindestens einem Label pro 10 Dokumenten vorhanden sein
  • Maximale Größe des Test-Datasets: 2.000 Dokumente; 8.000 Seiten
  • Mindestanzahl von Dokumenten im Test-Dataset: jedes Label auf mindestens 10 Dokumenten
  • Maximal 200 Seiten pro Dokument

Vorlagenbasierte Schulung (GA)
  • Maximale Werte für Trainingsdatensätze: 300 Dokumente, 300 Seiten
  • Mindestanzahl von Dokumenten im Trainings-Dataset: jedes Label auf mindestens 3 Dokumenten
  • Maximale Größe des Test-Datasets: 2.000 Dokumente; 8.000 Seiten
  • Mindestanzahl für Test-Datasets: jedes Label auf mindestens drei Dokumenten
  • Maximal 20 Seiten pro Dokument
Einschränkungen beim Trainieren eines benutzerdefinierten Dokumentklassifikators (CDC) oder eines benutzerdefinierten Dokument-Splitters (CDS)
  • Maximale Größe des Trainingsdatensatzes: 30.000 Dokumente; 100.000 Seiten
  • Mindestanzahl von Trainingsdokumenten: jedes Label auf mindestens 10 Dokumenten
  • Maximale Größe des Test-Datasets: 2.000 Dokumente; 8.000 Seiten
  • Mindestanzahl für Test-Datasets: jedes Label auf mindestens zwei Dokumenten
  • Maximal 200 Seiten pro Dokument
Labeling
  • Achten Sie zuerst darauf, dass die Dokumentlabels die definierten Mindestgrenzwerte für Training und Bewertung erfüllen.
  • Wenn Sie die Modellleistung für Dokumente mit Layoutvarianten bewerten möchten, müssen Sie mindestens 100 Dokumente mit Labels versehen. Achten Sie darauf, dass jedes Label in 50 Dokumenten im Training und in 50 Dokumenten in der Bewertung vorhanden ist.
  • Maximal zulässige Labels (Felder): 150
  • Labelgrößenbeschränkungen (Zeichen): Lange Elemente werden nicht gut unterstützt, es gibt jedoch keine explizite Beschränkung. Teilen Sie Dokumente in Blöcke mit 800 oder 1.000 Token auf, wobei sich die Blöcke um 100 bis 200 Token überschneiden. Bei Elementen, die länger als der überlappende Bereich sind, kann es zu Qualitätsproblemen kommen.
  • Labelvorkommen in einem Dokument: Keine Beschränkung
Geografische Abdeckung
  • Allgemein unterstützte Regionen: USA, EU (multiregional)
  • Regionen mit eingeschränkter Verfügbarkeit: Deutschland, Singapur, Vereinigtes Königreich, Kanada, Indien, Australien