Limites

Ce document répertorie les limites système qui s'appliquent à Document AI. Contrairement aux quotas, les limites système ne peuvent pas être modifiées.

Limites de contenu

Les limites de contenu suivantes s'appliquent à tous les processeurs Document AI.

Limite de contenu Valeur
Résolution d'image maximale
(cette limite ne s'applique pas aux fichiers PDF)
40 mégapixels (par page si l'image contient plusieurs pages)
Taille maximale des fichiers pour les requêtes de traitement en ligne 40 Mo
Taille maximale des fichiers pour les requêtes de traitement par lot 1 Go
Fichiers par requête de traitement par lot 5 000 fichiers

Limites de sous-traitant

Les limites sont définies dans la liste actuelle.

Processeurs d'extraction

Processeur Limites
Extracteur personnalisé
Nombre maximal de pages (requêtes en ligne/synchrones) : 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 200
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 30
Analyseur de formulaires
Nombre maximal de pages (requêtes en ligne/synchrones) : 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 100
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 30
Analyseur de mise en page
Nombre maximal de pages (requêtes en ligne/synchrones) : 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 500
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 30

Processeurs de classification

Processeur Limites
Classificateur personnalisé
Nombre maximal de pages (requêtes en ligne/synchrones) : 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 200
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 30
Séparateur personnalisé
Nombre maximal de pages (requêtes en ligne/synchrones) : 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 1000
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 30

Numériser les processeurs

Processeur Limites
Enterprise Document OCR (reconnaissance optique des caractères)
Nombre maximal de pages (requêtes en ligne/synchrones) : 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 500
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 30

Processeurs pré-entraînés

Processeur Limites
Analyseur de relevés bancaires
Nombre maximal de pages (requêtes en ligne/synchrones) : 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 30
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 30
Analyseur de formulaires W2
Nombre maximal de pages (requêtes en ligne/synchrones) : 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 15
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 15
Analyseur de passeports américains
Nombre maximal de pages (requêtes en ligne/synchrones) : 2
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 2
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 2
Analyseur de fournisseurs d'énergie
Nombre maximal de pages (requêtes en ligne/synchrones) : 10
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 200
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 30
Analyseur de vérification de documents d'identité
Nombre maximal de pages (requêtes en ligne/synchrones) : 2
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 2
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 2
Analyseur de bulletins de salaire
Nombre maximal de pages (requêtes en ligne/synchrones) : 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 50
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 30
Analyseur de permis de conduire américains
Nombre maximal de pages (requêtes en ligne/synchrones) : 2
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 2
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 2
Analyseur de dépenses
Nombre maximal de pages (requêtes en ligne/synchrones) : 10
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 10
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 10
Analyseur de factures
Nombre maximal de pages (requêtes en ligne/synchrones) : 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) : 200
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) : 30

Limites de Document AI

Document AI présente les limites actuelles suivantes.

Critères Version stable de juillet 2023
Ensemble de données
  • 30 000 documents au maximum
  • 250 000 pages au maximum au total
Importation de documents
  • 5 000 documents maximum par importation
  • 200 pages maximum par document
Limites pour entraîner un extracteur de documents personnalisé (CDE) Entraînement basé sur un modèle (disponibilité générale)
  • Nombre maximal de documents dans l'ensemble de données d'entraînement : 25 000 ; nombre maximal de pages : 100 000
  • Ensemble de données d'entraînement (minimum) : chaque étiquette doit être présente sur au moins une étiquette pour 10 documents.
  • Ensemble de données de test : 2 000 documents maximum et 8 000 pages maximum
  • Ensemble de données de test : chaque étiquette doit figurer sur au moins 10 documents.
  • 200 pages maximum par document

Entraînement basé sur des modèles (disponibilité générale)
  • Maximums pour l'ensemble de données d'entraînement : 300 documents, 300 pages
  • Ensemble de données d'entraînement : chaque libellé doit figurer sur au moins trois documents.
  • Ensemble de données de test : 2 000 documents maximum et 8 000 pages maximum
  • Ensemble de données de test : chaque étiquette doit figurer sur au moins trois documents.
  • 20 pages maximum par document
Limites pour entraîner un classificateur de documents personnalisé (CDC) ou un séparateur de documents personnalisé (CDS)
  • Nombre maximal de documents dans l'ensemble de données d'entraînement : 30 000 ; nombre maximal de pages : 100 000
  • Ensemble de données d'entraînement : chaque étiquette doit figurer sur au moins 10 documents
  • Ensemble de données de test : 2 000 documents maximum et 8 000 pages maximum
  • Ensemble de données de test : chaque étiquette doit figurer sur au moins deux documents.
  • 200 pages maximum par document
Étiquetage
  • Pour commencer, vérifiez que les libellés de document respectent les seuils d'entraînement et d'évaluation minimaux définis.
  • Pour commencer à évaluer les performances du modèle pour les documents dont la mise en page varie, libellez au moins 100 documents. Plus précisément, vérifiez que chaque libellé figure sur 50 documents d'entraînement et 50 documents d'évaluation.
  • Nombre maximal d'étiquettes (champs) autorisé : 150
  • Limites de taille des libellés (caractères) : les éléments longs ne sont pas bien pris en charge, mais il n'y a pas de limite explicite. Divisez les documents en fragments de 800 à 1 000 jetons, avec un chevauchement de 100 à 200 jetons entre les fragments. (Les éléments plus longs que la zone de chevauchement peuvent présenter des problèmes de qualité.)
  • Occurrences de libellés dans un document : aucune limite
Couverture géographique
  • Régions généralement acceptées : États-Unis, UE (multirégion)
  • Régions où l'accessibilité est limitée : Allemagne, Australie, Canada, Inde, Royaume-Uni, Singapour