上限

このドキュメントでは、Document AI に適用されるシステムの上限について説明します。割り当てとは異なり、システムの上限は変更できません。

コンテンツの上限

次のコンテンツの上限は、すべての Document AI プロセッサに適用されます。

コンテンツの上限
画像の最大解像度
(PDF ファイルには制限が適用されません)
4,000 万ピクセル(画像に複数のページが含まれている場合はページあたり)
オンライン処理リクエストの最大ファイルサイズ 40 MB
バッチ処理リクエストの最大ファイルサイズ 1 GB
バッチ処理リクエストあたりのファイル数 5,000 ファイル

プロセッサの上限

上限は現在のリストで定義されています。

抽出プロセッサ

プロセッサ 上限
カスタム エクストラクタ
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
Form パーサー
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 100
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
レイアウト パーサー
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 500
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30

分類プロセッサ

プロセッサ 上限
カスタム分類器
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
カスタム スプリッター
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 1000
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30

プロセッサのデジタル化

プロセッサ 上限
Enterprise Document OCR(光学式文字認識)
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 500
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30

事前トレーニング済みプロセッサ

プロセッサ 上限
銀行明細書パーサー
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 30
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
W2 パーサー
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 15
最大ページ数(画像なしモードのオンライン/同期リクエスト): 15
米国パスポート パーサー
最大ページ数(オンライン/同期リクエスト): 2
最大ページ数(バッチ/オフライン/非同期リクエスト): 2
最大ページ数(画像なしモードのオンライン/同期リクエスト): 2
光熱費明細書パーサー
最大ページ数(オンライン/同期リクエスト): 10
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
身分証明書パーサー
最大ページ数(オンライン/同期リクエスト): 2
最大ページ数(バッチ/オフライン/非同期リクエスト): 2
最大ページ数(画像なしモードのオンライン/同期リクエスト): 2
支払い明細パーサー
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 50
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
米国運転免許証パーサー
最大ページ数(オンライン/同期リクエスト): 2
最大ページ数(バッチ/オフライン/非同期リクエスト): 2
最大ページ数(画像なしモードのオンライン/同期リクエスト): 2
経費パーサー
最大ページ数(オンライン/同期リクエスト): 10
最大ページ数(バッチ/オフライン/非同期リクエスト): 10
最大ページ数(画像なしモードのオンライン/同期リクエスト): 10
請求書パーサー
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30

Document AI の制限事項

Document AI には、現在の制限事項があります。

条件 安定版リリース(2023 年 7 月)
データセット
  • 合計 30,000 個のドキュメントまで
  • 合計 250,000 ページまで
ドキュメントのインポート
  • 1 回のインポートで最大 5,000 個のドキュメント
  • ドキュメントあたり最大 200 ページ
カスタム ドキュメント エクストラクタ(CDE)のトレーニングの制限 モデルベースのトレーニング (一般提供)
  • トレーニング データセットの最大数: 25,000 個のドキュメント、100,000 ページ
  • トレーニング データセットの最小要件: 各ラベルは、10 個のドキュメントごとに少なくとも 1 つのラベルに存在する必要があります
  • テスト データセットの最大数: 2,000 件のドキュメント、8,000 ページ
  • テスト データセットの最小要件: 各ラベルが 10 個以上のドキュメントに存在していること
  • ドキュメントあたり最大 200 ページ

テンプレート ベースのトレーニング (一般提供)
  • トレーニング データセットの最大数: 300 個のドキュメント、300 ページ
  • トレーニング データセットの最小要件: 各ラベルが少なくとも 3 つのドキュメントに存在していること
  • テスト データセットの最大数: 2,000 件のドキュメント、8,000 ページ
  • テスト データセットの最小要件: 各ラベルが少なくとも 3 個のドキュメントに存在していること
  • ドキュメントあたり最大 20 ページ
カスタム ドキュメント分類器(CDC)またはカスタム ドキュメント スプリッター(CDS)のトレーニングの制限
  • トレーニング データセットの最大数: 30,000 のドキュメント、100,000 のページ
  • トレーニング データセットの最小要件: 各ラベルが少なくとも 10 個のドキュメントに存在していること
  • テスト データセットの最大数: 2,000 件のドキュメント、8,000 ページ
  • テスト データセットの最小要件: 各ラベルが 2 つ以上のドキュメントに存在している
  • ドキュメントあたり最大 200 ページ
ラベル付け
  • まず、ドキュメント ラベルが定義された最小トレーニングしきい値と評価しきい値を満たしていることを確認します。
  • レイアウトのバリエーションがあるドキュメントのモデル パフォーマンスの評価を開始するには、少なくとも 100 個のドキュメントにラベルを付けます。具体的には、各ラベルがトレーニングで 50 個、評価で 50 個のドキュメントに存在することを確認します。
  • 許容されるラベル(フィールド)の最大数: 150
  • ラベルのサイズ制限(文字数): 長いアイテムは十分にサポートされていませんが、明示的な制限はありません。ドキュメントを 800 ~ 1,000 トークンのチャンクに分割し、チャンク間で 100 ~ 200 トークンを重複させます。(重複する領域よりも長いアイテムは、品質に関する問題が発生する可能性があります)。
  • ドキュメント内のラベルの出現回数: 無制限
地理的な対象範囲
  • 一般的にサポートされているリージョン: 米国、EU(マルチリージョン)
  • 一部の地域: ドイツ、シンガポール、英国、カナダ、インド、オーストラリア