制限
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
このドキュメントでは、Document AI に適用されるシステムの上限について説明します。割り当てとは異なり、システムの上限は変更できません。
コンテンツの上限
次のコンテンツの上限は、すべての Document AI プロセッサに適用されます。
コンテンツの上限 |
値 |
画像の最大解像度
(PDF ファイルには制限が適用されません) |
4,000 万ピクセル(画像に複数のページが含まれている場合はページあたり) |
オンライン処理リクエストの最大ファイルサイズ |
40 MB |
バッチ処理リクエストの最大ファイルサイズ |
1 GB |
バッチ処理リクエストあたりのファイル数 |
5,000 ファイル |
プロセッサの上限
上限は現在のリストで定義されています。
分類プロセッサ
プロセッサのデジタル化
事前トレーニング済みプロセッサ
Document AI の制限事項
Document AI には、現在の制限事項があります。
条件 |
安定版リリース(2023 年 7 月) |
---|
データセット |
- 合計 30,000 個のドキュメントまで
- 合計 250,000 ページまで
|
ドキュメントのインポート |
- 1 回のインポートで最大 5,000 個のドキュメント
- ドキュメントあたりの最大ページ数: 200
|
カスタム ドキュメント エクストラクタ(CDE)のトレーニングの制限 |
モデルベースのトレーニング (一般提供)
- トレーニング データセットの最大数: 25,000 個のドキュメント、100,000 ページ
- トレーニング データセットの最小要件: 各ラベルは、10 個のドキュメントごとに少なくとも 1 つのラベルに存在する必要があります
- テスト データセットの最大数: 2,000 件のドキュメント、8,000 ページ
- テスト データセットの最小要件: 各ラベルが 10 個以上のドキュメントに存在していること
- ドキュメントあたりの最大ページ数: 200
テンプレート ベースのトレーニング (一般提供)
- トレーニング データセットの最大数: 300 個のドキュメント、300 ページ
- トレーニング データセットの最小要件: 各ラベルが少なくとも 3 つのドキュメントに存在していること
- テスト データセットの最大数: 2,000 件のドキュメント、8,000 ページ
- テスト データセットの最小要件: 各ラベルが少なくとも 3 個のドキュメントに存在していること
- ドキュメントあたり最大 20 ページ
|
カスタム ドキュメント分類器(CDC)またはカスタム ドキュメント スプリッター(CDS)のトレーニングの制限 |
- トレーニング データセットの最大値: 30,000 件のドキュメント、100,000 ページ
- トレーニング データセットの最小要件: 各ラベルが少なくとも 10 個のドキュメントに存在していること
- テスト データセットの最大数: 2,000 件のドキュメント、8,000 ページ
- テスト データセットの最小要件: 各ラベルが 2 つ以上のドキュメントに存在している
- ドキュメントあたりの最大ページ数: 200
|
ラベル付け |
- まず、ドキュメント ラベルが定義された最小トレーニングしきい値と評価しきい値を満たしていることを確認します。
- レイアウトのバリエーションがあるドキュメントのモデル パフォーマンスの評価を開始するには、少なくとも 100 個のドキュメントにラベルを付けます。具体的には、各ラベルがトレーニングで 50 個、評価で 50 個のドキュメントに存在することを確認します。
- 許容されるラベル(フィールド)の最大数: 150
- ラベルのサイズ制限(文字数): 長いアイテムは十分にサポートされていませんが、明示的な制限はありません。ドキュメントを 800 ~ 1,000 トークンのチャンクに分割し、チャンク間で 100 ~ 200 トークンを重複させます。(重複する領域よりも長いアイテムは、品質に関する問題が発生する可能性があります)。
- ドキュメント内のラベルの出現回数: 無制限
|
地理的な対象範囲 |
- 一般的にサポートされているリージョン: 米国、EU(マルチリージョン)
- 一部の地域で利用可能: ドイツ、シンガポール、英国、カナダ、インド、オーストラリア
|
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-09-10 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-09-10 UTC。"],[],[],null,[]]