限制

本文列出 Document AI 適用的系統限制。與配額不同,系統限制無法變更。

內容限制

下列內容限制適用於所有 Document AI 處理器。

內容限制
圖片解析度上限
(PDF 檔案不受此限制)
4000 萬像素 (如果圖片包含多個頁面,則為每頁 4000 萬像素)
線上處理要求的檔案大小上限 40 MB
批次處理要求的檔案大小上限 1 GB
每項批次處理要求可處理的檔案數 5,000 個檔案

處理器限制

限制定義在目前的清單中。

擷取處理器

處理器 限制
自訂擷取工具
頁面數量上限 (線上/同步要求): 15
頁面數量上限 (批次/離線/非同步要求): 200
頁數上限 (無圖片模式的線上/同步要求): 30
表單剖析器
頁面數量上限 (線上/同步要求): 15
頁面數量上限 (批次/離線/非同步要求): 100
頁數上限 (無圖片模式的線上/同步要求): 30
版面配置剖析器
頁面數量上限 (線上/同步要求): 15
頁面數量上限 (批次/離線/非同步要求): 500
頁數上限 (無圖片模式的線上/同步要求): 30

分類處理器

處理器 限制
自訂分類器
頁面數量上限 (線上/同步要求): 15
頁面數量上限 (批次/離線/非同步要求): 200
頁數上限 (無圖片模式的線上/同步要求): 30
自訂分割器
頁面數量上限 (線上/同步要求): 15
頁面數量上限 (批次/離線/非同步要求): 1000
頁數上限 (無圖片模式的線上/同步要求): 30

數位化處理器

處理器 限制
Enterprise Document OCR (光學字元辨識)
頁面數量上限 (線上/同步要求): 15
頁面數量上限 (批次/離線/非同步要求): 500
頁數上限 (無圖片模式的線上/同步要求): 30

預先訓練的處理器

處理器 限制
銀行對帳單剖析器
頁面數量上限 (線上/同步要求): 15
頁面數量上限 (批次/離線/非同步要求): 30
頁數上限 (無圖片模式的線上/同步要求): 30
W2 剖析器
頁面數量上限 (線上/同步要求): 15
頁面數量上限 (批次/離線/非同步要求): 15
頁數上限 (無圖片模式的線上/同步要求): 15
美國護照剖析器
頁面數量上限 (線上/同步要求): 2
頁面數量上限 (批次/離線/非同步要求): 2
頁數上限 (無圖片模式的線上/同步要求): 2
公用事業帳單剖析器
頁面數量上限 (線上/同步要求): 10
頁面數量上限 (批次/離線/非同步要求): 200
頁數上限 (無圖片模式的線上/同步要求): 30
身分證明文件剖析器
頁面數量上限 (線上/同步要求): 2
頁面數量上限 (批次/離線/非同步要求): 2
頁數上限 (無圖片模式的線上/同步要求): 2
薪資單剖析器
頁面數量上限 (線上/同步要求): 15
頁面數量上限 (批次/離線/非同步要求): 50
頁數上限 (無圖片模式的線上/同步要求): 30
美國駕照剖析器
頁面數量上限 (線上/同步要求): 2
頁面數量上限 (批次/離線/非同步要求): 2
頁數上限 (無圖片模式的線上/同步要求): 2
費用剖析器
頁面數量上限 (線上/同步要求): 10
頁面數量上限 (批次/離線/非同步要求): 10
頁數上限 (無圖片模式的線上/同步要求): 10
應付憑據剖析器
頁面數量上限 (線上/同步要求): 15
頁面數量上限 (批次/離線/非同步要求): 200
頁數上限 (無圖片模式的線上/同步要求): 30

Document AI 的限制

Document AI 目前有下列限制。

條件 2023 年 7 月發布穩定版
資料集
  • 最多 30,000 份文件
  • 最多 250,000 頁
匯入文件
  • 每次匯入最多 5,000 份文件
  • 每份文件最多 200 頁
訓練自訂文件擷取器 (CDE) 的限制 以模型為基礎的訓練 (正式發布)
  • 訓練資料集上限:25,000 份文件;100,000 頁
  • 訓練資料集下限:每 10 份文件中,每個標籤至少要有 1 個標籤
  • 測試資料集上限:2,000 份文件;8,000 頁
  • 測試資料集下限:每個標籤至少要有 10 份文件
  • 每份文件最多 200 頁

以範本為基礎的訓練 (正式發布版)
  • 訓練資料集上限:300 份文件、300 頁
  • 訓練資料集下限:每個標籤至少要有 3 份文件
  • 測試資料集上限:2,000 份文件;8,000 頁
  • 測試資料集下限:每個標籤至少要有 3 份文件
  • 每個文件最多 20 頁
訓練自訂文件分類器 (CDC) 或自訂文件分割器 (CDS) 的限制
  • 訓練資料集上限:30,000 份文件;100,000 頁
  • 訓練資料集下限:每個標籤至少要有 10 份文件
  • 測試資料集上限:2,000 份文件;8,000 頁
  • 測試資料集下限:每個標籤至少要有 2 份文件
  • 每份文件最多 200 頁
標籤
  • 如要開始使用,請確認文件標籤符合定義的最低訓練和評估門檻。
  • 如要開始評估模型在版面配置不同的文件中的成效,請至少為 100 份文件加上標籤。具體來說,請確認每個標籤在訓練和評估中都存在於 50 份文件中。
  • 最多可新增 150 個標籤 (欄位)
  • 標籤大小限制 (字元):系統不太支援長標籤,但沒有明確限制。將文件分成 800 或 1,000 個符記的片段,片段之間重疊 100 到 200 個符記。(如果項目長度超過重疊區域,可能會發生品質問題)。
  • 文件中標籤出現次數:無限制
地理涵蓋範圍
  • 一般支援的區域:美國、歐盟 (多區域)
  • 適用範圍有限的國家/地區:德國、新加坡、英國、加拿大、印度、澳洲