サポートされているファイル

ファイル形式

Document AI は、次の画像形式をサポートしています。

ファイルサイズとページの上限については、割り当てと上限のページをご覧ください。

名前 ファイル拡張子 MIME タイプ
Portable Document Format(PDF) .pdf application/pdf
Graphics Interchange Format(GIF) .gif image/gif
Tagged Image File Format(TIFF) .tiff.tif image/tiff
Joint Photographic Experts Group(JPEG) .jpg.jpeg image/jpeg
Portable Network Graphics(PNG) .png image/png
ビットマップ(BMP) .bmp image/bmp
WebP .webp image/webp
ハイパーテキスト マークアップ言語(HTML) .html text/html

これらの画像形式の中には、「ロッシー(lossy)」な性質のものがあります(たとえば JPEG)。ロスレス形式のファイルサイズを縮小すると、画像の品質が低下し、Document AI の結果の精度が低下する可能性があります。

ドキュメント スキャンの解像度

Document AI で最も正確な OCR 結果を得るには、ドキュメントのスキャン解像度が 200 dpi(インチあたりのドット数)以上である必要があります。通常、300 dpi 以上で最適な結果が得られます。OCR の精度は、解像度と最小フォントサイズの両方に加え、ドキュメント(手書きの場合は手書き)の品質などの他の要因によって異なります。そのため、テストをおすすめします。画質分析機能は、解像度に関する懸念事項の評価に役立ちます。

注: 米国の運転免許証の裏面画像では、バーコードを読み取るために 2,000 x 3,000 ピクセルの画像が必要です。