ファイル形式
Document AI は、次の画像形式をサポートしています。
ファイルサイズとページの上限については、割り当てと上限のページをご覧ください。
名前 | ファイル拡張子 | MIME タイプ |
---|---|---|
Portable Document Format(PDF) | .pdf |
application/pdf |
Graphics Interchange Format(GIF) | .gif |
image/gif |
Tagged Image File Format(TIFF) | .tiff 、.tif |
image/tiff |
Joint Photographic Experts Group(JPEG) | .jpg 、.jpeg |
image/jpeg |
Portable Network Graphics(PNG) | .png |
image/png |
ビットマップ(BMP) | .bmp |
image/bmp |
WebP | .webp |
image/webp |
ハイパーテキスト マークアップ言語(HTML) | .html |
text/html |
Microsoft Word Office Open XML(OOXML)(プレビュー) | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Microsoft PowerPoint OOXML(プレビュー) | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Microsoft Excel OOXML(プレビュー) | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
これらの画像形式の中には、「ロッシー(lossy)」な性質のものがあります(たとえば JPEG)。ロッシー形式のファイルサイズを縮小すると、画質が低下し、Document AI の結果の精度が低下する可能性があります。
ドキュメント スキャンの解像度
Document AI で最も正確な OCR 結果を得るには、ドキュメント スキャンは 200 dpi (1 インチあたりのドット数)以上にする必要があります。一般的に、300 dpi 以上の解像度で最適な結果が得られます。OCR の精度は、解像度と最小フォントサイズの両方に依存します。また、ドキュメント(手書きの場合は手書き)の品質などの他の要因にも依存するため、テストをおすすめします。画質分析機能は、解像度に関する懸念事項の評価に役立ちます。
注: バーコードを読み取るには、米国の運転免許証の裏面の画像は 2,000 x 3,000 ピクセルが必要です。