本頁面由 Cloud Translation API 翻譯而成。

支援的映像檔

檔案格式

Vision API 支援下列圖片類型：

JPEG
PNG8
PNG24
GIF
GIF 動畫 (僅限第一個影格)
BMP
WEBP
RAW
ICO
PDF
TIFF

請注意，部分圖片格式為「有損」格式 (例如 JPEG)。縮減這類有損格式的檔案大小可能會導致圖片品質下降，進而影響 Vision API 的準確度。

圖片大小

如要在 Vision API 中啟用準確的圖片偵測功能，圖片一般應至少為 640 x 480 像素 (約 30 萬像素)。以下是不同類型的 Vision API 功能要求完整詳細資料：

Vision API 功能	建議大小 *	附註
FACE_DETECTION	1600 x 1200	雙眼間的距離最重要
LANDMARK_DETECTION	640 x 480
LOGO_DETECTION	640 x 480
LABEL_DETECTION	640 x 480
TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION	1024 x 768	光學字元辨識需要更高解析度才能偵測字元
SAFE_SEARCH_DETECTION	640 x 480

建議尺寸會因偵測到的特徵而異。舉例來說，FACE_DETECTION 要求通常需要較大的圖片大小，因為要偵測的特徵 (臉部) 比圖片本身小。LABEL_DETECTION 請求通常會評估整張圖片。

實務上，640 x 480 像素的標準大小在大多數情況下都適用；如果大小超過這個標準，準確度可能不會大幅提升，但輸送量會大幅降低。請盡可能預先處理圖片，將圖片大小縮減至這些最低標準。

檔案大小

傳送至 Vision API 的圖片檔不得超過 20 MB。如果檔案超過 20 MB，系統會產生錯誤。Vision API 不會調整這類大小的檔案。縮減檔案大小可大幅提升輸送量，但請注意，縮減檔案大小時不要降低圖片品質。請注意，Vision API 的 JSON 要求大小上限為 10 MB；較大的檔案應託管在 Cloud Storage 或網路上，而不是以 base64 編碼內容的形式傳遞至 JSON 本身。