檔案格式
Vision API 支援下列圖片類型:
- JPEG
- PNG8
- PNG24
- GIF
- GIF 動畫 (僅限第一個影格)
- BMP
- WEBP
- RAW
- ICO
- TIFF
請注意,其中部分圖片格式會造成資料損失 (例如 JPEG)。縮減這類有損失的格式檔案大小,可能會導致圖片品質下降,進而影響 Vision API 的準確度。
圖片大小
為在 Vision API 中進行精確的圖像偵測,圖片通常應至少為 640 x 480 像素 (約 30 萬像素)。不同類型的 Vision API 功能要求的完整詳細資料如下:
Vision API 功能 | 建議大小 * | 附註 |
---|---|---|
FACE_DETECTION | 1600 x 1200 | 眼睛之間的距離最為重要 |
LANDMARK_DETECTION | 640 x 480 | |
LOGO_DETECTION | 640 x 480 | |
LABEL_DETECTION | 640 x 480 | |
TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION | 1024 x 768 | 光學字元辨識功能需要更高的解析度才能偵測字元 |
SAFE_SEARCH_DETECTION | 640 x 480 |
這些建議的大小會因偵測到的地圖項目而異。舉例來說,FACE_DETECTION
要求通常需要較大的圖片大小,因為要偵測的特徵 (臉孔) 比圖片本身小。另一方面,LABEL_DETECTION
要求通常會評估整個圖片。
實際上,在大多數情況下,640 x 480 像素的標準大小都很實用;如果尺寸超過這個值,準確度可能不會有太大提升,但傳送量會大幅減少。盡可能預先處理圖片,將圖片大小縮減至這些最低標準。
檔案大小
傳送至 Vision API 的圖片檔大小不得超過 20 MB。檔案大小超過 20 MB 會產生錯誤。Vision API 不會調整這類檔案的大小。縮減檔案大小可大幅提升處理量,但請注意不要因此降低圖片品質。請注意,Vision API 的 JSON 要求大小限制為 10 MB;較大的檔案應託管在 Cloud Storage 或網站上,而非以 JSON 本身的 base64 編碼內容傳遞。