支援的映像檔

檔案格式

Vision API 支援下列圖片類型:

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • GIF 動畫 (僅限第一個影格)
  • BMP
  • WEBP
  • RAW
  • ICO
  • PDF
  • TIFF

請注意,其中部分圖片格式會造成資料損失 (例如 JPEG)。縮減這類有損失的格式檔案大小,可能會導致圖片品質下降,進而影響 Vision API 的準確度。

圖片大小

為在 Vision API 中進行精確的圖像偵測,圖片通常應至少為 640 x 480 像素 (約 30 萬像素)。不同類型的 Vision API 功能要求的完整詳細資料如下:

Vision API 功能 建議大小 * 附註
FACE_DETECTION 1600 x 1200 眼睛之間的距離最為重要
LANDMARK_DETECTION 640 x 480
LOGO_DETECTION 640 x 480
LABEL_DETECTION 640 x 480
TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 1024 x 768 光學字元辨識功能需要更高的解析度才能偵測字元
SAFE_SEARCH_DETECTION 640 x 480

這些建議的大小會因偵測到的地圖項目而異。舉例來說,FACE_DETECTION 要求通常需要較大的圖片大小,因為要偵測的特徵 (臉孔) 比圖片本身小。另一方面,LABEL_DETECTION 要求通常會評估整個圖片。

實際上,在大多數情況下,640 x 480 像素的標準大小都很實用;如果尺寸超過這個值,準確度可能不會有太大提升,但傳送量會大幅減少。盡可能預先處理圖片,將圖片大小縮減至這些最低標準。

檔案大小

傳送至 Vision API 的圖片檔大小不得超過 20 MB。檔案大小超過 20 MB 會產生錯誤。Vision API 不會調整這類檔案的大小。縮減檔案大小可大幅提升處理量,但請注意不要因此降低圖片品質。請注意,Vision API 的 JSON 要求大小限制為 10 MB;較大的檔案應託管在 Cloud Storage 或網站上,而非以 JSON 本身的 base64 編碼內容傳遞。