功能清單

Vision API 目前可讓您使用下列功能:

所有地圖項目類型

文字偵測

路標圖片
  • 針對圖片執行光學字元辨識 (OCR),將文字辨識並轉換成機器編碼文字。找出並擷取圖片中的 UTF-8 文字。
  • 圖片:針對大型圖片中稀疏的文字區域進行最佳化。
  • 回應:傳回文字、邊界框和 textAnnotations 所識別的字詞清單,以及 OCR 偵測文字 (fullTextAnnotation) 的結構層級。
    • 擷取的文字結構層級:
      • TextAnnotation -> 頁面 -> 區塊 -> 段落 -> 字詞 -> 符號。
      • 每個來自 Page on 的結構元件可能還有各自的屬性,例如偵測到的語言、中斷點等。
  • 支援的語言:支援目前支援、對應和實驗的語言。
  • 功能列舉值:TEXT_DETECTION

文件文字偵測 (密集文字 / 手寫字跡)

含有註解的密集圖像
手寫圖片
  • 針對檔案 (PDF/TIFF) 或密集文字圖片執行光學字元辨識 (OCR),並將密集文字辨識並轉換成機器編碼文字。
  • 檔案:針對文件檔案 (PDF/TIFF) 進行最佳化。
  • 圖片:針對圖片中密集的文字區域 (圖片為文件) 和含有手寫文字的圖片進行最佳化。
  • 回應:傳回 OCR 偵測到的文字 (fullTextAnnotation) 的結構階層。
    • 擷取的文字結構層級:
      • TextAnnotation -> 頁面 -> 區塊 -> 段落 -> 字詞 -> 符號。
      • 每個來自 Page on 的結構元件可能還會有各自的屬性,例如偵測到的語言、斷行等。
  • 支援的語言:支援目前支援、對應和實驗的語言。
  • 功能列舉值:DOCUMENT_TEXT_DETECTION
    • 如果同時要求 DOCUMENT_TEXT_DETECTIONTEXT_DETECTION,則優先採用。

地標偵測 1

聖巴西爾大教堂圖片
  • 提供地標的名稱、信心分數,以及圖片中地標的邊界框。
  • 提供偵測到的實體座標。

標誌偵測 2

標註標誌
  • 提供所識別實體的文字說明、信心分數,以及檔案中標誌的邊界多邊形。

標籤偵測 3

上海街景圖片
  • 為圖片提供通用標籤。
  • 針對每個標籤傳回文字說明、信心分數和主題評分。

圖片屬性 4

含有地點資訊的峇里島圖片
  • 傳回圖片中的主要顏色。
  • 每個顏色都會以 RGBA 色域表示,並且具有信心分數,以及顯示顏色 [0, 1] 所佔的像素百分比。

物件定位 5

含有定界框的圖片
  • 針對單一圖片中辨識到的多個物件,提供一般標籤和定界框註解。
  • 系統會針對每個偵測到的物件傳回下列元素:文字說明、信心分數,以及物件周圍邊界多邊形的標準化頂點 [0,1]。

裁剪提示偵測 6

裁剪圖片
  • 為每個要求提供裁剪圖片的定界多邊形、信心分數,以及此顯目區域相對於原始圖片的重要性百分比。
  • 您最多可以為單一圖片提供 16 個顯示比例值 (寬度:高度)。

網路實體和網頁 7

含有網路實體表格的圖片
  • 為圖片提供一系列相關的網頁內容。
  • 傳回以下資訊:
    • 網路實體:從網路上的類似圖片推斷出的實體 (標籤/說明)。
    • 完全相符的圖片:網際網路上任何大小的完全相符圖片網址清單。
    • 部分比對圖片:共用關鍵點功能的圖片網址清單,例如原始圖片的裁剪版本。
    • 含有相符圖片的網頁:含有相符圖片的網頁清單 (以網頁網址、網頁標題、相符圖片網址識別),這些圖片符合上述條件。
    • 外觀相似的圖片:與原始圖片共用部分特徵的圖片網址清單。
    • 最佳推測標籤:根據網際網路上的相似圖片推測所要求圖片的主題。

煽情露骨內容偵測 (安全搜尋)

  • 為下列露骨內容類別提供可能性評等:adultspoofmedicalviolenceracy
  • 可能性分級以 6 種不同值表示:UNKNOWNVERY_UNLIKELYUNLIKELYPOSSIBLELIKELYVERY_LIKELY

臉部偵測

含有臉部偵測的範例圖片
  • 使用邊界多邊形找出臉孔,並識別特定臉部「地標」,例如眼睛、耳朵、鼻子、嘴巴等,以及對應的信心值。
  • 傳回情緒 (喜悅、悲傷、憤怒、驚訝) 和一般圖片屬性 (曝光不足、模糊、有頭飾) 的可能性評分。
  • 可能性分級以 6 種不同值表示:UNKNOWNVERY_UNLIKELYUNLIKELYPOSSIBLELIKELYVERY_LIKELY
  • 不支援特定個人臉部辨識

1. 圖片來源Nikolay VorobyevUnsplash 上提供 (已加入註解)。

2. 圖片版權Robert Scoble (CC BY 2.0新增註解)。

3. 圖片版權Alex Knight,圖片來源:Unsplash

4. 圖片版權Jeremy Bishop,圖片來源:Unsplash

5. 圖片出處: Bogdan Dada (Unsplash) (已加入註解)

6. 圖片版權 Yasmin Dangor (Unsplash 上的圖片,顯示原始圖片和裁剪後的圖片)。

7. 圖片來源Quinten de Graaf 提供,取自 Unsplash