功能清單
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
Vision API 目前可讓您使用下列功能:
所有地圖項目類型 |
|
- 針對圖片執行光學字元辨識 (OCR),將文字辨識並轉換成機器編碼文字。找出並擷取圖片中的 UTF-8 文字。
- 圖片:針對大型圖片中稀疏的文字區域進行最佳化。
- 回應:傳回文字、邊界框和
textAnnotations 所識別的字詞清單,以及 OCR 偵測文字 (fullTextAnnotation ) 的結構層級。
- 擷取的文字結構層級:
- TextAnnotation -> 頁面 -> 區塊 -> 段落 -> 字詞 -> 符號。
- 每個來自 Page on 的結構元件可能還有各自的屬性,例如偵測到的語言、中斷點等。
- 支援的語言:支援目前支援、對應和實驗的語言。
- 功能列舉值:
TEXT_DETECTION 。
|
|
- 針對檔案 (PDF/TIFF) 或密集文字圖片執行光學字元辨識 (OCR),並將密集文字辨識並轉換成機器編碼文字。
- 檔案:針對文件檔案 (PDF/TIFF) 進行最佳化。
- 圖片:針對圖片中密集的文字區域 (圖片為文件) 和含有手寫文字的圖片進行最佳化。
- 回應:傳回 OCR 偵測到的文字 (
fullTextAnnotation ) 的結構階層。
- 擷取的文字結構層級:
- TextAnnotation -> 頁面 -> 區塊 -> 段落 -> 字詞 -> 符號。
- 每個來自 Page on 的結構元件可能還會有各自的屬性,例如偵測到的語言、斷行等。
- 支援的語言:支援目前支援、對應和實驗的語言。
- 功能列舉值:
DOCUMENT_TEXT_DETECTION 。
- 如果同時要求
DOCUMENT_TEXT_DETECTION 和 TEXT_DETECTION ,則優先採用。
|
|
- 提供地標的名稱、信心分數,以及圖片中地標的邊界框。
- 提供偵測到的實體座標。
|
|
- 提供所識別實體的文字說明、信心分數,以及檔案中標誌的邊界多邊形。
|
|
- 為圖片提供通用標籤。
- 針對每個標籤傳回文字說明、信心分數和主題評分。
|
|
- 傳回圖片中的主要顏色。
- 每個顏色都會以 RGBA 色域表示,並且具有信心分數,以及顯示顏色 [0, 1] 所佔的像素百分比。
|
|
|
|
- 為每個要求提供裁剪圖片的定界多邊形、信心分數,以及此顯目區域相對於原始圖片的重要性百分比。
- 您最多可以為單一圖片提供 16 個顯示比例值 (寬度:高度)。
|
|
- 為圖片提供一系列相關的網頁內容。
- 傳回以下資訊:
- 網路實體:從網路上的類似圖片推斷出的實體 (標籤/說明)。
- 完全相符的圖片:網際網路上任何大小的完全相符圖片網址清單。
- 部分比對圖片:共用關鍵點功能的圖片網址清單,例如原始圖片的裁剪版本。
- 含有相符圖片的網頁:含有相符圖片的網頁清單 (以網頁網址、網頁標題、相符圖片網址識別),這些圖片符合上述條件。
- 外觀相似的圖片:與原始圖片共用部分特徵的圖片網址清單。
- 最佳推測標籤:根據網際網路上的相似圖片推測所要求圖片的主題。
|
|
- 為下列露骨內容類別提供可能性評等:
adult 、spoof 、medical 、violence 和 racy 。
- 可能性分級以 6 種不同值表示:
UNKNOWN 、VERY_UNLIKELY 、UNLIKELY 、POSSIBLE 、LIKELY 或 VERY_LIKELY 。
|
|
- 使用邊界多邊形找出臉孔,並識別特定臉部「地標」,例如眼睛、耳朵、鼻子、嘴巴等,以及對應的信心值。
- 傳回情緒 (喜悅、悲傷、憤怒、驚訝) 和一般圖片屬性 (曝光不足、模糊、有頭飾) 的可能性評分。
- 可能性分級以 6 種不同值表示:
UNKNOWN 、VERY_UNLIKELY 、UNLIKELY 、POSSIBLE 、LIKELY 或 VERY_LIKELY 。
- 不支援特定個人臉部辨識。
|
1.
圖片來源:Nikolay Vorobyev 在 Unsplash 上提供 (已加入註解)。↩
2.
圖片版權:Robert Scoble
(CC BY 2.0,新增註解)。
↩
3.
圖片版權:Alex Knight,圖片來源:Unsplash。↩
4.
圖片版權:Jeremy Bishop,圖片來源:Unsplash。↩
5.
圖片出處:
Bogdan Dada (Unsplash) (已加入註解)。↩
6.
圖片版權:
Yasmin Dangor (Unsplash 上的圖片,顯示原始圖片和裁剪後的圖片)。
↩
7.
圖片來源:Quinten de Graaf 提供,取自 Unsplash。↩
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-06-16 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2025-06-16 (世界標準時間)。"],[],[]]