Cloud Vision API 說明文件
開發人員可透過 Cloud Vision API,輕鬆將視覺偵測功能整合至應用程式,包括為圖片加上標籤、臉部和地標偵測、光學字元辨識 (OCR),以及為煽情露骨內容加上標記。
使用價值 $300 美元的免費抵免額,開始進行概念驗證
- 取得 Gemini 2.0 Flash Thinking 的存取權
- 每月免費使用 AI API 和 BigQuery 等熱門產品
- 不會自動收費,也不會要求您一定要購買特定方案
繼續探索超過 20 項一律免費的產品
使用超過 20 項實用的免費產品,包括 AI API、VM 和 data warehouse 等。
說明文件資源
相關資源
OCR 教學課程
瞭解如何在 Google Cloud Platform 上執行光學字元辨識 (OCR)。本教學課程示範如何將圖片檔案上傳至 Google Cloud Storage、使用 Google Cloud Vision API 從圖片擷取文字、使用 Google Cloud Translation API 翻譯文字,以及將翻譯存回 Cloud Storage。
在控制台中建立簡單的 Hello, World! 函式
不必進行任何本機設定,即可快速部署第一個函式。
大數據與機器學習基礎知識
在這個為期一天的課程中,講師會帶領學員瞭解 Google Cloud 的大數據和機器學習功能。這份指南會快速介紹 Google Cloud,並深入探討資料處理功能。
連結 Functions、Storage、Vision API、Pub/Sub 和 Translation API,偵測圖片中的文字
使用函式回應 Cloud Storage 的變更,透過 Vision API 處理圖片以擷取文字,然後將文字傳遞至其他服務。
使用 DLP API 和 Cloud Functions 自動分類上傳至 Cloud Storage 的資料
使用 Pub/Sub、Cloud Functions 和 Data Loss Prevention API,自動分類上傳至 Cloud Storage 的資料。
在單一要求中加註多張圖片,並將輸出內容儲存在 Cloud Storage 中
使用任何 Vision 功能類型,離線 (非同步) 執行偵測服務,並為大量圖片檔案加上註解。
為 OCR 要求設定儲存和處理位置
設定特定區域,用於儲存及處理光學字元辨識 (OCR) 要求所用的資源。
偵測並模糊處理令人反感的圖片內容
示範如何使用 Google Cloud Vision API 和 ImageMagick,偵測上傳至 Cloud Storage 值區的不雅圖片,並將其模糊處理。
使用詞彙來翻譯及朗讀相片中的文字 (進階版)
使用 Vision API、Translation API 和 Text-to-Speech API 偵測圖片中的文字、個人化翻譯內容,以及根據翻譯文字生成合成語音。
偵測圖片中的文字 (OCR),並在找到的文字周圍加上邊框
使用 Vision API 辨識圖片中的文字,然後根據偵測到的文字為圖片加上註解。
相關影片
親自試用 Cloud Vision API
新客戶還能獲得價值$300 美元的免費抵免額,可用於執行、測試及部署工作負載。