本頁面可協助開發人員設定 Google Distributed Cloud (GDC) 實體隔離專案,以使用光學字元辨識 (OCR) 服務。這個程序包括建立專案、啟用 OCR API、安裝用戶端程式庫、定義環境變數,以及驗證憑證。如果您是 Vertex AI 新手,請進一步瞭解字元辨識功能。
使用 GDC 控制台和 gdcloud CLI 設定字元辨識專案,步驟如下:
- GDC 控制台:啟用 OCR API,並查看服務狀態和端點。
- gdcloud CLI:設定服務帳戶以與 OCR API 互動、安裝用戶端程式庫,以及驗證 API 要求。
建立專案
在 Distributed Cloud 資源階層結構中建立字元辨識專案,即可整理 OCR 資源,包括協作者、已啟用的 API、監控工具、帳單資訊、驗證憑證和存取權控管。
如要建立專案,請參閱「設定 Vertex AI 專案」。 進行 API 呼叫時,您需要專案 ID。
要求開發人員權限
您必須在專案中具備 AI OCR 開發人員角色,才能存取光學字元辨識功能,並產生 API 權杖以進行要求驗證和授權。
請專案 IAM 管理員在專案命名空間中,將 AI OCR 開發人員 (ai-ocr-developer
) 角色授予使用者或服務帳戶。如需這個角色的相關資訊,請參閱「準備 IAM 權限」。
啟用 OCR API
您必須為專案啟用 OCR 預先訓練 API。啟用後,您就能查看 OCR 預先訓練 API 的服務狀態和端點。
安裝用戶端程式庫
用戶端程式庫支援 Python 程式設計語言。建議使用這些用戶端程式庫呼叫 OCR API,因為這樣存取 API 會更輕鬆。
安裝 OCR 用戶端程式庫,並按照下列步驟操作,確保您使用的是正確版本:
檢查是否已安裝 OCR 用戶端程式庫,並取得版本號碼:
pip freeze | grep vision
如果已安裝用戶端程式庫,您會取得類似下列範例的輸出內容:
google-cloud-vision==3.0.0
您取得的版本號碼必須與下列端點的用戶端程式庫相符:
https://GDC_URL/.well-known/static/client-libraries
將
GDC_URL
替換為 GDC 中貴機構的網址。如果版本號碼不相符,請解除安裝用戶端程式庫:
pip uninstall google-cloud-vision
如果已解除安裝 OCR 用戶端程式庫,請指定與作業系統對應的檔案名稱,重新安裝該程式庫。
設定環境變數
安裝 OCR 用戶端程式庫後,您就可以透過 Python 指令碼與 API 互動。
如果您在專案中設定服務帳戶,以透過程式建立已獲授權的 API 呼叫,可以在 Python 指令碼中定義環境變數,以便在執行時存取服務帳戶金鑰等值。
請按照下列步驟,在 Python 指令碼中設定必要環境變數:
建立 JupyterLab 筆記本,與 OCR 預先訓練 API 互動。
在 JupyterLab 筆記本上建立 Python 指令碼。
在 Python 指令碼中新增下列程式碼:
import os os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
將
APPLICATION_DEFAULT_CREDENTIALS_FILENAME
替換為包含您在專案中建立的服務帳戶金鑰的 JSON 檔案名稱,例如my-service-key.json
。將 Python 指令碼儲存為
vision.py
等名稱。執行 Python 指令碼來設定環境變數:
python SCRIPT_NAME
將
SCRIPT_NAME
替換為您為 Python 指令碼提供的名稱,例如vision.py
。
設定驗證方法
開始使用 OCR API 之前,請先驗證用戶端憑證,並要求帳戶存取專案資源。詳情請參閱「驗證 API 要求」。