このページでは、光学式文字認識(OCR)サービスを使用するために Google Distributed Cloud(GDC)エアギャップ プロジェクトを設定する方法について説明します。このプロセスには、プロジェクトの作成、OCR API の有効化、クライアント ライブラリのインストール、環境変数の定義、認証情報の認証が含まれます。Vertex AI を初めて使用する場合は、文字認識機能の詳細をご覧ください。
GDC コンソールと gdcloud CLI を使用して、次のように文字認識プロジェクトを設定します。
- GDC コンソール: OCR API を有効にして、サービス ステータスとエンドポイントを表示します。
- gdcloud CLI: OCR API とやり取りするサービス アカウントの構成、クライアント ライブラリのインストール、API リクエストの認証を行います。
プロジェクトを作成する
Distributed Cloud のリソース階層内に文字認識プロジェクトを作成すると、共同編集者、有効化された API、モニタリング ツール、お支払い情報、認証情報、アクセス制御などの OCR リソースが整理されます。
プロジェクトを作成するには、Vertex AI 用にプロジェクトを設定するをご覧ください。API 呼び出しを行うには、プロジェクト ID が必要です。
デベロッパー権限をリクエストする
光学式文字認識機能にアクセスし、リクエストの認証と認可用の API トークンを生成するには、プロジェクトで AI OCR デベロッパー ロールが必要です。
プロジェクトの IAM 管理者に、プロジェクトの Namespace 内のユーザーまたはサービス アカウントに AI OCR デベロッパー(ai-ocr-developer
)ロールを付与するよう依頼します。このロールの詳細については、IAM 権限を準備するをご覧ください。
OCR API を有効にする
プロジェクトで OCR 事前トレーニング済み API を有効にする必要があります。有効にすると、OCR 事前トレーニング済み API のサービス ステータスとエンドポイントを表示できます。
クライアント ライブラリのインストール
クライアント ライブラリは Python プログラミング言語で使用できます。こうしたクライアント ライブラリを使用して OCR API を呼び出すと、API へのアクセスが容易になるため、ライブラリの使用をおすすめします。
OCR クライアント ライブラリをインストールし、次の手順に沿って正しいバージョンであることを確認します。
OCR クライアント ライブラリがインストールされているかどうかを確認し、バージョン番号を取得します。
pip freeze | grep vision
クライアント ライブラリがすでにインストールされている場合は、次の例のような出力が得られます。
google-cloud-vision==3.0.0
取得したバージョン番号は、次のエンドポイントのクライアント ライブラリと一致している必要があります。
https://GDC_URL/.well-known/static/client-libraries
GDC_URL
は、GDC の組織の URL に置き換えます。バージョン番号が一致しない場合は、クライアント ライブラリをアンインストールします。
pip uninstall google-cloud-vision
OCR クライアント ライブラリをアンインストールした場合は、オペレーティング システムに対応するファイル名を指定して、再インストールする必要があります。
環境変数を設定する
OCR クライアント ライブラリをインストールすると、Python スクリプトから API を操作できます。
プログラムで承認済みの API 呼び出しを行うようにプロジェクトでサービス アカウントを設定した場合は、Python スクリプトで環境変数を定義して、実行時にサービス アカウント キーなどの値にアクセスできます。
Python スクリプトで必要な環境変数を設定する手順は次のとおりです。
OCR 事前トレーニング済み API とやり取りするための JupyterLab ノートブックを作成します。
JupyterLab ノートブックで Python スクリプトを作成します。
Python スクリプトに次のコードを追加します。
import os os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
APPLICATION_DEFAULT_CREDENTIALS_FILENAME
は、プロジェクトで作成したサービス アカウント キーを含む JSON ファイルの名前に置き換えます(例:my-service-key.json
)。Python スクリプトを
vision.py
などの名前で保存します。Python スクリプトを実行して環境変数を設定します。
python SCRIPT_NAME
SCRIPT_NAME
は、Python スクリプトに付けた名前(vision.py
など)に置き換えます。
認証を設定する
OCR API の使用を開始する前に、クライアント認証情報を認証し、プロジェクト リソースへのアカウント アクセスをリクエストする必要があります。詳細については、API リクエストを認証するをご覧ください。