Cloud Vision API ドキュメント
Cloud Vision API を使用すると、開発するアプリケーションの中で簡単に画像検出機能を統合できます。この機能の例としては、画像ラベリング、顔やランドマークの検出、光学式文字認識(OCR)、露骨な表現を含むコンテンツへのタグ付けがあります。
$300 分の無料クレジットを使用して概念実証を始める
- Gemini 2.0 Flash Thinking を利用できます。
- AI API や BigQuery などの人気プロダクトの毎月の無料使用枠を利用できます。
- 自動請求は行われず、契約も不要です。
常に無料で利用可能な 20 以上のプロダクトを確認する
AI API、VM、データ ウェアハウスなど、一般的なユースケース向けの 20 以上のプロダクトを無料で利用できます。
ドキュメント リソース
関連リソース
OCR チュートリアル
Google Cloud Platform での光学式文字認識(OCR)の実行方法について学びます。このチュートリアルでは、画像ファイルを Google Cloud Storage へアップロードする方法、Google Cloud Vision API を使って画像ファイルからテキストを抽出する方法、Google Cloud Translation API を使ってテキストを翻訳する方法、翻訳したテキストを Cloud Storage に保存する方法について説明します。
簡単な Hello, World! 関数をコンソールで作成する
ローカルに何も設定せずに最初の関数をすばやくデプロイします。
ビッグデータと ML の基礎知識
この 1 日間のクラスルーム トレーニングは、Google Cloud のビッグデータと ML の機能を参加者に紹介します。Google Cloud の概要を簡単に説明し、データ処理機能について詳しく見ていきます。
Functions、Storage、Vision API、Pub/Sub、Translation API に接続して画像内のテキストを検出する
Vision API を使用して画像からテキストを抽出し、それを他のサービスに渡す関数を使用して、Cloud Storage の変更に対応します。
DLP API と Cloud Functions を使用して Cloud Storage にアップロードされたデータを自動的に分類する
Pub/Sub、Cloud Functions、Data Loss Prevention API を使用して、Cloud Storage にアップロードされたデータを自動的に分類します。
単一のリクエストによる複数の画像のアノテーション付けと出力の Cloud Storage への保存
Vision の特徴タイプを使用して、オフライン(非同期)で検出サービスを実行し、大量の画像ファイルのアノテーションをバッチ処理で生成します。
OCR リクエストのストレージと処理の場所の設定
光学式文字認識(OCR)リクエストに使用するリソースを保存、処理する特定のリージョンを設定します。
不適切な画像コンテンツの検出とぼかし
Google Cloud Vision API と ImageMagick を使用して、Cloud Storage バケットにアップロードされた不適切な画像を検出してぼかす方法を説明します。
用語集を使用して写真のテキストを翻訳して読み上げる(Advanced)
Vision API、Translation API、Text-to-Speech API を使用して画像内のテキストを検出し、翻訳をカスタマイズして、翻訳されたテキストから合成音声を生成します。
画像内のテキストを検出し(OCR)、検出されたテキストの周りに枠線をひく
Vision API を使用して画像内のテキストを識別し、検出されたテキストに基づいて画像にアノテーションを付けます。
関連動画
Cloud Vision API を使ってみる
新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。