Cloud Vision API 文档

借助 Cloud Vision API,开发者可轻松将视觉检测功能集成到应用中,这些功能包括图片标记、面孔和地标检测、光学字符识别 (OCR) 以及露骨内容的标记等。

  • 体验 Gemini 2.0 Flash Thinking
  • 免费使用热门产品(包括 AI API 和 BigQuery)的每月用量
  • 不会自动收费,无需承诺

继续探索 20 多种提供“始终免费”用量的产品

使用适用于常见应用场景(包括 AI API、虚拟机、数据仓库等)的 20 多种免费产品。

探索自主培训、应用场景、参考架构和代码示例,并了解有关如何使用和连接 Google Cloud 服务的示例。
培训
培训和教程

您将了解如何在 Google Cloud Platform 上执行光学字符识别 (OCR)。本教程演示如何将图片文件上传到 Google Cloud Storage、使用 Google Cloud Vision API 从图片中提取文本、使用 Google Cloud Translation API 翻译文本以及将译文保存回 Cloud Storage。

培训
培训和教程

快速部署您的第一个函数,而不需要任何本地设置。

培训
培训和教程

本讲师指导课程为期一天,旨在向学员介绍 Google Cloud 的大数据和机器学习功能。它简要介绍 Google Cloud,深入介绍数据处理功能。

培训
培训和教程

使用处理图片的函数(其使用 Vision API 提取文本然后将文本传递给其他服务)来响应 Cloud Storage 更改。

培训
培训和教程

使用 Pub/Sub、Cloud Functions 和 Data Loss Prevention API 对上传到 Cloud Storage 的数据进行自动分类。

代码示例
代码示例

使用任何 Vision 特征类型运行离线(异步)检测服务和大批量图片文件注释。

Java Node.js Python Ruby

代码示例
代码示例

设置特定区域来存储和处理用于光学字符识别 (OCR) 请求的资源。

C# Go Java Node.js PHP Python Ruby

代码示例
代码示例

演示了如何使用 Google Cloud Vision API 和 ImageMagick 检测上传到 Cloud Storage 存储桶的令人反感的图片并对其进行模糊处理。

Node.js Python Go Java

代码示例
代码示例

使用 Vision API、Translation API、Text-to-Speech API 检测图片中的文本、进行个性化翻译以及从文本生成合成语音。

Python

代码示例
代码示例

使用 Vision API 识别图片中的文本,然后根据检测到的文本添加注释。

Python

相关视频

创建一个账号,以评估我们的产品在实际场景中的表现。
新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。