Documentación de la API de Cloud Vision
La API de Cloud Vision permite a los desarrolladores integrar con facilidad las funciones de detección de vision en las aplicaciones, como el etiquetado de imágenes, la detección de rostros y de puntos de referencia, el reconocimiento óptico de caracteres (OCR) y el etiquetado de contenido explícito.
Comienza tu prueba de concepto con un crédito gratis de USD 300
- Obtén acceso a Gemini 2.0 Flash Thinking
- Uso mensual gratuito de productos populares, incluidas las APIs de IA y BigQuery
- Sin cargos automáticos ni compromisos
Sigue explorando con más de 20 productos siempre gratuitos
Accede a más de 20 productos gratuitos para casos de uso comunes, incluidas APIs de IA, VMs, almacenes de datos y mucho más.
Recursos de documentación
Guías
Recursos relacionados
Instructivo de OCR
Aprende a realizar el reconocimiento óptico de caracteres (OCR) en Google Cloud Platform. En este instructivo, se muestra como subir archivos de imagen a Google Cloud Storage, extraer el texto de las imágenes con la API de Google Cloud Vision, traducir el texto con la API de Google Cloud Translation y volver a guardar tus traducciones en Cloud Storage.
Crea una función simple de Hello World! en la consola
Implementa con rapidez tu primera función sin configuración local.
Macrodatos y aspectos básicos del AA
En esta clase de un día dictada por un instructor, los participantes descubrirán las capacidades de los macrodatos y el aprendizaje automático de Google Cloud. Se proporciona una descripción general y rápida de Google Cloud y más detalles sobre las capacidades del procesamiento de datos.
Conecta Functions, Storage, la API de Vision, Pub/Sub y la API de Translation para detectar texto en imágenes
Reacciona a los cambios de Cloud Storage con una función que procesa una imagen mediante la API de Vision para extraer el texto y, luego, pasarlo a otros servicios.
Clasificación automatizada de los datos subidos a Cloud Storage con la API de DLP y Cloud Functions
Clasifica de forma automática los datos subidos a Cloud Storage mediante Pub/Sub, Cloud Functions y la API de Data Loss Prevention.
Anota varias imágenes en una sola solicitud y almacena resultados en Cloud Storage
Ejecuta servicios de detección (asíncronos) sin conexión y anotaciones de un gran lote de archivos de imagen con cualquier tipo de función de Vision.
Configura una ubicación de procesamiento y almacenamiento para las solicitudes de OCR
Configura una región específica a fin de almacenar y procesar los recursos que se usan para una solicitud de reconocimiento óptico de caracteres (OCR).
Detecta y difumina el contenido de una imagen ofensiva
Se muestra cómo usar ImageMagick y la API de Google Cloud Vision para detectar y difuminar imágenes ofensivas que se suben al bucket de Cloud Storage.
Traduce y reproduce texto desde una foto con glosarios (avanzado)
Usa la API de Vision, la API de Translation y la API de Text-to-Speech para detectar texto en una imagen, personalizar traducciones y generar voz sintética a partir del texto traducido.
Detecta texto en una imagen (OCR) y dibuja un borde alrededor del texto encontrado
Usa la API de Vision para identificar el texto de una imagen y, luego, anota la imagen según el texto detectado.
Videos relacionados
Prueba la API de Cloud Vision
Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.