Imágenes compatibles

Formatos de archivo

La API Vision admite los siguientes tipos de imágenes:

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • GIF animado (solo el primer fotograma)
  • BMP
  • WEBP
  • Datos sin procesar
  • ICO
  • PDF
  • TIFF

Ten en cuenta que algunos de estos formatos de imagen tienen pérdidas (por ejemplo, JPEG). Si se reduce el tamaño de los archivos de estos formatos con pérdida, puede que se degrade la calidad de la imagen y, por lo tanto, la precisión de la API Vision.

Tamaño de las imágenes

Para que la API Vision detecte las imágenes con precisión, estas deben tener una resolución mínima de 640x480 píxeles (unos 300.000 píxeles). A continuación, se muestran los detalles completos de los diferentes tipos de solicitudes de funciones de la API Vision:

Función de la API de Vision Tamaño recomendado * Notas
FACE_DETECTION 1600 x 1200 La distancia entre los ojos es lo más importante
LANDMARK_DETECTION 640 x 480
LOGO_DETECTION 640 x 480
LABEL_DETECTION 640 x 480
TEXT_DETECTION y DOCUMENT_TEXT_DETECTION 1024 x 768 El OCR requiere más resolución para detectar caracteres
SAFE_SEARCH_DETECTION 640 x 480

Los tamaños recomendados varían en función de la función que se detecte. Por ejemplo, las solicitudes de FACE_DETECTION suelen requerir imágenes de mayor tamaño porque las características que se detectan (caras) son más pequeñas que la imagen en sí. Por otro lado, las solicitudes LABEL_DETECTION suelen evaluar una imagen completa.

En la práctica, un tamaño estándar de 640x480 píxeles funciona bien en la mayoría de los casos. Los tamaños superiores no suelen mejorar mucho la precisión, pero sí reducen considerablemente el rendimiento. Siempre que sea posible, preprocesa tus imágenes para reducir su tamaño a estos estándares mínimos.

Tamaño del archivo

Los archivos de imagen enviados a la API Vision no deben superar los 20 MB. Los archivos que superen los 20 MB generarán un error. La API Vision no cambia el tamaño de los archivos de este tamaño. Reducir el tamaño de los archivos puede mejorar significativamente el rendimiento. Sin embargo, ten cuidado de no reducir la calidad de la imagen durante el proceso. Ten en cuenta que la API Vision tiene un límite de tamaño de 10 MB para las solicitudes JSON. Los archivos de mayor tamaño deben alojarse en Cloud Storage o en la Web, en lugar de enviarse como contenido codificado en base64 en el propio JSON.