Los siguientes productos comparten funciones con Document AI. Sin embargo, estos productos realizan una función específica de texto y análisis. En función de tu caso práctico, estos productos pueden ofrecerte las funciones específicas que necesitas.
Convertir imágenes en texto
Puedes convertir el contenido de las imágenes en texto de dos formas:
- Enterprise Document OCR.
API Cloud Vision (con las enumeraciones
TEXT_DETECTION
oDOCUMENT_TEXT_DETECTION
). Consulta los siguientes artículos:
Detectar artefactos visuales
Puedes usar la detección de objetos de AutoML Vision para convertir secciones de imágenes en documentos de texto. Para obtener más información, consulta Datos de imagen.
Clasificar documentos
Si tienes documentos de texto sin formato y ejecutas el OCR antes, puedes categorizar y etiquetar documentos con los siguientes productos:
- La API Natural Language entrenada previamente te ayuda a clasificar contenido mediante una lista generalizada de categorías.
- Usa la clasificación de AutoML Natural Language para crear un modelo de aprendizaje automático personalizado y clasificar contenido con tus propias etiquetas de categoría.
Aunque puede haber excepciones, no se recomienda usar la clasificación de AutoML Vision para clasificar documentos, ya que suele ser menos precisa que los métodos basados en texto. Sin embargo, puedes usarla para clasificar el contenido de las imágenes.
- Por lo general, no se recomienda este método para clasificar documentos, ya que su precisión suele ser menor que la de los métodos basados en texto, pero puede haber excepciones.
API de Natural Language | |
Clasificación de AutoML Natural Language | |
Clasificación de AutoML Vision |
Analizar y extraer entidades
Puedes identificar entidades conocidas en documentos (nombres propios, como figuras públicas, marcas de empresas, etc.) y entidades que siguen patrones comunes, como números de teléfono y direcciones, con Form Parser o cualquiera de los procesadores preentrenados para tu caso práctico.
- También puedes usar la API Natural Language para identificar entidades públicas comunes.
- Los productos de AutoML Natural Language se usan para la extracción de entidades. Úsalas para crear un modelo de aprendizaje automático personalizado que identifique entidades específicas de tu empresa o caso práctico.
API de Natural Language | |
Extracción de entidades de AutoML Natural Language |
Otros productos
Integra estos productos complementarios con Document AI para crear una solución completa de procesamiento y análisis de documentos.
- Vertex AI: combina AutoML y AI Platform en una única API, biblioteca de cliente y plataforma.
- API Cloud Translation: traduce texto dinámicamente entre miles de pares de idiomas mediante modelos preentrenados. Proporciona una API Document Translation para traducir directamente documentos en formatos como PDF y DOCX. Consulta Traducir documentos.
- Workflows: combina Google Cloud servicios y APIs para crear aplicaciones fiables, automatizar procesos y gestionar datos y flujos de procesamiento de aprendizaje automático.
- AppSheet Automation: crea automatizaciones y aplicaciones personalizadas con una nube abierta.
- Escáner de Drive de Google Drive: la aplicación Google Drive para Android te permite escanear y subir documentos a Google Drive, así como recibir sugerencias de títulos inteligentes basadas en Document AI.
- Traductor de Google: este servicio traduce al instante palabras, frases y páginas web del inglés a más de 100 idiomas y viceversa.
Buscar un partner
Aprovecha nuestro creciente ecosistema de partners para crear y gestionar tu solución de análisis de documentos. Para ver una lista de partners y los servicios que ofrecen, consulta Partners de Document AI.
Siguientes pasos
- Consulta cómo configurar Document AI.
- Consulta guías específicas en la sección Cómo hacerlo.