Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Lista de procesadores
En esta página, se incluye información detallada sobre todos los procesadores que ofrece Document AI. Puedes ver una lista de todos los procesadores por tipo de solución.
OCR (reconocimiento óptico de caracteres) de documentos empresariales
Descripción
Identifica y extrae texto en diferentes tipos de documentos.
Este procesador te permite identificar y extraer texto, incluido el texto escrito a mano, de documentos en más de 200 idiomas. El procesador también usa el aprendizaje automático para realizar una evaluación de la calidad de un documento según la legibilidad de su contenido.
Versión inmovilizada del modelo v1.0: Son los archivos, las configuraciones y los archivos binarios del modelo de una instantánea de la versión inmovilizada en una imagen de contenedor por hasta 18 meses.
pretrained-ocr-v2.0-2023-06-02
Estable
Modelo listo para producción y especializado en casos de uso de documentos. Incluye acceso a todos los complementos de OCR.
pretrained-ocr-v2.1-2024-08-07
Estable
Las principales áreas de mejora de la versión 2.1 son las siguientes: mejor reconocimiento de texto impreso, detección más precisa de casillas de verificación y orden de lectura más exacto.
pretrained-ocr-v2.1.1-2025-01-31
Versión potencial
La versión 2.1.1 es similar a la versión 2.1 y está disponible en todas las regiones, excepto en US, EU y asia-southeast1.
Consulta los conjuntos de datos de muestra para obtener conjuntos de datos de muestra etiquetados y sin etiquetar que puedes usar para el entrenamiento.
Extractor personalizado
Descripción
Extrae campos de documentos con IA generativa o modelos personalizados, y ajusta los modelos para extraer datos de tus documentos con precisión.
Si usas la IA generativa para la extracción, haz lo siguiente:
Solo se admite oficialmente el idioma inglés.
La disponibilidad por región se encuentra en US, EU, northamerica-northeast1 y asia-southeast1.
Idiomas admitidos
Lista completa de idiomas
Idioma
Etiqueta BCP 47
Secuencia de comandos
Compatible con escritura a mano
Afrikaans
af
Latn
Árabe
ar
Arab
Azerbaiyano
az
Latn
Azerbaiyano (cirílico)
az-Cyrl
Cyrl
Bielorruso
be
Cyrl
Búlgaro
bg
Cyrl
Bosnio
bs
Latn
Catalán
ca
Latn
Cebuano
ceb
Latn
Checo
cs
Latn
Galés
cy
Latn
Danés
da
Latn
Alemán
de
Latn
Griego
el
Grek
Inglés
en
Latn
Esperanto
eo
Latn
Español
es
Latn
Estonio
et
Latn
Euskara
eu
Latn
Persa
fa
Arab
Finlandés
fi
Latn
Filipino
fil
Latn
Francés
fr
Latn
Irlandés
ga
Latn
Gallego
gl
Latn
Hindi
hi
Deva
Croata
hr
Latn
Criollo haitiano
ht
Latn
Húngaro
hu
Latn
Indonesio
id
Latn
Islandés
is
Latn
Italiano
it
Latn
Hebreo
iw
Hebr
Japonés
ja
Jpan
Javanés
jv
Latn
Kazajo
kk
Cyrl
Corean
ko
Kore
Kirguizo
ky
Cyrl
Latín
la
Latn
Lituano
lt
Latn
Letón
lv
Latn
Macedonio
mk
Cyrl
Mongol
mn
Cyrl
Marathi
mr
Deva
Malayo
ms
Latn
Maltés
mt
Latn
Nepalí
ne
Deva
Holandés
nl
Latn
Noruego
no
Latn
Polaco
pl
Latn
Pastún
ps
Arab
Portugués (Portugal y Brasil)
pt
Latn
Rumano
ro
Latn
Ruso
ru
Cyrl
Ruso (ortografía petrina)
ru-PETR1708
Cyrl
Sánscrito
sa
Deva
Eslovaco
sk
Latn
Esloveno
sl
Latn
Albanés
sq
Latn
Serbio
sr
Cyrl
Sueco
sv
Latn
Suajili
sw
Latn
Tagalo
tl
Latn
Turco
tr
Latn
Ucraniano
uk
Cyrl
Urdu
ur
Arab
Uzbeko
uz
Latn
Uzbeko (cirílico)
uz-Cyrl
Cyrl
Vietnamita
vi
Latn
Yiddish
yi
Hebr
Chino simplificado
zh-Hans
Hani
Chino tradicional
zh-Hant
Hani
Zulú
zu
Latn
Versiones de procesadores
ID de versión
Canal de actualización
Descripción
pretrained-foundation-model-v1.4-2025-02-05
Estable
Es un candidato listo para producción potenciado por el LLM de Gemini 2.0 Flash. También incluye funciones avanzadas de OCR, como la detección de casillas de verificación.
pretrained-foundation-model-v1.5-2025-05-05
Estable
Candidato listo para producción potenciado por el LLM de Gemini 2.5 Flash. Se recomienda para quienes desean experimentar con modelos más nuevos.
Extrae pares clave-valor generales (entidades y casillas de verificación), tablas y entidades genéricas de documentos, además del texto de OCR.
Este procesador aplica tecnologías avanzadas de aprendizaje automático para extraer pares clave-valor, casillas de verificación y tablas de documentos en más de 200 idiomas. Este procesador también aprovecha los modelos de aprendizaje profundo para extraer 11 entidades genéricas que son comunes en varios tipos de documentos.
Categoría
Extraer
Funciones
OCR, análisis de formularios y extracción de entidades
Es la versión heredada. Para obtener la mejor calidad y el conjunto completo de funciones, usa el Analizador de formularios v2.0.
pretrained-form-parser-v2.0-2022-11-10
Estable
Mostrar campos
email
phone
url
date_time
address
person
organization
quantity
price
id
page_number
Versión recomendada. Admite entidades genéricas y contiene modelos actualizados de tablas, KVP y casillas de verificación, además de más de 200 idiomas.
pretrained-form-parser-v2.1-2023-06-26
Versión potencial
Ninguno
Es una versión preliminar pública. Es el mismo modelo que la versión 2.0, pero con la extracción de texto nativa de archivos PDF digitales habilitada.
Extrae elementos de contenido de documentos (texto, tablas y listas) y crea fragmentos con contexto.
El analizador de diseño extrae elementos de contenido de documentos, como texto, tablas y listas, y crea fragmentos con contexto que facilitan la recuperación de información en la IA generativa y las aplicaciones de descubrimiento.
Si una página de un archivo de entrada de varias páginas es del tipo de documento correcto y una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento admitido. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, devuelve un mensaje de error.
Idiomas admitidos
Idioma
Etiqueta BCP 47
Secuencia de comandos
Compatible con escritura a mano
Inglés
en
Latn
Versiones de procesadores
ID de versión
Canal de actualización
Descripción
pretrained-bankstatement-v1.0-2021-08-08
Estable
pretrained-bankstatement-v1.1-2021-08-13
Estable
pretrained-bankstatement-v2.0-2021-12-10
Estable
pretrained-bankstatement-v3.0-2022-05-16
Estable
Esta versión supone que el archivo de entrada contiene un solo estado de cuenta bancario. A diferencia de la versión predeterminada, esta versión no verifica si el archivo de entrada contiene estados de cuenta y no mostrará un error si no se encuentran estados de cuenta.
Si una página de un archivo de entrada de varias páginas es del tipo de documento correcto y una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento admitido. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, devuelve un mensaje de error.
Idiomas admitidos
Idioma
Etiqueta BCP 47
Secuencia de comandos
Compatible con escritura a mano
Inglés
en
Latn
Formularios y versiones admitidos
2020 (versiones estándar y personalizadas)
2019 (versiones estándar y personalizadas)
2018 (versiones estándar y personalizadas)
Versiones de procesadores
ID de versión
Canal de actualización
Se detectaron campos adicionales
Descripción
pretrained-w2-v1.0-2020-10-01
Estable
Ninguno
pretrained-w2-v1.1-2022-01-27
Estable
Ninguno
pretrained-w2-v1.2-2022-01-28
Estable
Mostrar campos
AllocatedTips
ControlNumber
DependentCareBenefits
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
EmployerStateIdNumber_Line1
FederalIncomeTaxWithheld
FormYear
LocalIncomeTax_Line1
LocalityName_Line1
LocalWagesTipsEtc_Line1
MedicareTaxWithheld
MedicareWagesAndTips
NonqualifiedPlans
SocialSecurityTaxWithheld
SocialSecurityTips
SocialSecurityWages
SSN
State_Line1
StateIncomeTax_Line1
StateWagesTipsEtc_Line1
WagesTipsOtherCompensation
Mejoras en la calidad y compatibilidad con campos nuevos; no incluye el divisor.
Se mejoró la calidad y se agregó compatibilidad con los campos de la casilla 12 y las predicciones detalladas de EmployeeName, EmployeeAddress y EmployerNameAndAddress, que ya no forman parte del resultado y se reemplazaron por campos adicionales.
Predice la validez de los documentos de identidad con varios indicadores.
El procesador de verificación de documentos de identidad está diseñado para ayudar a predecir la validez de los documentos de identidad con cuatro indicadores diferentes.
Actualmente, el procesador devuelve información de los siguientes indicadores:
Detección de fraud_signals_is_identity_document: Predice si una imagen contiene un documento de identidad reconocido.
Detección de fraud_signals_suspicious_words: Predice si hay palabras presentes que no son típicas en los IDs.
Detección de fraud_signals_image_manipulation: Predice si la imagen se alteró o manipuló con una herramienta de edición de imágenes.
Detección de fraud_signals_online_duplicate: Predice si la imagen se puede encontrar en línea (solo en EE.UU.).
Actualmente, la función de detección de duplicados en línea se procesa en centros de datos de EE.UU. La asistencia regional y multirregional no está disponible para esta función fuera de EE.UU.
Este procesador es compatible con algoritmos que se actualizan con mayor frecuencia que las nuevas versiones del procesador. Por este motivo, el procesador puede devolver diferentes resultados con el tiempo, incluso cuando se usa la misma versión del procesador. Por ejemplo, el sistema de detección de duplicados en línea supervisa las imágenes presentes en la Web. El comportamiento del sistema puede cambiar más rápido de lo que se puede hacer un seguimiento en las versiones del procesador.
Consulta las notas sobre la IA responsable[†] y la revisión humana.[‡]
Idiomas admitidos
Idioma
Etiqueta BCP 47
Secuencia de comandos
Compatible con escritura a mano
Inglés
en
Latn
Formularios y versiones admitidos
Se agregó compatibilidad con pasaportes, tarjetas de pasaporte y licencias de conducir de EE.UU.
Si el documento de entrada de varias páginas contiene más de un recibo de sueldo válido, el procesador extraerá entidades solo del primer recibo de sueldo válido. Si no se encuentran recibos de sueldo en el archivo de entrada, el procesador devuelve un mensaje de error.
Idiomas admitidos
Idioma
Etiqueta BCP 47
Secuencia de comandos
Compatible con escritura a mano
Inglés
en
Latn
Versiones de procesadores
ID de versión
Canal de actualización
Se detectaron campos adicionales
Descripción
pretrained-paystub-v1.0-2021-03-19
Estable
Ninguno
pretrained-paystub-v1.1-2021-08-13
Estable
Mostrar campos
net_pay
net_pay_ytd
employee_account_number
Mejora de la calidad y compatibilidad con campos nuevos
pretrained-paystub-v1.2-2021-12-10
Estable
Ninguno
pretrained-paystub-v2.0-2022-05-17
Versión potencial
Mostrar campos
deduction_item
deduction_item/deduction_type
deduction_item/deduction_this_period
deduction_item/deduction_ytd
direct_deposit_item
direct_deposit_item/direct_deposit
direct_deposit_item/employee_account_number
earning_item
earning_item/earning_type
earning_item/earning_rate
earning_item/earning_hours
earning_item/earning_this_period
earning_item/earning_ytd
page_number
tax_item
tax_item/tax_type
tax_item/tax_this_period
tax_item/tax_ytd
federal_additional_tax
federal_allowance
federal_marital_status
state_additional_tax
state_allowance
state_marital_status
Esta versión supone que el archivo de entrada contiene un solo recibo de sueldo. A diferencia de la versión predeterminada, esta versión no verifica si el archivo de entrada contiene recibos de sueldo y no devolverá un error si no se encuentran recibos de sueldo.
Se mejoró la calidad, se agregó compatibilidad con campos nuevos y se implementó un esquema nuevo. Las categorías Bonus, Commissions, Holiday, Overtime, Regular Pay y Vacation ahora forman parte de earning_item/earning_this_period, y sus versiones del año hasta la fecha se encuentran en earning_item/earning_ytd. El depósito directo y el número de cuenta del empleado ahora están anidados en direct_deposit_item.
El límite de páginas asíncronas es de 10.
pretrained-paystub-v2.0-2022-07-22
Estable
Ninguno
Se mejoró la calidad y se optimizaron las mejoras en el entrenamiento.
Actualización a la versión 1.3 con un modelo de visión subyacente mejorado.
pretrained-expense-v1.4-2022-11-18
Versión potencial
Mostrar campos
traveler_name
reservation_id
line_item/transaction_date
ja: Japonés
it: Italiano
pt: Portugués (Portugal y Brasil)
Se realizaron mejoras de rendimiento y se agregó compatibilidad con el entrenamiento ascendente. Se aumentó a 15 el límite máximo de páginas (solicitudes en línea o síncronas).
pretrained-expense-v1.4.2-2024-09-12
Versión potencial
Mostrar campos
traveler_name
reservation_id
line_item/transaction_date
ja: Japonés
it: Italiano
pt: Portugués (Portugal y Brasil)
Se actualizó a la versión 1.4 con un modelo de visión subyacente mejorado.
Extrae texto y valores de las facturas, como el número de factura, el nombre del proveedor, el importe, el importe fiscal, la fecha de facturación y la fecha de vencimiento.
El analizador de facturas extrae los campos del encabezado y de las líneas de pedido, como el número de factura, el nombre del proveedor, el importe de la factura, el importe fiscal, la fecha de facturación, la fecha de vencimiento y los importes de las líneas de pedido.
[*] Este procesador solo está disponible para los clientes con acceso limitado.
Para solicitar acceso a la API, completa y envía el formulario de solicitud de clientes con acceso limitado de Document AI.
En el formulario se solicita información sobre tus datos personales, tu empresa y tu caso práctico.
Ten en cuenta que se requiere un ID del proyecto de Google Cloud para acceder.
Para crear un proyecto nuevo de Google Cloud o identificar el ID de tu proyecto existente, consulta las siguientes instrucciones.
Después de que envíes el formulario, el equipo de Document AI revisará tu solicitud para asegurarse de que cumplas con los criterios de acceso.
Si se aprueba, recibirás un correo electrónico con instrucciones para acceder y usar esta función.
[†]
La verificación de documentos de identidad funciona para extraer y evaluar la información de los documentos de identidad que contribuye a identificar si la imagen de entrada representa un documento de identidad auténtico.
En Google Cloud, priorizamos ayudar a los clientes a desarrollar e implementar soluciones de IA de forma segura, y la Verificación de identidad se desarrolló de acuerdo con los principios de la IA de Google.
Según los principios de la IA de Google y el diseño actual del producto, recomendamos tener precaución y evaluar cuidadosamente los posibles beneficios y riesgos de usar la verificación de documentos de identidad en los siguientes casos:
Toma de decisiones sin intervención humana para las predicciones que pueden afectar los derechos humanos.
En dominios sensibles, incluidos, sin limitaciones, el empleo, el acceso a servicios públicos, el cuidado de la salud y los contextos críticos para la seguridad
[‡] Siempre usa la verificación de identidad como parte de tu proceso y flujo de trabajo más amplios de detección de identidad.
Es importante que tengas un revisor humano en tu flujo de trabajo para verificar si los indicadores predichos son precisos. El procesador de Verificación de identidad no está diseñado para reemplazar la revisión manual de documentos de identidad en un flujo de trabajo, sino para ayudar a los revisores humanos a validar documentos de identidad. El procesador de verificación de identidad no debe usarse como una herramienta de decisión automatizada para determinar si un documento de identidad es válido. Con la revisión humana, los clientes pueden lograr una mayor exactitud en el procesamiento de documentos y ayudar a las empresas a evaluar las predicciones con herramientas diseñadas específicamente para permitir esas revisiones.
Asegúrate de revisar las reglamentaciones de la región en la que implementarás esta tecnología y de investigar la orientación existente de la industria para obtener información sobre los lineamientos de las políticas y los problemas comunes de equidad. Obtén información sobre la imparcialidad en el aprendizaje automático, incluidas las formas de mitigar el sesgo en los conjuntos de datos de entrenamiento, evaluar tus modelos personalizados en busca de disparidades en el rendimiento y otras consideraciones a medida que usas tu modelo personalizado.
Recomendamos a los clientes que tengan en cuenta las prácticas recomendadas de equidad, interpretabilidad, privacidad y seguridad cuando implementen la verificación de identidad. Para obtener más información sobre cómo implementar la IA responsable, consulta las recomendaciones de Google para las prácticas de IA responsable.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-07-14 (UTC)"],[[["Document AI offers various processors for digitizing, extracting, classifying, and summarizing document content, including Enterprise Document OCR for text recognition in over 200 languages."],["Custom Extractor uses generative AI or custom models to extract fields from documents, supporting multiple languages and specific data types, such as `dateTime`, `currency`, `number`, and has different versions with varying functionalities and lifespans."],["Form Parser extracts key-value pairs, checkboxes, tables, and entities from documents in over 200 languages, utilizing machine learning and deep learning techniques, and is capable of extracting fields such as `email`, `phone`, `url`, `date_time`, and more."],["Layout Parser, available for files such as PDF, HTML and DOCX, extracts content elements like text, tables and lists, supports a wide array of languages, and allows for processing up to 15 pages online or 500 in batch."],["Specialized pretrained processors like Bank Statement Parser, W2 Parser, US Passport Parser, Utility Parser, Identity Document Proofing Parser, Pay Slip Parser, US Driver License Parser, Expense Parser, and Invoice Parser are available for extracting specific information from different document types."]]],[]]