Se usó la API de Cloud Translation para traducir esta página.

Lista de procesadores

En esta página, se incluye información detallada sobre todos los procesadores que ofrece Document AI. Puedes ver una lista de todos los procesadores por tipo de solución.

Todos los procesadores de Document AI cumplen con las Condiciones de Seguridad y Tratamiento de Datos.

Consulta la documentación sobre cómo administrar versiones de procesadores para obtener más detalles. Además, se aplican límites específicos del procesador, además de las cuotas y los límites generales del producto.

Digitaliza texto

OCR (reconocimiento óptico de caracteres) de documentos empresariales

Descripción

Identifica y extrae texto en diferentes tipos de documentos.

Este procesador te permite identificar y extraer texto, incluido el texto escrito a mano, de documentos en más de 200 idiomas. El procesador también usa el aprendizaje automático para realizar una evaluación de la calidad de un documento según la legibilidad de su contenido.

Categoría Digitalizar

Funciones OCR, análisis de calidad

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API OCR_PROCESSOR

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Afrikaans	`af`	`Latn`
Albanés	`sq`	`Latn`
Árabe	`ar`	`Arab`
Armenio	`hy`	`Armn`
Bielorruso	`be`	`Cyrl`
Bengalí	`bn`	`Beng`
Bengalí	`bn`	`Beng`
Búlgaro	`bg`	`Cyrl`
Catalán	`ca`	`Latn`
Chino	`zh`	`Hani`
Croata	`hr`	`Latn`
Checo	`cs`	`Latn`
Danés	`da`	`Latn`
Holandés	`nl`	`Latn`
Inglés	`en`	`Latn`
Estonio	`et`	`Latn`
Filipino	`fil`	`Latn`
Finlandés	`fi`	`Latn`
Francés	`fr`	`Latn`
Alemán	`de`	`Latn`
Griego	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebreo	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandés	`is`	`Latn`
Indonesio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonés	`ja`	`Jpan`
Canarés	`kn`	`Knda`
Jemer	`km`	`Khmr`
Coreano	`ko`	`Kore`
Laosiano	`lo`	`Laoo`
Letón	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedonio	`mk`	`Cyrl`
Malayo	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalí	`ne`	`Deva`
Noruego	`no`	`Latn`
Persa	`fa`	`Arab`
Polaco	`pl`	`Latn`
Portugués (Portugal y Brasil)	`pt`	`Latn`
Punyabí	`pa`	`Guru`
Rumano	`ro`	`Latn`
Ruso	`ru`	`Cyrl`
Serbio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Español	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Tailandés	`th`	`Thai`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versiones de procesadores

ID de versión	Canal de actualización	Descripción
`pretrained-ocr-v1.2-2022-11-10`	Estable	Versión inmovilizada del modelo de la versión 1.0: Archivos, configuraciones y archivos binarios del modelo de una instantánea de la versión inmovilizada en una imagen de contenedor por hasta 18 meses.
`pretrained-ocr-v2.0-2023-06-02`	Estable	Modelo listo para producción y especializado en casos de uso de documentos. Incluye acceso a todos los complementos de OCR.
`pretrained-ocr-v2.1-2024-08-07`	Estable	Las principales áreas de mejora de la versión 2.1 son las siguientes: mejor reconocimiento de texto impreso, detección más precisa de casillas de verificación y orden de lectura más exacto.
`pretrained-ocr-v2.1.1-2025-01-31`	Versión candidata para lanzamiento	La versión 2.1.1 es similar a la versión 2.1 y está disponible en todas las regiones, excepto en `US`, `EU` y `asia-southeast1`.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	500
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Más información Enterprise Document OCR

Extraer entidades de los documentos

Consulta los conjuntos de datos de muestra para obtener ejemplos de conjuntos de datos etiquetados y sin etiquetar que puedes usar para el entrenamiento.

Extractor personalizado

Descripción

Extrae campos de documentos con IA generativa o modelos personalizados, y ajusta los modelos para extraer datos de tus documentos con precisión.

Categoría Extraer

Funciones OCR y extracción de entidades

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API CUSTOM_EXTRACTION_PROCESSOR

Notas

Si usas la IA generativa para la extracción, haz lo siguiente:
- Por el momento, solo se admite el idioma inglés de forma oficial.
- La disponibilidad por región se encuentra en US, EU, northamerica-northeast1 y asia-southeast1.

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Afrikaans	`af`	`Latn`
Árabe	`ar`	`Arab`
Azerbaiyano	`az`	`Latn`
Azerí (cirílico)	`az-Cyrl`	`Cyrl`
Bielorruso	`be`	`Cyrl`
Búlgaro	`bg`	`Cyrl`
Bosnio	`bs`	`Latn`
Catalán	`ca`	`Latn`
Cebuano	`ceb`	`Latn`
Checo	`cs`	`Latn`
Galés	`cy`	`Latn`
Danés	`da`	`Latn`
Alemán	`de`	`Latn`
Griego	`el`	`Grek`
Inglés	`en`	`Latn`
Esperanto	`eo`	`Latn`
Español	`es`	`Latn`
Estonio	`et`	`Latn`
Euskara	`eu`	`Latn`
Persa	`fa`	`Arab`
Finlandés	`fi`	`Latn`
Filipino	`fil`	`Latn`
Francés	`fr`	`Latn`
Irlandés	`ga`	`Latn`
Gallego	`gl`	`Latn`
Hindi	`hi`	`Deva`
Croata	`hr`	`Latn`
Criollo haitiano	`ht`	`Latn`
Húngaro	`hu`	`Latn`
Indonesio	`id`	`Latn`
Islandés	`is`	`Latn`
Italiano	`it`	`Latn`
Hebreo	`iw`	`Hebr`
Japonés	`ja`	`Jpan`
Javanés	`jv`	`Latn`
Kazajo	`kk`	`Cyrl`
Corean	`ko`	`Kore`
Kirguizo	`ky`	`Cyrl`
Latín	`la`	`Latn`
Lituano	`lt`	`Latn`
Letón	`lv`	`Latn`
Macedonio	`mk`	`Cyrl`
Mongol	`mn`	`Cyrl`
Marathi	`mr`	`Deva`
Malayo	`ms`	`Latn`
Maltés	`mt`	`Latn`
Nepalí	`ne`	`Deva`
Holandés	`nl`	`Latn`
Noruego	`no`	`Latn`
Polaco	`pl`	`Latn`
Pastún	`ps`	`Arab`
Portugués (Portugal y Brasil)	`pt`	`Latn`
Rumano	`ro`	`Latn`
Ruso	`ru`	`Cyrl`
Ruso (ortografía petrina)	`ru-PETR1708`	`Cyrl`
Sánscrito	`sa`	`Deva`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Albanés	`sq`	`Latn`
Serbio	`sr`	`Cyrl`
Sueco	`sv`	`Latn`
Suajili	`sw`	`Latn`
Tagalo	`tl`	`Latn`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Urdu	`ur`	`Arab`
Uzbeko	`uz`	`Latn`
Uzbeko (cirílico)	`uz-Cyrl`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`
Chino simplificado	`zh-Hans`	`Hani`
Chino tradicional	`zh-Hant`	`Hani`
Zulú	`zu`	`Latn`

Versiones de procesadores

ID de versión	Canal de actualización	Descripción
`pretrained-foundation-model-v1.4-2025-02-05`	Estable	Es un modelo de GA potenciado por el LLM de Gemini 2.0 Flash. También incluye funciones avanzadas de OCR, como la detección de casillas de verificación. Nota: A partir del 5 de febrero de 2026, ya no se podrá acceder a esta versión.
`pretrained-foundation-model-v1.5-2025-05-05`	Estable	Es un candidato listo para producción potenciado por el LLM de Gemini 2.5 Flash. Se recomienda para quienes desean experimentar con modelos más nuevos.
`pretrained-foundation-model-v1.5-pro-2025-06-20`	Estable	Es un modelo listo para producción potenciado por el LLM de Gemini 2.5 Pro. Admite una cuota de hasta 30 páginas por minuto para las solicitudes de procesamiento en línea. Este modelo tiene una calidad mejorada en comparación con la versión 1.5 y puede tener una latencia más alta.
`pretrained-foundation-model-v1.5.1-2025-08-07`	Versión candidata para lanzamiento	Es un modelo de versión preliminar pública potenciado por el LLM de Gemini 2.5 Flash. Este modelo tiene las mismas funciones que la versión 1.5 y mejoró el aprendizaje adaptativo con pocos ejemplos.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	200
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Tipos de datos normalizados

Puedes encontrar más información en las páginas Enriquecimiento y normalización y Crear conjunto de datos.

Lista completa de tipos de datos normalizados

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Más información Extractor personalizado

Analizador de formularios

Descripción

Extrae pares clave-valor generales (entidades y casillas de verificación), tablas y entidades genéricas de documentos, además del texto de OCR.

Este procesador aplica tecnologías avanzadas de aprendizaje automático para extraer pares clave-valor, casillas de verificación y tablas de documentos en más de 200 idiomas. Este procesador también aprovecha los modelos de aprendizaje profundo para extraer 11 entidades genéricas que son comunes en varios tipos de documentos.

Categoría Extraer

Funciones OCR, análisis de formularios y extracción de entidades

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API FORM_PARSER_PROCESSOR

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Afrikaans	`af`	`Latn`
Albanés	`sq`	`Latn`
Árabe	`ar`	`Arab`
Bielorruso	`be`	`Cyrl`
Catalán	`ca`	`Latn`
Chino	`zh`	`Hani`
Croata	`hr`	`Latn`
Checo	`cs`	`Latn`
Danés	`da`	`Latn`
Holandés	`nl`	`Latn`
Inglés	`en`	`Latn`
Estonio	`et`	`Latn`
Filipino	`fil`	`Latn`
Finlandés	`fi`	`Latn`
Francés	`fr`	`Latn`
Alemán	`de`	`Latn`
Hebreo	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandés	`is`	`Latn`
Indonesio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonés	`ja`	`Jpan`
Corean	`ko`	`Kore`
Letón	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedonio	`mk`	`Cyrl`
Malayo	`ms`	`Latn`
Marathi	`mr`	`Deva`
Nepalí	`ne`	`Deva`
Noruego	`no`	`Latn`
Persa	`fa`	`Arab`
Polaco	`pl`	`Latn`
Portugués (Portugal y Brasil)	`pt`	`Latn`
Rumano	`ro`	`Latn`
Ruso	`ru`	`Cyrl`
Serbio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Español	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versiones de procesadores

ID de versión	Canal de actualización	Se detectaron campos adicionales	Descripción
`pretrained-form-parser-v1.0-2020-09-23`	Estable	Ninguno	Es la versión heredada. Para obtener la mejor calidad y el conjunto completo de funciones, usa el Analizador de formularios v2.0.
`pretrained-form-parser-v2.0-2022-11-10`	Estable	Mostrar campos `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	Versión recomendada. Admite entidades genéricas y contiene modelos actualizados de tablas, KVP y casillas de verificación, además de más de 200 idiomas.
`pretrained-form-parser-v2.1-2023-06-26`	Versión candidata para lanzamiento	Ninguno	Es una versión preliminar pública. Es el mismo modelo que la versión 2.0, pero con la extracción de texto nativa de archivos PDF digitales habilitada.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	100
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Más información Analizador de formularios

Analizador de diseño

Descripción

Extrae elementos de contenido de documentos (texto, tablas y listas) y crea fragmentos con contexto.

El analizador de diseño extrae elementos de contenido de documentos, como texto, tablas y listas, y crea fragmentos con contexto que facilitan la recuperación de información en la IA generativa y las aplicaciones de descubrimiento.

Categoría Extraer

Funciones Análisis de diseño y fragmentación de documentos

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API LAYOUT_PARSER_PROCESSOR

Notas

Este analizador admite archivos PDF, HTML, DOCX, PPTX y XLSX/XLSM.

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Afrikaans	`af`	`Latn`
Albanés	`sq`	`Latn`
Árabe	`ar`	`Arab`
Armenio	`hy`	`Armn`
Bielorruso	`be`	`Cyrl`
Bengalí	`bn`	`Beng`
Bengalí	`bn`	`Beng`
Búlgaro	`bg`	`Cyrl`
Catalán	`ca`	`Latn`
Chino	`zh`	`Hani`
Croata	`hr`	`Latn`
Checo	`cs`	`Latn`
Danés	`da`	`Latn`
Holandés	`nl`	`Latn`
Inglés	`en`	`Latn`
Estonio	`et`	`Latn`
Filipino	`fil`	`Latn`
Finlandés	`fi`	`Latn`
Francés	`fr`	`Latn`
Alemán	`de`	`Latn`
Griego	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebreo	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandés	`is`	`Latn`
Indonesio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonés	`ja`	`Jpan`
Canarés	`kn`	`Knda`
Jemer	`km`	`Khmr`
Coreano	`ko`	`Kore`
Laosiano	`lo`	`Laoo`
Letón	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedonio	`mk`	`Cyrl`
Malayo	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalí	`ne`	`Deva`
Noruego	`no`	`Latn`
Persa	`fa`	`Arab`
Polaco	`pl`	`Latn`
Portugués (Portugal y Brasil)	`pt`	`Latn`
Punyabí	`pa`	`Guru`
Rumano	`ro`	`Latn`
Ruso	`ru`	`Cyrl`
Serbio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Español	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Tailandés	`th`	`Thai`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versiones de procesadores

ID de versión	Canal de actualización	Descripción
`pretrained-layout-parser-v1.0-2024-06-03`	Estable	Versión recomendada.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	500
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

eu
us

Más información Analizador de diseño

Explora los procesadores previamente entrenados

Analizador de estados de cuenta

Descripción

Extrae información de los estados de cuenta, incluidos el nombre, la cuenta, las transacciones, etcétera

Categoría Previamente entrenados

Funciones OCR y extracción de entidades

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API BANK_STATEMENT_PROCESSOR

Notas

Si una página de un archivo de entrada de varias páginas es del tipo de documento correcto y una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento admitido. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, devuelve un mensaje de error.

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Compatible con escritura a mano
Inglés	`en`	`Latn`

Versiones de procesadores

ID de versión	Canal de actualización	Descripción
`pretrained-bankstatement-v1.0-2021-08-08`	Estable
`pretrained-bankstatement-v1.1-2021-08-13`	Estable
`pretrained-bankstatement-v2.0-2021-12-10`	Estable
`pretrained-bankstatement-v3.0-2022-05-16`	Estable	Esta versión supone que el archivo de entrada contiene un solo estado de cuenta bancario. A diferencia de la versión predeterminada, esta versión no verifica si el archivo de entrada contiene estados de cuenta y no devolverá un error si no se encuentran estados de cuenta.
`pretrained-bankstatement-v4.0-2023-07-31`	Versión candidata para lanzamiento
`pretrained-bankstatement-v5.0-2023-12-06`	Versión candidata para lanzamiento

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	30
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos

bank_address
bank_name

Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Uptraining

Instrucciones de etiquetado Abrir en una ventana nueva

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

eu
us

Analizador W2

Descripción

Extrae información del formulario W2, como el empleado, el empleador, los salarios, etcétera

Categoría Previamente entrenados

Funciones OCR y extracción de entidades

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API FORM_W2_PROCESSOR

Notas

Si una página de un archivo de entrada de varias páginas es del tipo de documento correcto y una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento admitido. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, devuelve un mensaje de error.

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Compatible con escritura a mano
Inglés	`en`	`Latn`

Formularios y versiones admitidos

2020 (versiones estándar y personalizadas)
2019 (versiones estándar y personalizadas)
2018 (versiones estándar y personalizadas)

Versiones de procesadores

ID de versión	Canal de actualización	Se detectaron campos adicionales	Descripción
`pretrained-w2-v1.0-2020-10-01`	Estable	Ninguno
`pretrained-w2-v1.1-2022-01-27`	Estable	Ninguno
`pretrained-w2-v1.2-2022-01-28`	Estable	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	Mejoras en la calidad y compatibilidad con campos nuevos; no incluye el divisor.
`pretrained-w2-v2.0-2022-03-30`	Versión candidata para lanzamiento	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Se mejoró la calidad y se agregó compatibilidad con los campos de la casilla 12 y las predicciones detalladas de `EmployeeName`, `EmployeeAddress` y `EmployerNameAndAddress`, que ya no forman parte del resultado y se reemplazaron por campos adicionales.
`pretrained-w2-v2.1-2022-06-08`	Estable	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Es similar a la versión `pretrained-w2-v2.0-2022-03-30`, pero con más mejoras de calidad y la incorporación de una entidad más, `EmployeeName_Suffix`.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	15
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	15

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos

EmployerNameAndAddress
EIN

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

eu
us

Analizador de pasaportes de EE.UU.

Descripción

Extrae campos como nombres, IDs de documentos, fecha de nacimiento, etcétera.

Categoría Previamente entrenados

Funciones OCR y extracción de entidades

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API US_PASSPORT_PROCESSOR

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Compatible con escritura a mano
Inglés	`en`	`Latn`

Versiones de procesadores

ID de versión	Canal de actualización	Descripción
`pretrained-us-passport-v1.0-2021-06-14`	Estable

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	2
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	2

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
MRZ Code
Portrait

Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

Date Of Birth
Expiration Date
Issue Date

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

eu
us

Analizador de utilidades

Descripción

Extrae el texto y los valores de las facturas de servicios públicos, como el nombre del proveedor y el importe pagado anterior.

Categoría Previamente entrenados

Funciones OCR y extracción de entidades

Etapa de lanzamiento Disponibilidad general

Estado de acceso Limitada ^[*]

Escribe en la API UTILITY_PROCESSOR

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Compatible con escritura a mano
Inglés	`en`	`Latn`

Versiones de procesadores

ID de versión	Canal de actualización	Descripción
`pretrained-utility-v1.1-2021-04-09`	Estable
`pretrained-utility-v1.2-2022-12-15`	Versión candidata para lanzamiento

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	10
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	200
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

adjusted_amount
amount_due
balance_transfer_amount
carrier
currency
currency_exchange_rate
delivery_date
deposit_credited_amount
due_date
freight_amount
invoice_date
invoice_id
late_fee_amount
line_item

line_item/amount
line_item/description
line_item/frequency
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/service_address
line_item/service_end_date
line_item/service_id_1
line_item/service_id_2
line_item/service_start_date
line_item/supplier_account_number
line_item/tax_amount
line_item/unit_number
line_item/unit_of_measure
line_item/unit_price
line_item/usage

net_amount
payment_terms
prior_amount_due
prior_paid_amount
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
reclaimed_water
remit_to_address
remit_to_name
service

service/service_end_date
service/service_id
service/service_start_date
service/unit_of_measure
service/usage

service_address
service_end_date
service_id
service_start_date
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_account_number
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
tampering
total_amount
total_tax_amount
usage
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

Uptraining

Instrucciones de etiquetado Abrir en una ventana nueva

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

eu
us

Analizador de revisión de documentos de identidad

Descripción

Predice la validez de los documentos de identidad con varios indicadores.

El procesador de verificación de documentos de identidad está diseñado para ayudar a predecir la validez de los documentos de identidad con cuatro indicadores diferentes.

Actualmente, el procesador devuelve información de los siguientes indicadores:

Detección de fraud_signals_is_identity_document: Predice si una imagen contiene un documento de identidad reconocido.
Detección de fraud_signals_suspicious_words: Predice si hay palabras presentes que no son típicas en los IDs.
Detección de fraud_signals_image_manipulation: Predice si la imagen se alteró o manipuló con una herramienta de edición de imágenes.
fraud_signals_online_duplicate detección: Predice si la imagen se puede encontrar en línea (solo en EE.UU.).

Categoría Previamente entrenados

Funciones OCR, análisis de calidad

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API ID_PROOFING_PROCESSOR

Notas

Actualmente, la función de detección de duplicados en línea se procesa en centros de datos de EE.UU. La asistencia regional y multirregional no está disponible para esta función fuera de EE.UU.
Este procesador es compatible con algoritmos que se actualizan con mayor frecuencia que las nuevas versiones del procesador. Por este motivo, el procesador puede devolver diferentes resultados con el tiempo, incluso cuando se usa la misma versión del procesador. Por ejemplo, el sistema de detección de duplicados en línea supervisa las imágenes presentes en la Web. El comportamiento del sistema puede cambiar más rápido de lo que se puede hacer un seguimiento en las versiones del procesador.
Consulta las notas sobre la IA responsable^[†] y la revisión humana.^[‡]

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Compatible con escritura a mano
Inglés	`en`	`Latn`

Formularios y versiones admitidos

Se agregó compatibilidad con pasaportes, tarjetas de pasaporte y licencias de conducir de EE.UU.

Versiones de procesadores

ID de versión	Canal de actualización	Se detectaron campos adicionales	Descripción
`pretrained-id-proofing-v1.0-2022-10-03`	Estable	Ninguno
`pretrained-id-proofing-v1.1-2023-05-18`	Versión candidata para lanzamiento	Mostrar campos `fraud_signals_photocopy_detection`	Señal adicional de detección de fotocopias
`pretrained-id-proofing-v1.2-2023-10-04`	Versión candidata para lanzamiento	Mostrar campos `fraud_signals_photocopy_detection`

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	2
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	2

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

eu
us

Analizador de comprobantes de pago

Descripción

Extrae información de los recibos de pago, como el nombre, la empresa, los importes, etcétera

Categoría Previamente entrenados

Funciones OCR y extracción de entidades

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API PAYSTUB_PROCESSOR

Notas

Si el documento de entrada de varias páginas contiene más de un recibo de sueldo válido, el procesador extraerá entidades solo del primer recibo de sueldo válido. Si no se encuentran recibos de sueldo en el archivo de entrada, el procesador devuelve un mensaje de error.

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Compatible con escritura a mano
Inglés	`en`	`Latn`

Versiones de procesadores

ID de versión	Canal de actualización	Se detectaron campos adicionales	Descripción
`pretrained-paystub-v1.0-2021-03-19`	Estable	Ninguno
`pretrained-paystub-v1.1-2021-08-13`	Estable	Mostrar campos `net_pay` `net_pay_ytd` `employee_account_number`	Mejora de la calidad y compatibilidad con campos nuevos
`pretrained-paystub-v1.2-2021-12-10`	Estable	Ninguno
`pretrained-paystub-v2.0-2022-05-17`	Versión candidata para lanzamiento	Mostrar campos `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	Esta versión supone que el archivo de entrada contiene un solo recibo de sueldo. A diferencia de la versión predeterminada, esta versión no verifica si el archivo de entrada contiene recibos de sueldo y no devolverá un error si no se encuentran recibos de sueldo. Se mejoró la calidad, se agregó compatibilidad con campos nuevos y se implementó un esquema nuevo. Las categorías Bonificación, Comisiones, Vacaciones, Horas extraordinarias, Sueldo normal y Vacaciones ahora forman parte de earning_item/earning_this_period, y sus versiones del año hasta la fecha se encuentran en earning_item/earning_ytd. El depósito directo y el número de cuenta del empleado ahora están anidados en direct_deposit_item. El límite de páginas asíncronas es de 10.
`pretrained-paystub-v2.0-2022-07-22`	Estable	Ninguno	Se realizaron mejoras en la calidad y en el entrenamiento de los modelos.
`pretrained-paystub-v3.0-2023-12-06`	Versión candidata para lanzamiento	Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	50
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos

employer_address
employer_name

Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Uptraining

Instrucciones de etiquetado Abrir en una ventana nueva

Regiones admitidas

eu
us

Analizador de licencias de conducir de EE.UU.

Descripción

Extrae campos como nombres, IDs de documentos, fecha de nacimiento, etcétera.

Categoría Previamente entrenados

Funciones OCR y extracción de entidades

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API US_DRIVER_LICENSE_PROCESSOR

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Compatible con escritura a mano
Inglés	`en`	`Latn`

Formularios y versiones admitidos

Admite los 50 estados y el Distrito de Columbia (DC).

Versiones de procesadores

ID de versión	Canal de actualización	Descripción
`pretrained-us-driver-license-v1.0-2021-06-14`	Estable

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	2
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	2

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

Date Of Birth
Expiration Date
Issue Date

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

eu
us

Analizador de gastos

Descripción

Extrae texto y valores de los documentos de gastos, como la fecha del gasto, el nombre del proveedor, el importe total y la moneda.

Categoría Previamente entrenados

Funciones OCR y extracción de entidades

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API EXPENSE_PROCESSOR

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Alemán	`de`	`Latn`
Inglés	`en`	`Latn`
Español	`es`	`Latn`
Francés	`fr`	`Latn`
Japonés	`ja`	`Jpan`
Holandés	`nl`	`Latn`

Versiones de procesadores

ID de versión	Canal de actualización	Se detectaron campos adicionales	Se agregó compatibilidad con más idiomas	Descripción
`pretrained-expense-v1.1-2021-04-09`	Estable	Ninguno	Ninguno	Se lanzó en abril de 2021.
`pretrained-expense-v1.3.2-2024-09-11`	Versión candidata para lanzamiento	Mostrar campos `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: Japonés	Actualización a la versión 1.3 con un modelo de visión subyacente mejorado.
`pretrained-expense-v1.4-2022-11-18`	Versión candidata para lanzamiento	Mostrar campos `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Japonés `it`: Italiano `pt`: Portugués (Portugal y Brasil)	Se realizaron mejoras de rendimiento y se agregó compatibilidad con el entrenamiento ascendente. Se aumentó a 15 el límite máximo de páginas (solicitudes en línea o síncronas). Nota: Se descontinuará en Estados Unidos (EE.UU.) y la Unión Europea (UE) a partir del 30 de abril de 2025.
`pretrained-expense-v1.4.2-2024-09-12`	Versión candidata para lanzamiento	Mostrar campos `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Japonés `it`: Italiano `pt`: Portugués (Portugal y Brasil)	Se actualizó a la versión 1.4 con un modelo de visión subyacente mejorado.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	10
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	10
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	10

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos

supplier_address
supplier_name
supplier_phone

Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Uptraining

Instrucciones de etiquetado Abrir en una ventana nueva

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Analizador de facturas

Descripción

Extrae texto y valores de las facturas, como el número de factura, el nombre del proveedor, el importe, el importe fiscal, la fecha de facturación y la fecha de vencimiento.

El analizador de facturas extrae los campos del encabezado y de las líneas de pedido, como el número de factura, el nombre del proveedor, el importe de la factura, el importe fiscal, la fecha de facturación, la fecha de vencimiento y los importes de las líneas de pedido.

Categoría Previamente entrenados

Funciones OCR y extracción de entidades

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API INVOICE_PROCESSOR

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Alemán	`de`	`Latn`
Inglés	`en`	`Latn`
Español	`es`	`Latn`
Estonio	`et`	`Latn`
Francés	`fr`	`Latn`
Italiano	`it`	`Latn`
Letón	`lv`	`Latn`
Lituano	`lt`	`Latn`
Holandés	`nl`	`Latn`
Portugués (Portugal y Brasil)	`pt`	`Latn`
Rumano	`ro`	`Latn`
Sueco	`sv`	`Latn`

Versiones de procesadores

ID de versión	Canal de actualización	Se agregó compatibilidad con más idiomas	Descripción
`pretrained-invoice-v1.1-2021-04-09`	Estable	Ninguno
`pretrained-invoice-v1.2-2022-02-18`	Estable	Ninguno	La baja está prevista para pronto.
`pretrained-invoice-v1.3-2022-07-15`	Estable	`it`: Italiano `pt`: Portugués (Portugal y Brasil) `ro`: Rumano `sv`: Sueco `et`: Estonio `lv`: Letón `lt`: Lituano	Es una versión del procesador que se puede volver a entrenar. La cantidad máxima de páginas (solicitudes en línea o síncronas) se incrementó a 15.
`pretrained-invoice-v1.4-2022-10-21`	Versión candidata para lanzamiento	Ninguno	Es una versión del procesador que se puede volver a entrenar. La cantidad máxima de páginas (solicitudes en línea o síncronas) se incrementó a 15.
`pretrained-invoice-v1.5-2023-09-15`	Versión candidata para lanzamiento	Ninguno
`pretrained-invoice-v2.0-2023-12-06`	Versión candidata para lanzamiento	Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	200
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos

supplier_address
supplier_name
supplier_phone

Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Uptraining

Instrucciones de etiquetado Abrir en una ventana nueva

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Clasifica documentos

Clasificador personalizado

Descripción

Entrena un modelo para clasificar un tipo de documento a partir de un conjunto de clases.

Categoría Clasificar

Funciones OCR, clasificación

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API CUSTOM_CLASSIFICATION_PROCESSOR

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Compatible con escritura a mano
Inglés	`en`	`Latn`

Versiones de procesadores

ID de versión	Canal de actualización	Descripción
`pretrained-foundation-model-v1.4-2025-05-16`	Versión candidata para lanzamiento	Es una versión candidata para lanzamiento potenciada por el LLM de Gemini 2.0 Flash. También incluye funciones avanzadas de OCR.
`pretrained-classifier-v1.5-2025-08-05`	Versión candidata para lanzamiento	Es una versión candidata para lanzamiento potenciada por el LLM de Gemini 2.5 Flash. También incluye funciones avanzadas de OCR.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	200
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Más información Crea un procesador de clasificación personalizado

Divisor personalizado

Descripción

Entrena un modelo para dividir un archivo que contiene varios documentos en documentos individuales clasificados.

Categoría Clasificar

Funciones OCR, clasificación y división

Etapa de lanzamiento Disponibilidad general

Estado de acceso Público

Escribe en la API CUSTOM_SPLITTING_PROCESSOR

Notas

La internacionalización solo se puede admitir a través de opciones de entrenamiento personalizadas.

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Compatible con escritura a mano
Inglés	`en`	`Latn`

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	1000
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Más información Crea un procesador de división personalizado

Resume documentos

Summarizer

Descripción

Obtén resúmenes abstractos y con viñetas de documentos cortos y largos.

Categoría preentrenado

Funciones Resumir

Etapa de lanzamiento Vista previa

Estado de acceso Público

Escribe en la API SUMMARY_PROCESSOR

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Compatible con escritura a mano
Inglés	`en`	`Latn`

Versiones de procesadores

ID de versión	Canal de actualización	Descripción
`pretrained-foundation-model-v1.0-2023-08-22`	Estable	Modelo de base de Google

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites

Cantidad máxima de páginas (solicitudes en línea o síncronas):	15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas):	250
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas):	30

Nota: Para extender el límite máximo de páginas para las solicitudes en línea y síncronas hasta 30, asegúrate de habilitar imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de muestra Abrir en una ventana nueva

Resultado de muestra: Abrir en una ventana nueva

Regiones admitidas

us

Más información Resumidor personalizado

Pies de página

^[*] Este procesador solo está disponible para los clientes con acceso limitado.

Para solicitar acceso a la API, completa y envía el formulario de solicitud de clientes con acceso limitado de Document AI. En el formulario se solicita información sobre tus datos personales, tu empresa y tu caso práctico. Ten en cuenta que se requiere un ID del proyecto de Google Cloud para acceder. Para crear un proyecto nuevo de Google Cloud o identificar el ID de tu proyecto existente, consulta las siguientes instrucciones.

Después de que envíes el formulario, el equipo de Document AI revisará tu solicitud para asegurarse de que cumplas con los criterios de acceso. Si se aprueba, recibirás un correo electrónico con instrucciones para acceder y usar esta función.

^[†] La verificación de documentos de identidad funciona para extraer y evaluar la información de los documentos de identidad que contribuye a identificar si la imagen de entrada representa un documento de identidad auténtico.

En Google Cloud, priorizamos ayudar a los clientes a desarrollar e implementar soluciones de IA de forma segura, y la Verificación de identidad se desarrolló de acuerdo con los principios de la IA de Google.

Según los principios de la IA de Google y el diseño actual del producto, recomendamos tener precaución y evaluar cuidadosamente los posibles beneficios y riesgos de usar la verificación de documentos de identidad en los siguientes casos:

Toma de decisiones sin participación humana para las predicciones que pueden afectar los derechos humanos
En dominios sensibles, incluidos, sin limitaciones, el empleo, el acceso a servicios públicos, el cuidado de la salud y los contextos críticos para la seguridad

^[‡] Siempre usa la verificación de identidad como parte de tu proceso y flujo de trabajo más amplios de detección de identidad. Es importante que tengas un revisor humano en tu flujo de trabajo para verificar si los indicadores predichos son precisos. El procesador de Verificación de identidad no está diseñado para reemplazar la revisión humana de los documentos de identidad en un flujo de trabajo, sino para ayudar a los revisores humanos a validar los documentos de identidad. El procesador de verificación de identidad no debe usarse como una herramienta de decisión automatizada para determinar si un documento de identidad es válido. Con la revisión humana, los clientes pueden lograr una mayor exactitud en el procesamiento de documentos y ayudar a las empresas a evaluar las predicciones con herramientas diseñadas específicamente para permitir esas revisiones.

Asegúrate de revisar las reglamentaciones de la región en la que implementarás esta tecnología y de investigar la orientación existente de la industria para obtener información sobre los lineamientos de las políticas y los problemas comunes de equidad. Obtén información sobre la imparcialidad en el aprendizaje automático, incluidas las formas de mitigar el sesgo en los conjuntos de datos de entrenamiento, evaluar tus modelos personalizados en busca de disparidades en el rendimiento y otras consideraciones a medida que usas tu modelo personalizado.

Recomendamos a los clientes que tengan en cuenta las prácticas recomendadas de equidad, interpretabilidad, privacidad y seguridad cuando implementen la verificación de identidad. Para obtener más información sobre cómo implementar la IA responsable, consulta las recomendaciones de Google para las prácticas de IA responsable.

Consulta la entrada de blog Automatiza el procesamiento de documentos de identidad con Document AI para obtener más información sobre los casos de uso y un repositorio de código de la aplicación de muestra.

Archivos admitidos

Lista de procesadores

Digitaliza texto

OCR (reconocimiento óptico de caracteres) de documentos empresariales

Lista completa de idiomas

Extraer entidades de los documentos

Extractor personalizado

Lista completa de idiomas

Lista completa de tipos de datos normalizados

Analizador de formularios

Lista completa de idiomas

Mostrar campos

Analizador de diseño

Lista completa de idiomas

Explora los procesadores previamente entrenados

Analizador de estados de cuenta

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analizador W2

Mostrar campos

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Analizador de pasaportes de EE.UU.

Lista completa de campos

Lista completa de campos normalizados

Analizador de utilidades

Lista completa de campos

Lista completa de campos normalizados

Analizador de revisión de documentos de identidad

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos normalizados

Analizador de comprobantes de pago

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analizador de licencias de conducir de EE.UU.

Lista completa de campos

Lista completa de campos normalizados

Analizador de gastos

Lista completa de idiomas

Mostrar campos

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analizador de facturas

Lista completa de idiomas

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Clasifica documentos

Clasificador personalizado

Divisor personalizado

Resume documentos

Summarizer

Pies de página