Lista de procesadores

En esta página, se incluye información detallada sobre todos los procesadores que ofrece Document AI. Puedes ver una lista de todos los procesadores por tipo de solución.

Todos los procesadores de Document AI cumplen con las Condiciones de Seguridad y Tratamiento de Datos.

Consulta la documentación sobre cómo administrar versiones de procesadores para obtener más detalles. Además, se aplican límites específicos del procesador, además de las cuotas y los límites generales del producto.

Digitaliza texto

OCR (reconocimiento óptico de caracteres) de documentos empresariales

Descripción

Identifica y extrae texto en diferentes tipos de documentos.

Este procesador te permite identificar y extraer texto, incluido el texto escrito a mano, de documentos en más de 200 idiomas. El procesador también usa el aprendizaje automático para realizar una evaluación de la calidad de un documento según la legibilidad de su contenido.

Categoría Digitalizar
Funciones OCR, análisis de calidad
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API OCR_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Afrikaans af Latn
Albanés sq Latn
Árabe ar Arab
Armenio hy Armn
Bielorruso be Cyrl
Bengalí bn Beng
Bengalí bn Beng
Búlgaro bg Cyrl
Catalán ca Latn
Chino zh Hani
Croata hr Latn
Checo cs Latn
Danés da Latn
Holandés nl Latn
Inglés en Latn
Estonio et Latn
Filipino fil Latn
Finlandés fi Latn
Francés fr Latn
Alemán de Latn
Griego el Grek
Gujarati gu Gujr
Hebreo iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandés is Latn
Indonesio id Latn
Italiano it Latn
Japonés ja Jpan
Canarés kn Knda
Jemer km Khmr
Coreano ko Kore
Laosiano lo Laoo
Letón lv Latn
Lituano lt Latn
Macedonio mk Cyrl
Malayo ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalí ne Deva
Noruego no Latn
Persa fa Arab
Polaco pl Latn
Portugués (Portugal y Brasil) pt Latn
Punjabí pa Guru
Rumano ro Latn
Ruso ru Cyrl
Serbio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Español es Latn
Sueco sv Latn
Tagalo tl Latn
Tamil ta Taml
Telugu te Telu
Tailandés th Thai
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versiones de procesadores
ID de versión Canal de actualización Descripción
pretrained-ocr-v1.2-2022-11-10 Estable Versión inmovilizada del modelo v1.0: Son los archivos, las configuraciones y los archivos binarios del modelo de una instantánea de la versión inmovilizada en una imagen de contenedor por hasta 18 meses.
pretrained-ocr-v2.0-2023-06-02 Estable Modelo listo para producción y especializado en casos de uso de documentos. Incluye acceso a todos los complementos de OCR.
pretrained-ocr-v2.1-2024-08-07 Estable Las principales áreas de mejora de la versión 2.1 son las siguientes: mejor reconocimiento de texto impreso, detección más precisa de casillas de verificación y orden de lectura más exacto.
pretrained-ocr-v2.1.1-2025-01-31 Versión potencial La versión 2.1.1 es similar a la versión 2.1 y está disponible en todas las regiones, excepto en US, EU y asia-southeast1.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 500
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Enterprise Document OCR

Extraer entidades de los documentos

Consulta los conjuntos de datos de muestra para obtener conjuntos de datos de muestra etiquetados y sin etiquetar que puedes usar para el entrenamiento.

Extractor personalizado

Descripción

Extrae campos de documentos con IA generativa o modelos personalizados, y ajusta los modelos para extraer datos de tus documentos con precisión.

Categoría Extraer
Funciones OCR y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API CUSTOM_EXTRACTION_PROCESSOR
Notas
  • Si usas la IA generativa para la extracción, haz lo siguiente:

    • Solo se admite oficialmente el idioma inglés.
    • La disponibilidad por región se encuentra en US, EU, northamerica-northeast1 y asia-southeast1.

Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Afrikaans af Latn
Árabe ar Arab
Azerbaiyano az Latn
Azerbaiyano (cirílico) az-Cyrl Cyrl
Bielorruso be Cyrl
Búlgaro bg Cyrl
Bosnio bs Latn
Catalán ca Latn
Cebuano ceb Latn
Checo cs Latn
Galés cy Latn
Danés da Latn
Alemán de Latn
Griego el Grek
Inglés en Latn
Esperanto eo Latn
Español es Latn
Estonio et Latn
Euskara eu Latn
Persa fa Arab
Finlandés fi Latn
Filipino fil Latn
Francés fr Latn
Irlandés ga Latn
Gallego gl Latn
Hindi hi Deva
Croata hr Latn
Criollo haitiano ht Latn
Húngaro hu Latn
Indonesio id Latn
Islandés is Latn
Italiano it Latn
Hebreo iw Hebr
Japonés ja Jpan
Javanés jv Latn
Kazajo kk Cyrl
Corean ko Kore
Kirguizo ky Cyrl
Latín la Latn
Lituano lt Latn
Letón lv Latn
Macedonio mk Cyrl
Mongol mn Cyrl
Marathi mr Deva
Malayo ms Latn
Maltés mt Latn
Nepalí ne Deva
Holandés nl Latn
Noruego no Latn
Polaco pl Latn
Pastún ps Arab
Portugués (Portugal y Brasil) pt Latn
Rumano ro Latn
Ruso ru Cyrl
Ruso (ortografía petrina) ru-PETR1708 Cyrl
Sánscrito sa Deva
Eslovaco sk Latn
Esloveno sl Latn
Albanés sq Latn
Serbio sr Cyrl
Sueco sv Latn
Suajili sw Latn
Tagalo tl Latn
Turco tr Latn
Ucraniano uk Cyrl
Urdu ur Arab
Uzbeko uz Latn
Uzbeko (cirílico) uz-Cyrl Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Chino simplificado zh-Hans Hani
Chino tradicional zh-Hant Hani
Zulú zu Latn
Versiones de procesadores
ID de versión Canal de actualización Descripción
pretrained-foundation-model-v1.4-2025-02-05 Estable Es un candidato listo para producción potenciado por el LLM de Gemini 2.0 Flash. También incluye funciones avanzadas de OCR, como la detección de casillas de verificación.
pretrained-foundation-model-v1.5-2025-05-05 Estable Candidato listo para producción potenciado por el LLM de Gemini 2.5 Flash. Se recomienda para quienes desean experimentar con modelos más nuevos.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Tipos de datos normalizados

Puedes encontrar más información en las páginas Enriquecimiento y normalización y Crear conjunto de datos.

Lista completa de tipos de datos normalizados
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Extractor personalizado

Analizador de formularios

Descripción

Extrae pares clave-valor generales (entidades y casillas de verificación), tablas y entidades genéricas de documentos, además del texto de OCR.

Este procesador aplica tecnologías avanzadas de aprendizaje automático para extraer pares clave-valor, casillas de verificación y tablas de documentos en más de 200 idiomas. Este procesador también aprovecha los modelos de aprendizaje profundo para extraer 11 entidades genéricas que son comunes en varios tipos de documentos.

Categoría Extraer
Funciones OCR, análisis de formularios y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API FORM_PARSER_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Afrikaans af Latn
Albanés sq Latn
Árabe ar Arab
Bielorruso be Cyrl
Catalán ca Latn
Chino zh Hani
Croata hr Latn
Checo cs Latn
Danés da Latn
Holandés nl Latn
Inglés en Latn
Estonio et Latn
Filipino fil Latn
Finlandés fi Latn
Francés fr Latn
Alemán de Latn
Hebreo iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandés is Latn
Indonesio id Latn
Italiano it Latn
Japonés ja Jpan
Corean ko Kore
Letón lv Latn
Lituano lt Latn
Macedonio mk Cyrl
Malayo ms Latn
Marathi mr Deva
Nepalí ne Deva
Noruego no Latn
Persa fa Arab
Polaco pl Latn
Portugués (Portugal y Brasil) pt Latn
Rumano ro Latn
Ruso ru Cyrl
Serbio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Español es Latn
Sueco sv Latn
Tagalo tl Latn
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Descripción
pretrained-form-parser-v1.0-2020-09-23 Estable

Ninguno

Es la versión heredada. Para obtener la mejor calidad y el conjunto completo de funciones, usa el Analizador de formularios v2.0.
pretrained-form-parser-v2.0-2022-11-10 Estable
Mostrar campos
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number
Versión recomendada. Admite entidades genéricas y contiene modelos actualizados de tablas, KVP y casillas de verificación, además de más de 200 idiomas.
pretrained-form-parser-v2.1-2023-06-26 Versión potencial

Ninguno

Es una versión preliminar pública. Es el mismo modelo que la versión 2.0, pero con la extracción de texto nativa de archivos PDF digitales habilitada.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 100
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Analizador de formularios

Analizador de diseño

Descripción

Extrae elementos de contenido de documentos (texto, tablas y listas) y crea fragmentos con contexto.

El analizador de diseño extrae elementos de contenido de documentos, como texto, tablas y listas, y crea fragmentos con contexto que facilitan la recuperación de información en la IA generativa y las aplicaciones de descubrimiento.

Categoría Extraer
Funciones Análisis de diseño y fragmentación de documentos
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API LAYOUT_PARSER_PROCESSOR
Notas
  • Este analizador admite archivos PDF, HTML y DOCX.
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Afrikaans af Latn
Albanés sq Latn
Árabe ar Arab
Armenio hy Armn
Bielorruso be Cyrl
Bengalí bn Beng
Bengalí bn Beng
Búlgaro bg Cyrl
Catalán ca Latn
Chino zh Hani
Croata hr Latn
Checo cs Latn
Danés da Latn
Holandés nl Latn
Inglés en Latn
Estonio et Latn
Filipino fil Latn
Finlandés fi Latn
Francés fr Latn
Alemán de Latn
Griego el Grek
Gujarati gu Gujr
Hebreo iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandés is Latn
Indonesio id Latn
Italiano it Latn
Japonés ja Jpan
Canarés kn Knda
Jemer km Khmr
Coreano ko Kore
Laosiano lo Laoo
Letón lv Latn
Lituano lt Latn
Macedonio mk Cyrl
Malayo ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalí ne Deva
Noruego no Latn
Persa fa Arab
Polaco pl Latn
Portugués (Portugal y Brasil) pt Latn
Punjabí pa Guru
Rumano ro Latn
Ruso ru Cyrl
Serbio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Español es Latn
Sueco sv Latn
Tagalo tl Latn
Tamil ta Taml
Telugu te Telu
Tailandés th Thai
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versiones de procesadores
ID de versión Canal de actualización Descripción
pretrained-layout-parser-v1.0-2024-06-03 Estable Versión recomendada.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 500
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us
Más información Analizador de diseño

Explora los procesadores previamente entrenados

Analizador de estados de cuenta

Descripción

Extrae información de los estados de cuenta, incluidos el nombre, la cuenta, las transacciones, etcétera

Categoría Previamente entrenados
Funciones OCR y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API BANK_STATEMENT_PROCESSOR
Notas
  • Si una página de un archivo de entrada de varias páginas es del tipo de documento correcto y una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento admitido. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, devuelve un mensaje de error.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Inglés en Latn
Versiones de procesadores
ID de versión Canal de actualización Descripción
pretrained-bankstatement-v1.0-2021-08-08 Estable
pretrained-bankstatement-v1.1-2021-08-13 Estable
pretrained-bankstatement-v2.0-2021-12-10 Estable
pretrained-bankstatement-v3.0-2022-05-16 Estable Esta versión supone que el archivo de entrada contiene un solo estado de cuenta bancario. A diferencia de la versión predeterminada, esta versión no verifica si el archivo de entrada contiene estados de cuenta y no mostrará un error si no se encuentran estados de cuenta.
pretrained-bankstatement-v4.0-2023-07-31 Versión potencial
pretrained-bankstatement-v5.0-2023-12-06 Versión potencial

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 30
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • bank_address
  • bank_name
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador W2

Descripción

Extrae información del formulario W2, como el empleado, el empleador, los salarios, etcétera

Categoría Previamente entrenados
Funciones OCR y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API FORM_W2_PROCESSOR
Notas
  • Si una página de un archivo de entrada de varias páginas es del tipo de documento correcto y una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento admitido. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, devuelve un mensaje de error.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Inglés en Latn
Formularios y versiones admitidos
  • 2020 (versiones estándar y personalizadas)
  • 2019 (versiones estándar y personalizadas)
  • 2018 (versiones estándar y personalizadas)
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Descripción
pretrained-w2-v1.0-2020-10-01 Estable

Ninguno

pretrained-w2-v1.1-2022-01-27 Estable

Ninguno

pretrained-w2-v1.2-2022-01-28 Estable
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Mejoras en la calidad y compatibilidad con campos nuevos; no incluye el divisor.

pretrained-w2-v2.0-2022-03-30 Versión potencial
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Se mejoró la calidad y se agregó compatibilidad con los campos de la casilla 12 y las predicciones detalladas de EmployeeName, EmployeeAddress y EmployerNameAndAddress, que ya no forman parte del resultado y se reemplazaron por campos adicionales.

pretrained-w2-v2.1-2022-06-08 Estable
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Es similar a la versión pretrained-w2-v2.0-2022-03-30, pero con más mejoras de calidad y la incorporación de una entidad más, EmployeeName_Suffix.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 15
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 15
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • EmployerNameAndAddress
  • EIN
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de pasaportes de EE.UU.

Descripción

Extrae campos como nombres, IDs de documentos, fecha de nacimiento, etcétera.

Categoría Previamente entrenados
Funciones OCR y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API US_PASSPORT_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Inglés en Latn
Versiones de procesadores
ID de versión Canal de actualización Descripción
pretrained-us-passport-v1.0-2021-06-14 Estable

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 2
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de utilidades

Descripción

Extrae el texto y los valores de las facturas de servicios públicos, como el nombre del proveedor y el importe pagado anterior.

Categoría Previamente entrenados
Funciones OCR y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Limitada [*]
Escribe en la API UTILITY_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Inglés en Latn
Versiones de procesadores
ID de versión Canal de actualización Descripción
pretrained-utility-v1.1-2021-04-09 Estable
pretrained-utility-v1.2-2022-12-15 Versión potencial

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 10
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de revisión de documentos de identidad

Descripción

Predice la validez de los documentos de identidad con varios indicadores.

El procesador de verificación de documentos de identidad está diseñado para ayudar a predecir la validez de los documentos de identidad con cuatro indicadores diferentes.

Actualmente, el procesador devuelve información de los siguientes indicadores:

  • Detección de fraud_signals_is_identity_document: Predice si una imagen contiene un documento de identidad reconocido.
  • Detección de fraud_signals_suspicious_words: Predice si hay palabras presentes que no son típicas en los IDs.
  • Detección de fraud_signals_image_manipulation: Predice si la imagen se alteró o manipuló con una herramienta de edición de imágenes.
  • Detección de fraud_signals_online_duplicate: Predice si la imagen se puede encontrar en línea (solo en EE.UU.).

Categoría Previamente entrenados
Funciones OCR, análisis de calidad
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API ID_PROOFING_PROCESSOR
Notas
  • Actualmente, la función de detección de duplicados en línea se procesa en centros de datos de EE.UU. La asistencia regional y multirregional no está disponible para esta función fuera de EE.UU.
  • Este procesador es compatible con algoritmos que se actualizan con mayor frecuencia que las nuevas versiones del procesador. Por este motivo, el procesador puede devolver diferentes resultados con el tiempo, incluso cuando se usa la misma versión del procesador. Por ejemplo, el sistema de detección de duplicados en línea supervisa las imágenes presentes en la Web. El comportamiento del sistema puede cambiar más rápido de lo que se puede hacer un seguimiento en las versiones del procesador.
  • Consulta las notas sobre la IA responsable[†] y la revisión humana.[‡]
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Inglés en Latn
Formularios y versiones admitidos
  • Se agregó compatibilidad con pasaportes, tarjetas de pasaporte y licencias de conducir de EE.UU.
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Descripción
pretrained-id-proofing-v1.0-2022-10-03 Estable

Ninguno

pretrained-id-proofing-v1.1-2023-05-18 Versión potencial
Mostrar campos
  • fraud_signals_photocopy_detection

Señal adicional de detección de fotocopias

pretrained-id-proofing-v1.2-2023-10-04 Versión potencial
Mostrar campos
  • fraud_signals_photocopy_detection

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 2
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de comprobantes de pago

Descripción

Extrae información de los recibos de pago, como el nombre, la empresa, los importes, etcétera

Categoría Previamente entrenados
Funciones OCR y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API PAYSTUB_PROCESSOR
Notas
  • Si el documento de entrada de varias páginas contiene más de un recibo de sueldo válido, el procesador extraerá entidades solo del primer recibo de sueldo válido. Si no se encuentran recibos de sueldo en el archivo de entrada, el procesador devuelve un mensaje de error.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Inglés en Latn
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Descripción
pretrained-paystub-v1.0-2021-03-19 Estable

Ninguno

pretrained-paystub-v1.1-2021-08-13 Estable
Mostrar campos
  • net_pay
  • net_pay_ytd
  • employee_account_number
Mejora de la calidad y compatibilidad con campos nuevos
pretrained-paystub-v1.2-2021-12-10 Estable

Ninguno

pretrained-paystub-v2.0-2022-05-17 Versión potencial
Mostrar campos
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

Esta versión supone que el archivo de entrada contiene un solo recibo de sueldo. A diferencia de la versión predeterminada, esta versión no verifica si el archivo de entrada contiene recibos de sueldo y no devolverá un error si no se encuentran recibos de sueldo.

Se mejoró la calidad, se agregó compatibilidad con campos nuevos y se implementó un esquema nuevo. Las categorías Bonus, Commissions, Holiday, Overtime, Regular Pay y Vacation ahora forman parte de earning_item/earning_this_period, y sus versiones del año hasta la fecha se encuentran en earning_item/earning_ytd. El depósito directo y el número de cuenta del empleado ahora están anidados en direct_deposit_item.

El límite de páginas asíncronas es de 10.

pretrained-paystub-v2.0-2022-07-22 Estable

Ninguno

Se mejoró la calidad y se optimizaron las mejoras en el entrenamiento.

pretrained-paystub-v3.0-2023-12-06 Versión potencial

Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 50
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • employer_address
  • employer_name
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Instrucciones de etiquetado Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de licencias de conducir de EE.UU.

Descripción

Extrae campos como nombres, IDs de documentos, fecha de nacimiento, etcétera.

Categoría Previamente entrenados
Funciones OCR y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API US_DRIVER_LICENSE_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Inglés en Latn
Formularios y versiones admitidos
  • Admite los 50 estados y el Distrito de Columbia (DC).
Versiones de procesadores
ID de versión Canal de actualización Descripción
pretrained-us-driver-license-v1.0-2021-06-14 Estable

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 2
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de gastos

Descripción

Extrae texto y valores de los documentos de gastos, como la fecha del gasto, el nombre del proveedor, el importe total y la moneda.

Categoría Previamente entrenados
Funciones OCR y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API EXPENSE_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Alemán de Latn
Inglés en Latn
Español es Latn
Francés fr Latn
Japonés ja Jpan
Holandés nl Latn
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Se agregó compatibilidad con más idiomas Descripción
pretrained-expense-v1.1-2021-04-09 Estable

Ninguno

Ninguno

Se lanzó en abril de 2021.
pretrained-expense-v1.3.2-2024-09-11 Versión potencial
Mostrar campos
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: Japonés
Actualización a la versión 1.3 con un modelo de visión subyacente mejorado.
pretrained-expense-v1.4-2022-11-18 Versión potencial
Mostrar campos
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Japonés
  • it: Italiano
  • pt: Portugués (Portugal y Brasil)
Se realizaron mejoras de rendimiento y se agregó compatibilidad con el entrenamiento ascendente. Se aumentó a 15 el límite máximo de páginas (solicitudes en línea o síncronas).
pretrained-expense-v1.4.2-2024-09-12 Versión potencial
Mostrar campos
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Japonés
  • it: Italiano
  • pt: Portugués (Portugal y Brasil)
Se actualizó a la versión 1.4 con un modelo de visión subyacente mejorado.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 10
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 10
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 10
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • supplier_address
  • supplier_name
  • supplier_phone
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Analizador de facturas

Descripción

Extrae texto y valores de las facturas, como el número de factura, el nombre del proveedor, el importe, el importe fiscal, la fecha de facturación y la fecha de vencimiento.

El analizador de facturas extrae los campos del encabezado y de las líneas de pedido, como el número de factura, el nombre del proveedor, el importe de la factura, el importe fiscal, la fecha de facturación, la fecha de vencimiento y los importes de las líneas de pedido.

Categoría Previamente entrenados
Funciones OCR y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API INVOICE_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Alemán de Latn
Inglés en Latn
Español es Latn
Estonio et Latn
Francés fr Latn
Italiano it Latn
Letón lv Latn
Lituano lt Latn
Holandés nl Latn
Portugués (Portugal y Brasil) pt Latn
Rumano ro Latn
Sueco sv Latn
Versiones de procesadores
ID de versión Canal de actualización Se agregó compatibilidad con más idiomas Descripción
pretrained-invoice-v1.1-2021-04-09 Estable

Ninguno

pretrained-invoice-v1.2-2022-02-18 Estable

Ninguno

La baja está prevista para pronto.
pretrained-invoice-v1.3-2022-07-15 Estable
  • it: Italiano
  • pt: Portugués (Portugal y Brasil)
  • ro: Rumano
  • sv: Sueco
  • et: Estonio
  • lv: Letón
  • lt: Lituano
Es una versión del procesador que se puede actualizar. La cantidad máxima de páginas (solicitudes en línea o síncronas) se incrementó a 15.
pretrained-invoice-v1.4-2022-10-21 Versión potencial

Ninguno

Es una versión del procesador que se puede actualizar. La cantidad máxima de páginas (solicitudes en línea o síncronas) se incrementó a 15.
pretrained-invoice-v1.5-2023-09-15 Versión potencial

Ninguno

pretrained-invoice-v2.0-2023-12-06 Versión potencial

Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • supplier_address
  • supplier_name
  • supplier_phone
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Clasifica documentos

Clasificador personalizado

Descripción

Entrena un modelo para clasificar un tipo de documento a partir de un conjunto de clases.

Categoría Clasificar
Funciones OCR, clasificación
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API CUSTOM_CLASSIFICATION_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Inglés en Latn
Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Crea un procesador de clasificación personalizado

Divisor personalizado

Descripción

Entrena un modelo para dividir un archivo que contiene varios documentos en documentos individuales clasificados.

Categoría Clasificar
Funciones OCR, clasificación y división
Etapa de lanzamiento Disponibilidad general
Estado de acceso Público
Escribe en la API CUSTOM_SPLITTING_PROCESSOR
Notas
  • La internacionalización solo se puede admitir a través de opciones de entrenamiento personalizadas.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Inglés en Latn
Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 1000
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Crea un procesador de división personalizado

Resume documentos

Summarizer

Descripción

Obtén resúmenes abstractos y con viñetas de documentos cortos y largos.

Categoría preentrenado
Funciones Resumir
Etapa de lanzamiento Vista previa
Estado de acceso Público
Escribe en la API SUMMARY_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatible con escritura a mano
Inglés en Latn
Versiones de procesadores
ID de versión Canal de actualización Descripción
pretrained-foundation-model-v1.0-2023-08-22 Estable Modelo de base de Google

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 250
Cantidad máxima de páginas (modo sin imágenes, solicitudes en línea o síncronas): 30
Uptraining
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • us
Más información Resumidor personalizado

Pies de página

[*] Este procesador solo está disponible para los clientes con acceso limitado.

Para solicitar acceso a la API, completa y envía el formulario de solicitud de clientes con acceso limitado de Document AI. En el formulario se solicita información sobre tus datos personales, tu empresa y tu caso práctico. Ten en cuenta que se requiere un ID del proyecto de Google Cloud para acceder. Para crear un proyecto nuevo de Google Cloud o identificar el ID de tu proyecto existente, consulta las siguientes instrucciones.

Después de que envíes el formulario, el equipo de Document AI revisará tu solicitud para asegurarse de que cumplas con los criterios de acceso. Si se aprueba, recibirás un correo electrónico con instrucciones para acceder y usar esta función.

[†] La verificación de documentos de identidad funciona para extraer y evaluar la información de los documentos de identidad que contribuye a identificar si la imagen de entrada representa un documento de identidad auténtico.

En Google Cloud, priorizamos ayudar a los clientes a desarrollar e implementar soluciones de IA de forma segura, y la Verificación de identidad se desarrolló de acuerdo con los principios de la IA de Google.

Según los principios de la IA de Google y el diseño actual del producto, recomendamos tener precaución y evaluar cuidadosamente los posibles beneficios y riesgos de usar la verificación de documentos de identidad en los siguientes casos:

  • Toma de decisiones sin intervención humana para las predicciones que pueden afectar los derechos humanos.
  • En dominios sensibles, incluidos, sin limitaciones, el empleo, el acceso a servicios públicos, el cuidado de la salud y los contextos críticos para la seguridad

[‡] Siempre usa la verificación de identidad como parte de tu proceso y flujo de trabajo más amplios de detección de identidad. Es importante que tengas un revisor humano en tu flujo de trabajo para verificar si los indicadores predichos son precisos. El procesador de Verificación de identidad no está diseñado para reemplazar la revisión manual de documentos de identidad en un flujo de trabajo, sino para ayudar a los revisores humanos a validar documentos de identidad. El procesador de verificación de identidad no debe usarse como una herramienta de decisión automatizada para determinar si un documento de identidad es válido. Con la revisión humana, los clientes pueden lograr una mayor exactitud en el procesamiento de documentos y ayudar a las empresas a evaluar las predicciones con herramientas diseñadas específicamente para permitir esas revisiones.

Asegúrate de revisar las reglamentaciones de la región en la que implementarás esta tecnología y de investigar la orientación existente de la industria para obtener información sobre los lineamientos de las políticas y los problemas comunes de equidad. Obtén información sobre la imparcialidad en el aprendizaje automático, incluidas las formas de mitigar el sesgo en los conjuntos de datos de entrenamiento, evaluar tus modelos personalizados en busca de disparidades en el rendimiento y otras consideraciones a medida que usas tu modelo personalizado.

Recomendamos a los clientes que tengan en cuenta las prácticas recomendadas de equidad, interpretabilidad, privacidad y seguridad cuando implementen la verificación de identidad. Para obtener más información sobre cómo implementar la IA responsable, consulta las recomendaciones de Google para las prácticas de IA responsable.

Consulta la entrada de blog Automatiza el procesamiento de documentos de identidad con Document AI para obtener más información sobre los casos de uso y un repositorio de código de la aplicación de muestra.