Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Lista de processadores
Esta página contém informações detalhadas sobre todos os processadores oferecidos pela
Document AI. Confira uma lista de todos os processadores por tipo de solução.
Enterprise Document OCR (reconhecimento óptico de caracteres)
Descrição
Identificar e extrair texto em diferentes tipos de documentos.
Esse processador permite identificar e extrair texto, incluindo texto escrito à mão, de documentos em mais de 200 idiomas. O processador também usa o aprendizado de máquina para fazer uma avaliação da qualidade de um documento com base na legibilidade do conteúdo.
Versão congelada do modelo v1.0: arquivos, configurações e binários de um snapshot de versão congelados em uma imagem de contêiner por até 18 meses.
pretrained-ocr-v2.0-2023-06-02
Estável
Modelo pronto para Production especializado em casos de uso de documentos. Inclui acesso a todos os complementos de OCR.
pretrained-ocr-v2.1-2024-08-07
Estável
As principais áreas de melhoria da v2.1 são: melhor reconhecimento de texto impresso, detecção mais precisa de caixas de seleção e ordem de leitura mais precisa.
pretrained-ocr-v2.1.1-2025-01-31
Versão candidata
A v2.1.1 é semelhante à v2.1 e está disponível em todas as regiões, exceto: US, EU e asia-southeast1.
Extrair pares de chave-valor gerais (entidade e caixa de seleção), tabelas e entidades genéricas de documentos, além de texto de OCR.
Esse processador aplica tecnologias avançadas de aprendizado de máquina para extrair pares de chave-valor, caixas de seleção e tabelas de documentos em mais de 200 idiomas. Esse processador também usa modelos de aprendizado profundo para extrair 11 entidades genéricas comuns em vários tipos de documentos.
Categoria
Extrair
Funções
OCR, análise de formulários, extração de entidades
Extrai elementos de conteúdo de documentos (texto, tabelas e listas) e cria blocos com reconhecimento de contexto.
O analisador de layout extrai elementos de conteúdo de documentos, como texto, tabelas e listas, e cria blocos com reconhecimento de contexto que facilitam a recuperação de informações em IA generativa e aplicativos de descoberta.
Se uma página de um arquivo de entrada de várias páginas for o tipo de documento correto e uma das versões compatíveis, o processador vai realizar a extração de entidades no primeiro documento compatível. Se o processador não encontrar documentos aplicáveis no arquivo de entrada, ele vai retornar uma mensagem de erro.
Idiomas disponíveis
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Inglês
en
Latn
Versões do processador
ID da versão
Canal de lançamento
Descrição
pretrained-bankstatement-v1.0-2021-08-08
Estável
pretrained-bankstatement-v1.1-2021-08-13
Estável
pretrained-bankstatement-v2.0-2021-12-10
Estável
pretrained-bankstatement-v3.0-2022-05-16
Estável
Esta versão pressupõe que o arquivo de entrada contém um único extrato bancário. Ao contrário da versão padrão, essa versão não verifica o arquivo de entrada em busca de extratos bancários e não retorna um erro se nenhum extrato for encontrado.
Se uma página de um arquivo de entrada de várias páginas for o tipo de documento correto e uma das versões compatíveis, o processador vai realizar a extração de entidades no primeiro documento compatível. Se o processador não encontrar documentos aplicáveis no arquivo de entrada, ele vai retornar uma mensagem de erro.
Idiomas disponíveis
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Inglês
en
Latn
Formulários/versões compatíveis
2020 (versões padrão e personalizadas)
2019 (versões padrão e personalizadas)
2018 (versões padrão e personalizadas)
Versões do processador
ID da versão
Canal de lançamento
Outros campos detectados
Descrição
pretrained-w2-v1.0-2020-10-01
Estável
Nenhum
pretrained-w2-v1.1-2022-01-27
Estável
Nenhum
pretrained-w2-v1.2-2022-01-28
Estável
Mostrar campos
AllocatedTips
ControlNumber
DependentCareBenefits
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
EmployerStateIdNumber_Line1
FederalIncomeTaxWithheld
FormYear
LocalIncomeTax_Line1
LocalityName_Line1
LocalWagesTipsEtc_Line1
MedicareTaxWithheld
MedicareWagesAndTips
NonqualifiedPlans
SocialSecurityTaxWithheld
SocialSecurityTips
SocialSecurityWages
SSN
State_Line1
StateIncomeTax_Line1
StateWagesTipsEtc_Line1
WagesTipsOtherCompensation
Melhorias na qualidade e suporte a novos campos. Não inclui divisor.
Melhorias na qualidade e suporte para campos da caixa 12 e previsões refinadas de EmployeeName, EmployeeAddress e EmployerNameAndAddress, que não fazem mais parte da saída e foram substituídos por outros campos.
Analisador de comprovação de documento de identidade
Descrição
Prever a validade de documentos de ID usando vários indicadores.
O processador de comprovação de documento de identificação foi projetado para ajudar a prever a validade de documentos de ID com quatro indicadores diferentes.
No momento, o processador retorna informações dos seguintes indicadores:
Detecção de fraud_signals_is_identity_document: prevê se uma imagem contém um documento de identificação reconhecido.
Detecção de fraud_signals_suspicious_words: prevê se há palavras que não são típicas em IDs.
Detecção de fraud_signals_image_manipulation: prevê se a imagem foi alterada ou adulterada com uma ferramenta de edição de imagens.
fraud_signals_online_duplicate detection: prevê se a imagem pode ser encontrada on-line (somente nos EUA).
No momento, o recurso de detecção de duplicidade on-line é processado em data centers dos EUA. O suporte regional e multirregional não está disponível para esse recurso fora dos EUA.
Esse processador é compatível com algoritmos que são atualizados com mais frequência do que as novas versões de processadores são lançadas. Por isso, o processador pode retornar resultados diferentes ao longo do tempo, mesmo usando a mesma versão. Por exemplo, o sistema de detecção de duplicados on-line monitora imagens presentes na Web. O comportamento do sistema pode mudar mais rápido do que pode ser rastreado nas versões do processador.
Consulte as observações sobre IA responsável[†] e revisão humana.[‡]
Idiomas disponíveis
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Inglês
en
Latn
Formulários/versões compatíveis
Suporte para passaportes, cartões de passe e carteiras de habilitação dos EUA.
Se o documento de entrada de várias páginas tiver mais de um comprovante de pagamento válido, o processador vai extrair entidades apenas do primeiro comprovante válido. Se nenhum contracheque for encontrado no arquivo de entrada, o processador vai retornar uma mensagem de erro.
Idiomas disponíveis
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Inglês
en
Latn
Versões do processador
ID da versão
Canal de lançamento
Outros campos detectados
Descrição
pretrained-paystub-v1.0-2021-03-19
Estável
Nenhum
pretrained-paystub-v1.1-2021-08-13
Estável
Mostrar campos
net_pay
net_pay_ytd
employee_account_number
Melhoria da qualidade e suporte a novos campos
pretrained-paystub-v1.2-2021-12-10
Estável
Nenhum
pretrained-paystub-v2.0-2022-05-17
Versão candidata a lançamento
Mostrar campos
deduction_item
deduction_item/deduction_type
deduction_item/deduction_this_period
deduction_item/deduction_ytd
direct_deposit_item
direct_deposit_item/direct_deposit
direct_deposit_item/employee_account_number
earning_item
earning_item/earning_type
earning_item/earning_rate
earning_item/earning_hours
earning_item/earning_this_period
earning_item/earning_ytd
page_number
tax_item
tax_item/tax_type
tax_item/tax_this_period
tax_item/tax_ytd
federal_additional_tax
federal_allowance
federal_marital_status
state_additional_tax
state_allowance
state_marital_status
Esta versão pressupõe que o arquivo de entrada contém um único contracheque. Ao contrário da versão padrão, essa versão não verifica o arquivo de entrada em busca de contracheques e não retorna um erro se nenhum for encontrado.
Melhoria na qualidade, suporte a novos campos e novo esquema. Os campos "Bônus", "Comissões", "Feriado", "Horas extras", "Salário normal" e "Férias" agora fazem parte de "earning_item/earning_this_period", e as versões do acumulado do ano estão em "earning_item/earning_ytd". O depósito direto e o número da conta do funcionário agora estão aninhados em direct_deposit_item.
O limite de páginas assíncronas é 10.
pretrained-paystub-v2.0-2022-07-22
Estável
Nenhum
Melhoria da qualidade e aprimoramentos de treinamento.
Extrações de textos e valores de faturas, como número da fatura, nome do fornecedor, valor da fatura, valor fiscal, data da fatura e data de vencimento.
O analisador de faturas extrai campos de cabeçalho e itens de linha, como número da fatura, nome do fornecedor, valor da fatura, valor do tributo, data da fatura, data de vencimento e valores dos itens de linha.
[*] Este processador está disponível apenas para clientes com acesso limitado.
Para solicitar acesso à API, preencha e envie o formulário de solicitação de cliente de acesso limitado do Document AI.
Nesse formulário, são solicitadas informações sobre você, sua empresa e seu caso de uso.
É necessário ter um ID de projeto do Google Cloud para acessar.
Para criar um novo projeto do Google Cloud ou identificar o ID do seu projeto
atual, siga estas instruções.
Depois que você enviar o formulário, a equipe do Document AI
analisará sua solicitação para garantir que você atenda aos critérios de acesso.
Caso seja aprovado, você receberá um e-mail com instruções de como acessar
e usar esse recurso.
[†]
A comprovação de documento de identidade extrai e avalia informações de documentos ID que ajudam a identificar se a imagem de entrada representa um ID autêntico.
No Google Cloud, priorizamos ajudar os clientes a desenvolver e implementar soluções de IA com segurança, e a confirmação de identidade foi desenvolvida de acordo com os princípios de IA do Google.
Com base nos princípios de IA do Google e no design atual do produto, recomendamos cautela e avaliação cuidadosa dos possíveis benefícios e riscos de usar a comprovação de documento de identidade para:
Tomada de decisões sem um human in the loop para previsões que podem afetar os direitos humanos.
Em domínios sensíveis, incluindo, entre outros, emprego, acesso a serviços públicos, saúde e contextos críticos de segurança.
[‡] Sempre use a comprovação de identidade como parte do seu processo e fluxo de trabalho mais amplos de detecção de identidade.
É importante ter um revisor humano no seu fluxo de trabalho para verificar se os indicadores previstos são precisos. O processador de comprovação de identidade não foi criado para substituir a revisão humana de documentos de identificação em um fluxo de trabalho, mas sim para ajudar os revisores humanos a validar ID documentos. O processador de comprovação de identidade não deve ser usado como uma ferramenta de decisão automatizada para determinar se um ID é válido. Com a revisão humana, os clientes podem alcançar maior acurácia de processamento de documentos e ajudar as empresas a avaliar previsões usando ferramentas criadas especificamente para permitir essas revisões.
Analise a legislação na região em que você está implementando essa tecnologia e pesquise as orientações do setor para saber mais sobre as diretrizes da política e os problemas comuns de imparcialidade. Leia sobre imparcialidade no machine learning, incluindo maneiras de reduzir o viés em conjuntos de dados de treinamento, avaliar seus modelos personalizados para detectar disparidades no desempenho e outras considerações ao usar seu modelo personalizado.
Incentivamos os clientes a manter em mente as práticas recomendadas de imparcialidade, interpretabilidade, privacidade e segurança ao implementar a confirmação de identidade. Para saber mais sobre como implementar a IA responsável, leia as recomendações do Google para práticas de IA responsável.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-07-14 UTC."],[[["Document AI offers various processors for digitizing, extracting, classifying, and summarizing document content, including Enterprise Document OCR for text recognition in over 200 languages."],["Custom Extractor uses generative AI or custom models to extract fields from documents, supporting multiple languages and specific data types, such as `dateTime`, `currency`, `number`, and has different versions with varying functionalities and lifespans."],["Form Parser extracts key-value pairs, checkboxes, tables, and entities from documents in over 200 languages, utilizing machine learning and deep learning techniques, and is capable of extracting fields such as `email`, `phone`, `url`, `date_time`, and more."],["Layout Parser, available for files such as PDF, HTML and DOCX, extracts content elements like text, tables and lists, supports a wide array of languages, and allows for processing up to 15 pages online or 500 in batch."],["Specialized pretrained processors like Bank Statement Parser, W2 Parser, US Passport Parser, Utility Parser, Identity Document Proofing Parser, Pay Slip Parser, US Driver License Parser, Expense Parser, and Invoice Parser are available for extracting specific information from different document types."]]],[]]