Elenco dei processori

Questa pagina contiene informazioni dettagliate su tutti i processori offerti da Document AI. Puoi visualizzare un elenco di tutti i processori per tipo di soluzione.

Tutti i processori Document AI rispettano i Termini per il trattamento e la sicurezza dei dati.

Per ulteriori dettagli, consulta la documentazione Gestione delle versioni del processore. Inoltre, si applicano limiti specifici per i processori, oltre alle quote e ai limiti complessivi del prodotto.

Digitalizzare il testo

Enterprise Document OCR (riconoscimento ottico dei caratteri)

Descrizione

Identifica ed estrai il testo in diversi tipi di documenti.

Questo processore ti consente di identificare ed estrarre testo, incluso il testo scritto a mano, dai documenti in più di 200 lingue. Il processore utilizza anche il machine learning per eseguire una valutazione della qualità di un documento in base alla leggibilità dei suoi contenuti.

Category Digitalizza
Funzioni OCR, analisi della qualità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API OCR_PROCESSOR
Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Afrikaans af Latn
Albanese sq Latn
Arabo ar Arab
Armeno hy Armn
Bielorusso be Cyrl
Bengalese bn Beng
Bengali bn Beng
Bulgaro bg Cyrl
Catalano ca Latn
Cinese zh Hani
Croato hr Latn
Ceco cs Latn
Danese da Latn
Olandese nl Latn
Inglese en Latn
Estone et Latn
Filippino fil Latn
Finlandese fi Latn
Francese fr Latn
Tedesco de Latn
Greco el Grek
Gujarati gu Gujr
Ebraico iw Hebr
Hindi hi Deva
Ungherese hu Latn
Islandese is Latn
Indonesiano id Latn
Italiano it Latn
Giapponese ja Jpan
Kannada kn Knda
Khmer km Khmr
Coreano ko Kore
Lao lo Laoo
Lettone lv Latn
Lituano lt Latn
Macedone mk Cyrl
Malese ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalese ne Deva
Norvegese no Latn
Persiano fa Arab
Polacco pl Latn
Portoghese (Portogallo e Brasile) pt Latn
Punjabi pa Guru
Rumeno ro Latn
Russo ru Cyrl
Serbo sr Cyrl
Slovacco sk Latn
Sloveno sl Latn
Spagnolo es Latn
Svedese sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Tailandese th Thai
Turco tr Latn
Ucraino uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versioni del processore
ID versione Canale di rilascio Descrizione
pretrained-ocr-v1.2-2022-11-10 Stabile Versione del modello bloccata v1.0: file, configurazioni e binari del modello di un'istantanea della versione bloccati in un'immagine container per un massimo di 18 mesi.
pretrained-ocr-v2.0-2023-06-02 Stabile Modello pronto per la produzione specializzato per i casi d'uso dei documenti. Include l'accesso a tutti i componenti aggiuntivi OCR.
pretrained-ocr-v2.1-2024-08-07 Stabile Le principali aree di miglioramento della versione 2.1 sono: migliore riconoscimento del testo stampato, rilevamento più preciso delle caselle di controllo e ordine di lettura più accurato.
pretrained-ocr-v2.1.1-2025-01-31 Candidato per la release La versione 2.1.1 è simile alla versione 2.1 ed è disponibile in tutte le regioni, ad eccezione di: US, EU e asia-southeast1.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 500
Numero massimo di pagine (modalità senza immagini richieste online/sincrone): 30
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Ulteriori informazioni Enterprise Document OCR

Estrai entità dai documenti

Consulta Set di dati di esempio per set di dati etichettati e non etichettati di esempio da utilizzare per l'addestramento.

Estrattore personalizzato

Descrizione

Estrai i campi dai documenti utilizzando l'AI generativa o modelli personalizzati; perfeziona i modelli per estrarre con precisione i dati dai tuoi documenti.

Category Estrarre
Funzioni OCR, estrazione di entità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API CUSTOM_EXTRACTION_PROCESSOR
Note
  • Se utilizzi l'AI generativa per l'estrazione:

    • È supportata ufficialmente solo la lingua inglese.
    • La disponibilità per regione è in US, EU, northamerica-northeast1 e asia-southeast1.

Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Afrikaans af Latn
Arabo ar Arab
Azero az Latn
Azero (cirillico) az-Cyrl Cyrl
Bielorusso be Cyrl
Bulgaro bg Cyrl
Bosniaco bs Latn
Catalano ca Latn
Cebuano ceb Latn
Ceco cs Latn
Gallese cy Latn
Danese da Latn
Tedesco de Latn
Greco el Grek
Inglese en Latn
Esperanto eo Latn
Spagnolo es Latn
Estone et Latn
Basco eu Latn
Persiano fa Arab
Finlandese fi Latn
Filippino fil Latn
Francese fr Latn
Irlandese ga Latn
Galiziano gl Latn
Hindi hi Deva
Croato hr Latn
Creolo haitiano ht Latn
Ungherese hu Latn
Indonesiano id Latn
Islandese is Latn
Italiano it Latn
Ebraico iw Hebr
Giapponese ja Jpan
Giavanese jv Latn
Kazako kk Cyrl
Coreano ko Kore
Kirgizo ky Cyrl
Latino la Latn
Lituano lt Latn
Lettone lv Latn
Macedone mk Cyrl
Mongolo mn Cyrl
Marathi mr Deva
Malese ms Latn
Maltese mt Latn
Nepalese ne Deva
Olandese nl Latn
Norvegese no Latn
Polacco pl Latn
Pashto ps Arab
Portoghese (Portogallo e Brasile) pt Latn
Rumeno ro Latn
Russo ru Cyrl
Russo (ortografia petrina) ru-PETR1708 Cyrl
Sanscrito sa Deva
Slovacco sk Latn
Sloveno sl Latn
Albanese sq Latn
Serbo sr Cyrl
Svedese sv Latn
Swahili sw Latn
Tagalog tl Latn
Turco tr Latn
Ucraino uk Cyrl
Urdu ur Arab
Uzbeco uz Latn
Uzbeko (cirillico) uz-Cyrl Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Cinese semplificato zh-Hans Hani
Cinese tradizionale zh-Hant Hani
Zulu zu Latn
Versioni del processore
ID versione Canale di rilascio Descrizione
pretrained-foundation-model-v1.4-2025-02-05 Stabile Candidato pronto per la produzione basato sul modello LLM Gemini 2.0 Flash. Include anche funzionalità OCR avanzate come il rilevamento delle caselle di controllo.
pretrained-foundation-model-v1.5-2025-05-05 Stabile Candidato pronto per la produzione basato sul modello LLM Gemini 2.5 Flash. Consigliato per chi vuole sperimentare modelli più recenti.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 200
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 30
Tipi di dati normalizzati

Per saperne di più, consulta le pagine Arricchimento e normalizzazione e Creare un set di dati.

Elenco completo dei tipi di dati normalizzati
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Ulteriori informazioni Estrattore personalizzato

Analizzatore sintattico di moduli

Descrizione

Estrai coppie chiave-valore generali (entità e casella di controllo), tabelle ed entità generiche dai documenti, oltre al testo OCR.

Questo processore applica tecnologie di machine learning avanzate per estrarre coppie chiave-valore, caselle di controllo e tabelle da documenti in più di 200 lingue. Questo processore sfrutta anche modelli di deep learning per estrarre 11 entità generiche comuni in vari tipi di documenti.

Category Estrarre
Funzioni OCR, analisi sintattica dei moduli, estrazione di entità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API FORM_PARSER_PROCESSOR
Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Afrikaans af Latn
Albanese sq Latn
Arabo ar Arab
Bielorusso be Cyrl
Catalano ca Latn
Cinese zh Hani
Croato hr Latn
Ceco cs Latn
Danese da Latn
Olandese nl Latn
Inglese en Latn
Estone et Latn
Filippino fil Latn
Finlandese fi Latn
Francese fr Latn
Tedesco de Latn
Ebraico iw Hebr
Hindi hi Deva
Ungherese hu Latn
Islandese is Latn
Indonesiano id Latn
Italiano it Latn
Giapponese ja Jpan
Coreano ko Kore
Lettone lv Latn
Lituano lt Latn
Macedone mk Cyrl
Malese ms Latn
Marathi mr Deva
Nepalese ne Deva
Norvegese no Latn
Persiano fa Arab
Polacco pl Latn
Portoghese (Portogallo e Brasile) pt Latn
Rumeno ro Latn
Russo ru Cyrl
Serbo sr Cyrl
Slovacco sk Latn
Sloveno sl Latn
Spagnolo es Latn
Svedese sv Latn
Tagalog tl Latn
Turco tr Latn
Ucraino uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Descrizione
pretrained-form-parser-v1.0-2020-09-23 Stabile

Nessuno

Versione precedente. Per una qualità ottimale e un set completo di funzionalità, utilizza il parser di moduli v2.0.
pretrained-form-parser-v2.0-2022-11-10 Stabile
Mostra campi
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number
Versione consigliata. Supporta le entità generiche e include modelli di tabelle, coppie chiave-valore e caselle di controllo aggiornati, nonché più di 200 lingue.
pretrained-form-parser-v2.1-2023-06-26 Candidato per la release

Nessuno

Versione di anteprima pubblica. Stesso modello della v2.0 con l'estrazione nativa del testo dai file PDF digitali abilitata.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 100
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 30
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Ulteriori informazioni Analizzatore sintattico di moduli

Parser del layout

Descrizione

Estrae elementi dei contenuti dei documenti (testo, tabelle ed elenchi) e crea blocchi sensibili al contesto.

Il parser del layout estrae elementi dei contenuti dei documenti come testo, tabelle ed elenchi e crea blocchi sensibili al contesto che facilitano il recupero di informazioni nell'AI generativa e nelle applicazioni di rilevamento.

Category Estrarre
Funzioni Analisi del layout, chunking dei documenti
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API LAYOUT_PARSER_PROCESSOR
Note
  • Questo parser supporta i file PDF, HTML e DOCX.
Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Afrikaans af Latn
Albanese sq Latn
Arabo ar Arab
Armeno hy Armn
Bielorusso be Cyrl
Bengalese bn Beng
Bengali bn Beng
Bulgaro bg Cyrl
Catalano ca Latn
Cinese zh Hani
Croato hr Latn
Ceco cs Latn
Danese da Latn
Olandese nl Latn
Inglese en Latn
Estone et Latn
Filippino fil Latn
Finlandese fi Latn
Francese fr Latn
Tedesco de Latn
Greco el Grek
Gujarati gu Gujr
Ebraico iw Hebr
Hindi hi Deva
Ungherese hu Latn
Islandese is Latn
Indonesiano id Latn
Italiano it Latn
Giapponese ja Jpan
Kannada kn Knda
Khmer km Khmr
Coreano ko Kore
Lao lo Laoo
Lettone lv Latn
Lituano lt Latn
Macedone mk Cyrl
Malese ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalese ne Deva
Norvegese no Latn
Persiano fa Arab
Polacco pl Latn
Portoghese (Portogallo e Brasile) pt Latn
Punjabi pa Guru
Rumeno ro Latn
Russo ru Cyrl
Serbo sr Cyrl
Slovacco sk Latn
Sloveno sl Latn
Spagnolo es Latn
Svedese sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Tailandese th Thai
Turco tr Latn
Ucraino uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versioni del processore
ID versione Canale di rilascio Descrizione
pretrained-layout-parser-v1.0-2024-06-03 Stabile Versione consigliata.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 500
Numero massimo di pagine (modalità senza immagini richieste online/sincrone): 30
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us
Ulteriori informazioni Parser del layout

Esplorare i processori preaddestrati

Analizzatore estratto conto bancario

Descrizione

Estrai dati dagli estratti conto bancari, tra cui nome, conto, transazioni e così via.

Category Preaddestrati
Funzioni OCR, estrazione di entità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API BANK_STATEMENT_PROCESSOR
Note
  • Se una pagina di un file di input di più pagine è del tipo di documento corretto e di una delle versioni supportate, il processore esegue l'estrazione delle entità sul primo documento supportato. Se il processore non trova documenti applicabili nel file di input, restituisce un messaggio di errore.
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Versioni del processore
ID versione Canale di rilascio Descrizione
pretrained-bankstatement-v1.0-2021-08-08 Stabile
pretrained-bankstatement-v1.1-2021-08-13 Stabile
pretrained-bankstatement-v2.0-2021-12-10 Stabile
pretrained-bankstatement-v3.0-2022-05-16 Stabile Questa versione presuppone che il file di input contenga un unico estratto conto bancario. A differenza della versione predefinita, questa versione non controlla la presenza di estratti conto bancari nel file di input e non restituisce un errore se non vengono trovati estratti conto bancari.
pretrained-bankstatement-v4.0-2023-07-31 Candidato per la release
pretrained-bankstatement-v5.0-2023-12-06 Candidato per la release

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 30
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 30
Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Campi con informazioni aggiuntive

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi arricchiti
  • bank_address
  • bank_name
Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Istruzioni per l'etichettatura Apri in una nuova finestra.
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore W2

Descrizione

Estrai dati dal modulo W2, tra cui dipendente, datore di lavoro, salari e così via.

Category Preaddestrati
Funzioni OCR, estrazione di entità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API FORM_W2_PROCESSOR
Note
  • Se una pagina di un file di input di più pagine è del tipo di documento corretto e di una delle versioni supportate, il processore esegue l'estrazione delle entità sul primo documento supportato. Se il processore non trova documenti applicabili nel file di input, restituisce un messaggio di errore.
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Moduli/versioni supportati
  • 2020 (versioni standard e personalizzate)
  • 2019 (versioni standard e personalizzate)
  • 2018 (versioni standard e personalizzate)
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Descrizione
pretrained-w2-v1.0-2020-10-01 Stabile

Nessuno

pretrained-w2-v1.1-2022-01-27 Stabile

Nessuno

pretrained-w2-v1.2-2022-01-28 Stabile
Mostra campi
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Miglioramenti della qualità e supporto di nuovi campi; non include lo splitter.

pretrained-w2-v2.0-2022-03-30 Candidato per la release
Mostra campi
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Miglioramenti della qualità e supporto per i campi della casella 12 e previsioni granulari di EmployeeName, EmployeeAddress e EmployerNameAndAddress, che non fanno più parte dell'output e sono sostituiti da campi aggiuntivi.

pretrained-w2-v2.1-2022-06-08 Stabile
Mostra campi
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Simile alla versione pretrained-w2-v2.0-2022-03-30, con ulteriori miglioramenti della qualità e l'introduzione di un'altra entità EmployeeName_Suffix.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 15
Numero massimo di pagine (modalità senza immagini richieste online/sincrone): 15
Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Campi con informazioni aggiuntive

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi arricchiti
  • EmployerNameAndAddress
  • EIN
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore sintattico di passaporti statunitensi

Descrizione

Estrai campi come nomi, ID documento, data di nascita e così via.

Category Preaddestrati
Funzioni OCR, estrazione di entità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API US_PASSPORT_PROCESSOR
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Versioni del processore
ID versione Canale di rilascio Descrizione
pretrained-us-passport-v1.0-2021-06-14 Stabile

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 2
Numero massimo di pagine (richieste batch/offline/asincrone): 2
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 2
Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore sintattico delle utenze

Descrizione

Estrai testo e valori dalle bollette, tra cui nome del fornitore e importo dell'ultimo pagamento.

Category Preaddestrati
Funzioni OCR, estrazione di entità
Fase di rilascio Disponibilità generale
Stato dell'accesso Limitato [*]
Digita API UTILITY_PROCESSOR
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Versioni del processore
ID versione Canale di rilascio Descrizione
pretrained-utility-v1.1-2021-04-09 Stabile
pretrained-utility-v1.2-2022-12-15 Candidato per la release

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 10
Numero massimo di pagine (richieste batch/offline/asincrone): 200
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 30
Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Istruzioni per l'etichettatura Apri in una nuova finestra.
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Parser di verifica dei documenti di identità

Descrizione

Prevedi la validità dei documenti di identità utilizzando più indicatori.

Il processore di verifica dei documenti di identità è progettato per aiutare a prevedere la validità dei documenti di identità con quattro indicatori diversi.

Attualmente, il processore restituisce informazioni dai seguenti indicatori:

  • Rilevamento di fraud_signals_is_identity_document: prevede se un'immagine contiene un documento di identità riconosciuto.
  • Rilevamento di fraud_signals_suspicious_words: prevede se sono presenti parole non tipiche negli ID.
  • fraud_signals_image_manipulation: prevede se l'immagine è stata alterata o manomessa con uno strumento di modifica delle immagini.
  • Rilevamento fraud_signals_online_duplicate: prevede se l'immagine può essere trovata online (solo negli Stati Uniti).

Category Preaddestrati
Funzioni OCR, analisi della qualità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API ID_PROOFING_PROCESSOR
Note
  • La funzionalità di rilevamento dei duplicati online viene attualmente elaborata nei data center degli Stati Uniti. Il supporto regionale e multiregionale non è disponibile per questa funzionalità al di fuori degli Stati Uniti.
  • Questo processore è supportato da algoritmi che vengono aggiornati più frequentemente rispetto al rilascio di nuove versioni del processore. Per questo motivo, il processore potrebbe restituire output diversi nel tempo anche se utilizza la stessa versione. Ad esempio, il sistema di rilevamento dei duplicati online monitora le immagini presenti sul web. Il comportamento del sistema può quindi cambiare più rapidamente di quanto possa essere monitorato nelle versioni del processore.
  • Consulta le note sull'IA responsabile[†] e sulla revisione umana.[‡]
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Moduli/versioni supportati
  • Supporto per passaporti, passaporto formato tessera e patenti di guida statunitensi.
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Descrizione
pretrained-id-proofing-v1.0-2022-10-03 Stabile

Nessuno

pretrained-id-proofing-v1.1-2023-05-18 Candidato per la release
Mostra campi
  • fraud_signals_photocopy_detection

Segnale di rilevamento di fotocopie aggiuntivo

pretrained-id-proofing-v1.2-2023-10-04 Candidato per la release
Mostra campi
  • fraud_signals_photocopy_detection

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 2
Numero massimo di pagine (richieste batch/offline/asincrone): 2
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 2
Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore busta paga

Descrizione

Estrai dati dalle buste paga, tra cui nome, attività, importi ecc.

Category Preaddestrati
Funzioni OCR, estrazione di entità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API PAYSTUB_PROCESSOR
Note
  • Se il documento di input di più pagine contiene più di una busta paga valida, il processore estrae le entità solo dalla prima busta paga valida. Se nel file di input non vengono trovate buste paga, il processore restituisce un messaggio di errore.
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Descrizione
pretrained-paystub-v1.0-2021-03-19 Stabile

Nessuno

pretrained-paystub-v1.1-2021-08-13 Stabile
Mostra campi
  • net_pay
  • net_pay_ytd
  • employee_account_number
Miglioramento della qualità e supporto di nuovi campi.
pretrained-paystub-v1.2-2021-12-10 Stabile

Nessuno

pretrained-paystub-v2.0-2022-05-17 Candidato per la release
Mostra campi
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

Questa versione presuppone che il file di input contenga una sola busta paga. A differenza della versione predefinita, questa versione non controlla la presenza di buste paga nel file di input e non restituisce un errore se non vengono trovate buste paga.

Miglioramento della qualità, supporto di nuovi campi e nuovo schema. Bonus, Commissioni, Festività, Straordinario, Retribuzione normale e Ferie ora fanno parte di earning_item/earning_this_period e le relative versioni dall'inizio dell'anno a oggi si trovano in earning_item/earning_ytd. I campi Deposito diretto e Numero di conto del dipendente ora sono nidificati in direct_deposit_item.

Il limite di pagine asincrone è 10.

pretrained-paystub-v2.0-2022-07-22 Stabile

Nessuno

Miglioramenti della qualità e dell'addestramento.

pretrained-paystub-v3.0-2023-12-06 Candidato per la release

Nessuno

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 50
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 30
Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Campi con informazioni aggiuntive

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi arricchiti
  • employer_address
  • employer_name
Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Istruzioni per l'etichettatura Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore sintattico di patenti di guida statunitensi

Descrizione

Estrai campi come nomi, ID documento, data di nascita e così via.

Category Preaddestrati
Funzioni OCR, estrazione di entità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API US_DRIVER_LICENSE_PROCESSOR
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Moduli/versioni supportati
  • Supporta tutti i 50 stati e Washington DC.
Versioni del processore
ID versione Canale di rilascio Descrizione
pretrained-us-driver-license-v1.0-2021-06-14 Stabile

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 2
Numero massimo di pagine (richieste batch/offline/asincrone): 2
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 2
Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore sintattico delle spese

Descrizione

Estrai testo e valori dai documenti delle spese, tra cui data della spesa, nome del fornitore, importo totale e valuta.

Category Preaddestrati
Funzioni OCR, estrazione di entità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API EXPENSE_PROCESSOR
Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Tedesco de Latn
Inglese en Latn
Spagnolo es Latn
Francese fr Latn
Giapponese ja Jpan
Olandese nl Latn
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-expense-v1.1-2021-04-09 Stabile

Nessuno

Nessuno

Lanciato ad aprile 2021.
pretrained-expense-v1.3.2-2024-09-11 Candidato per la release
Mostra campi
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: giapponese
Un upgrade alla versione 1.3 con un modello di visione sottostante migliorato.
pretrained-expense-v1.4-2022-11-18 Candidato per la release
Mostra campi
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: giapponese
  • it: italiano
  • pt: Portoghese (Portogallo e Brasile)
Miglioramenti delle prestazioni e supporto per l'addestramento incrementale. Il limite massimo di pagine (richieste online/sincrone) è stato aumentato a 15.
pretrained-expense-v1.4.2-2024-09-12 Candidato per la release
Mostra campi
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: giapponese
  • it: italiano
  • pt: Portoghese (Portogallo e Brasile)
Un upgrade alla versione 1.4 con un modello di visione artificiale sottostante migliorato.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 10
Numero massimo di pagine (richieste batch/offline/asincrone): 10
Numero massimo di pagine (modalità senza immagini richieste online/sincrone): 10
Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Campi con informazioni aggiuntive

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi arricchiti
  • supplier_address
  • supplier_name
  • supplier_phone
Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Istruzioni per l'etichettatura Apri in una nuova finestra.
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Analizzatore sintattico delle fatture

Descrizione

Estrai testo e valori dalle fatture, tra cui numero di fattura, nome del fornitore, importo della fattura, importo dell'IVA, data della fattura e data di scadenza.

Il parser delle fatture estrae i campi dell'intestazione e delle voci, ad esempio numero di fattura, nome del fornitore, importo della fattura, importo dell'IVA, data della fattura, data di scadenza e importi delle voci.

Category Preaddestrati
Funzioni OCR, estrazione di entità
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API INVOICE_PROCESSOR
Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Tedesco de Latn
Inglese en Latn
Spagnolo es Latn
Estone et Latn
Francese fr Latn
Italiano it Latn
Lettone lv Latn
Lituano lt Latn
Olandese nl Latn
Portoghese (Portogallo e Brasile) pt Latn
Rumeno ro Latn
Svedese sv Latn
Versioni del processore
ID versione Canale di rilascio Altre lingue supportate Descrizione
pretrained-invoice-v1.1-2021-04-09 Stabile

Nessuno

pretrained-invoice-v1.2-2022-02-18 Stabile

Nessuno

La deprecazione è prevista a breve.
pretrained-invoice-v1.3-2022-07-15 Stabile
  • it: italiano
  • pt: Portoghese (Portogallo e Brasile)
  • ro: rumeno
  • sv: svedese
  • et: Estone
  • lv: lettone
  • lt: lituano
Versione del processore riqualificabile. Il numero massimo di pagine (richieste online/sincrone) è stato aumentato a 15.
pretrained-invoice-v1.4-2022-10-21 Candidato per la release

Nessuno

Versione del processore riqualificabile. Il numero massimo di pagine (richieste online/sincrone) è stato aumentato a 15.
pretrained-invoice-v1.5-2023-09-15 Candidato per la release

Nessuno

pretrained-invoice-v2.0-2023-12-06 Candidato per la release

Nessuno

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 200
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 30
Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campi con informazioni aggiuntive

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi arricchiti
  • supplier_address
  • supplier_name
  • supplier_phone
Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Istruzioni per l'etichettatura Apri in una nuova finestra.
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Classifica i documenti

Classificatore personalizzato

Descrizione

Addestra un modello per classificare un tipo di documento da un insieme di classi.

Category Classificazione
Funzioni OCR, classificazione
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API CUSTOM_CLASSIFICATION_PROCESSOR
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 200
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 30
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Ulteriori informazioni Creare un processore di classificazione personalizzato

Separatore personalizzato

Descrizione

Addestra un modello per suddividere un file contenente più documenti in documenti singoli classificati.

Category Classificazione
Funzioni OCR, classificazione, suddivisione
Fase di rilascio Disponibilità generale
Stato dell'accesso Pubblico
Digita API CUSTOM_SPLITTING_PROCESSOR
Note
  • L'internazionalizzazione può essere supportata solo tramite opzioni di addestramento personalizzato.
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 1000
Numero massimo di pagine (modalità senza immagini richieste online/sincrone): 30
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Ulteriori informazioni Creare un processore di divisione personalizzato

Riassumi i documenti

Riassumitore

Descrizione

Ottieni riepiloghi astratti ed elenchi puntati per documenti brevi e lunghi.

Category preaddestrato
Funzioni Riassumi
Fase di rilascio Anteprima
Stato dell'accesso Pubblico
Digita API SUMMARY_PROCESSOR
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Versioni del processore
ID versione Canale di rilascio Descrizione
pretrained-foundation-model-v1.0-2023-08-22 Stabile Modello di base di Google

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti
Numero massimo di pagine (richieste online/sincrone): 15
Numero massimo di pagine (richieste batch/offline/asincrone): 250
Numero massimo di pagine (richieste online/sincrone in modalità senza immagini): 30
Uptraining
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • us
Ulteriori informazioni Riepilogo personalizzato

Note a piè di pagina

[*] Questo processore è disponibile solo per i clienti con accesso limitato.

Per richiedere l'accesso API, compila e invia il modulo di richiesta di accesso ai processori Document AI. Nel modulo devi inserire informazioni su di te, sulla tua azienda e sul tuo caso d'uso. Tieni presente che per effettuare l'accesso è necessario un ID progetto Google Cloud. Per creare un nuovo progetto Google Cloud o identificare l'ID del progetto esistente, consulta le seguenti istruzioni.

Una volta inviato il modulo, il team di Document AI esaminerà la tua richiesta per verificare che soddisfi i criteri per l'accesso. In caso di approvazione, riceverai un'email con le istruzioni su come accedere e utilizzare questa funzionalità.

[†] La verifica dei documenti di identità consente di estrarre e valutare le informazioni dai documenti di identità che contribuiscono a determinare se l'immagine di input rappresenta un documento di identità autentico.

In Google Cloud, diamo la priorità ad aiutare i clienti a sviluppare e implementare in modo sicuro soluzioni di AI e la verifica dell'identità è stata sviluppata in conformità ai principi dell'AI di Google.

In base ai principi di AI di Google e alla progettazione attuale dei prodotti, consigliamo vivamente di usare cautela e di valutare attentamente i potenziali vantaggi e rischi dell'utilizzo della verifica dei documenti di identità per quanto segue:

  • Processo decisionale senza human-in-the-loop per le previsioni che possono influire sui diritti umani.
  • In domini sensibili, inclusi, a titolo esemplificativo, occupazione, accesso a servizi pubblici, sanità e contesti critici per la sicurezza.

[‡] Utilizza sempre la verifica dell'identità nell'ambito del processo e del flusso di lavoro più ampio di rilevamento dell'identità. È importante che nel tuo flusso di lavoro sia presente un revisore umano per verificare se gli indicatori previsti sono accurati. Il processore di verifica dell'identità non ha lo scopo di sostituire la revisione umana dei documenti di identità in un flusso di lavoro, ma piuttosto di assistere i revisori umani nella convalida dei documenti di identità. Il processore di verifica dell'identità non deve essere utilizzato come strumento decisionale automatizzato per determinare se un documento di identità è valido. Con la revisione umana, i clienti possono ottenere una maggiore precisione nell'elaborazione dei documenti e aiutare le aziende a valutare le previsioni utilizzando strumenti appositamente progettati per consentire tali revisioni.

Assicurati di esaminare i regolamenti della regione in cui implementi questa tecnologia e di consultare le linee guida esistenti del settore per conoscere le norme e i problemi comuni relativi all'equità. Scopri di più sull'equità nel machine learning, inclusi i modi per mitigare i bias nei set di dati di addestramento, valutare i modelli personalizzati per le disparità di prestazioni e altre considerazioni da tenere a mente quando utilizzi il tuo modello personalizzato.

Invitiamo i clienti a tenere presente l'equità, l'interpretabilità e le best practice in materia di privacy e sicurezza durante l'implementazione della verifica dell'identità. Per scoprire di più su come implementare l'AI responsabile, leggi i consigli di Google sulle pratiche di AI responsabile.

Per saperne di più sui casi d'uso e su un repository di codice dell'applicazione di esempio, consulta il post del blog Automatizzare l'elaborazione dei documenti di identità con Document AI.