Prozessorliste

Auf dieser Seite finden Sie detaillierte Informationen zu allen von Document AI angebotenen Prozessoren. Sie können eine Liste aller Auftragsverarbeiter nach Lösungstyp aufrufen.

Alle Document AI-Prozessoren unterliegen den Nutzungsbedingungen zur Datenverarbeitung und Sicherheitsbestimmungen.

Weitere Informationen finden Sie in der Dokumentation unter Prozessorversionen verwalten. Außerdem gelten zusätzlich zu den allgemeinen Kontingenten und Limits für das Produkt bestimmte Prozessorlimits.

Text digitalisieren

Enterprise Document OCR (Optische Zeichenerkennung)

Beschreibung

Erkennt und extrahiert Text in verschiedenen Arten von Dokumenten.

Mit diesem Prozessor können Sie Text, einschließlich handgeschriebenen Text, in Dokumenten in über 200 Sprachen erkennen und extrahieren. Der Prozessor verwendet auch maschinelles Lernen, um die Qualität eines Dokuments anhand der Lesbarkeit seiner Inhalte zu bewerten.

Kategorie Digitalisieren
Funktionen OCR, Qualitätsanalyse
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben OCR_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Afrikaans af Latn
Albanisch sq Latn
Arabisch ar Arab
Armenisch hy Armn
Belarussisch be Cyrl
Bengalisch bn Beng
Bengalisch bn Beng
Bulgarisch bg Cyrl
Katalanisch ca Latn
Chinesisch zh Hani
Kroatisch hr Latn
Tschechisch cs Latn
Dänisch da Latn
Niederländisch nl Latn
Englisch en Latn
Estnisch et Latn
Filipino fil Latn
Finnisch fi Latn
Französisch fr Latn
Deutsch de Latn
Griechisch el Grek
Gujarati gu Gujr
Hebräisch iw Hebr
Hindi hi Deva
Ungarisch hu Latn
Isländisch is Latn
Indonesisch id Latn
Italienisch it Latn
Japanisch ja Jpan
Kannada kn Knda
Khmer km Khmr
Koreanisch ko Kore
Lao lo Laoo
Lettisch lv Latn
Litauisch lt Latn
Mazedonisch mk Cyrl
Malaiisch ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalesisch ne Deva
Norwegisch no Latn
Persisch fa Arab
Polnisch pl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Punjabi pa Guru
Rumänisch ro Latn
Russisch ru Cyrl
Serbisch sr Cyrl
Slowakisch sk Latn
Slowenisch sl Latn
Spanisch es Latn
Schwedisch sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Thailändisch th Thai
Türkisch tr Latn
Ukrainisch uk Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Prozessorversionen
Versions-ID Version Beschreibung
pretrained-ocr-v1.2-2022-11-10 Stabil Eingefrorene Modellversion 1.0: Modelldateien, Konfigurationen und Binärdateien einer Versionsmomentaufnahme, die bis zu 18 Monate lang in einem Container-Image eingefroren sind.
pretrained-ocr-v2.0-2023-06-02 Stabil Produktionsreifes Modell, das auf Dokumentanwendungsfälle spezialisiert ist. Beinhaltet den Zugriff auf alle OCR-Add-ons.
pretrained-ocr-v2.1-2024-08-07 Stabil Die wichtigsten Verbesserungen in Version 2.1 sind: bessere Erkennung von gedrucktem Text, genauere Erkennung von Kästchen und eine präzisere Lesereihenfolge.
pretrained-ocr-v2.1.1-2025-01-31 Releasekandidat v2.1.1 ähnelt V2.1 und ist in allen Regionen verfügbar, mit Ausnahme von US, EU und asia-southeast1.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 500
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Enterprise Document OCR

Entitäten aus Dokumenten extrahieren

Beispiel-Datasets mit Beispiel-Datasets mit und ohne Labels, die Sie zum Trainieren verwenden können.

Benutzerdefinierter Extrahierer

Beschreibung

Extrahieren Sie Felder aus Dokumenten mit generativer KI oder benutzerdefinierten Modellen und optimieren Sie Modelle, um Daten aus Ihren Dokumenten genau zu extrahieren.

Kategorie Extrahieren
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben CUSTOM_EXTRACTION_PROCESSOR
Hinweise
  • Wenn Sie generative KI für die Extraktion verwenden, gilt Folgendes:

    • Nur die englische Sprache wird offiziell unterstützt.
    • Die regionale Verfügbarkeit ist in US, EU, northamerica-northeast1 und asia-southeast1.

Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Afrikaans af Latn
Arabisch ar Arab
Aserbaidschanisch az Latn
Aserbaidschanisch (Kyrillisch) az-Cyrl Cyrl
Belarussisch be Cyrl
Bulgarisch bg Cyrl
Bosnisch bs Latn
Katalanisch ca Latn
Cebuano ceb Latn
Tschechisch cs Latn
Walisisch cy Latn
Dänisch da Latn
Deutsch de Latn
Griechisch el Grek
Englisch en Latn
Esperanto eo Latn
Spanisch es Latn
Estnisch et Latn
Baskisch eu Latn
Persisch fa Arab
Finnisch fi Latn
Filipino fil Latn
Französisch fr Latn
Irisch ga Latn
Galizisch gl Latn
Hindi hi Deva
Kroatisch hr Latn
Haitianisch ht Latn
Ungarisch hu Latn
Indonesisch id Latn
Isländisch is Latn
Italienisch it Latn
Hebräisch iw Hebr
Japanisch ja Jpan
Javanisch jv Latn
Kasachisch kk Cyrl
Koreanisch ko Kore
Kirgisisch ky Cyrl
Latein la Latn
Litauisch lt Latn
Lettisch lv Latn
Mazedonisch mk Cyrl
Mongolisch mn Cyrl
Marathi mr Deva
Malaiisch ms Latn
Maltesisch mt Latn
Nepalesisch ne Deva
Niederländisch nl Latn
Norwegisch no Latn
Polnisch pl Latn
Paschtu ps Arab
Portugiesisch (Portugal und Brasilien) pt Latn
Rumänisch ro Latn
Russisch ru Cyrl
Russisch (petrinische Orthografie) ru-PETR1708 Cyrl
Sanskrit sa Deva
Slowakisch sk Latn
Slowenisch sl Latn
Albanisch sq Latn
Serbisch sr Cyrl
Schwedisch sv Latn
Swahili sw Latn
Tagalog tl Latn
Türkisch tr Latn
Ukrainisch uk Cyrl
Urdu ur Arab
Usbekisch uz Latn
Usbekisch (Kyrillisch) uz-Cyrl Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Chinesisch (vereinfacht) zh-Hans Hani
Chinesisch (traditionell) zh-Hant Hani
Zulu zu Latn
Prozessorversionen
Versions-ID Version Beschreibung
pretrained-foundation-model-v1.4-2025-02-05 Stabil Produktionsreifer Kandidat, der auf dem Gemini 2.0 Flash-LLM basiert. Enthält auch erweiterte OCR-Funktionen wie die Erkennung von Kontrollkästchen.
pretrained-foundation-model-v1.5-2025-05-05 Stabil Produktionsreifer Kandidat, der auf dem Gemini 2.5 Flash-LLM basiert. Empfohlen für Nutzer, die neuere Modelle ausprobieren möchten.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Normalisierte Datentypen

Weitere Informationen finden Sie auf den Seiten Anreicherung und Normalisierung und Dataset erstellen.

Vollständige Liste der normalisierten Datentypen
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Benutzerdefinierter Extrahierer

Formularparser

Beschreibung

Zusätzlich zu OCR-Text können Sie allgemeine Schlüssel/Wert-Paare (Entität und Kästchen), Tabellen und allgemeine Entitäten aus Dokumenten extrahieren.

Dieser Prozessor nutzt fortschrittliche Technologien für maschinelles Lernen, um Schlüssel/Wert-Paare, Kästchen und Tabellen aus Dokumenten in mehr als 200 Sprachen zu extrahieren. Dieser Prozessor nutzt auch Deep-Learning-Modelle, um 11 generische Entitäten zu extrahieren, die in verschiedenen Dokumenttypen häufig vorkommen.

Kategorie Extrahieren
Funktionen OCR, Formularanalyse, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben FORM_PARSER_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Afrikaans af Latn
Albanisch sq Latn
Arabisch ar Arab
Belarussisch be Cyrl
Katalanisch ca Latn
Chinesisch zh Hani
Kroatisch hr Latn
Tschechisch cs Latn
Dänisch da Latn
Niederländisch nl Latn
Englisch en Latn
Estnisch et Latn
Filipino fil Latn
Finnisch fi Latn
Französisch fr Latn
Deutsch de Latn
Hebräisch iw Hebr
Hindi hi Deva
Ungarisch hu Latn
Isländisch is Latn
Indonesisch id Latn
Italienisch it Latn
Japanisch ja Jpan
Koreanisch ko Kore
Lettisch lv Latn
Litauisch lt Latn
Mazedonisch mk Cyrl
Malaiisch ms Latn
Marathi mr Deva
Nepalesisch ne Deva
Norwegisch no Latn
Persisch fa Arab
Polnisch pl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Rumänisch ro Latn
Russisch ru Cyrl
Serbisch sr Cyrl
Slowakisch sk Latn
Slowenisch sl Latn
Spanisch es Latn
Schwedisch sv Latn
Tagalog tl Latn
Türkisch tr Latn
Ukrainisch uk Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Beschreibung
pretrained-form-parser-v1.0-2020-09-23 Stabil

Keine

Legacy-Version Für optimale Qualität und den vollen Funktionsumfang sollten Sie den Form Parser v2.0 verwenden.
pretrained-form-parser-v2.0-2022-11-10 Stabil
Felder einblenden
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number
Empfohlene Version. Unterstützt generische Einheiten und umfasst ein aktualisiertes Tabellen-, KVP- und Kontrollkästchenmodell sowie mehr als 200 Sprachen.
pretrained-form-parser-v2.1-2023-06-26 Releasekandidat

Keine

Version der öffentlichen Vorschau. Dasselbe Modell wie Version 2.0, aber mit aktivierter nativer Textextraktion aus digitalen PDF-Dateien.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 100
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Formularparser

Layoutparser

Beschreibung

Extrahiert Dokumentinhaltselemente (Text, Tabellen und Listen) und erstellt kontextsensitive Blöcke.

Der Layoutparser extrahiert Dokumentinhaltselemente wie Text, Tabellen und Listen und erstellt kontextsensitive Blöcke, die das Abrufen von Informationen in Anwendungen für generative KI und Discovery erleichtern.

Kategorie Extrahieren
Funktionen Layoutanalyse, Dokumentaufteilung
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben LAYOUT_PARSER_PROCESSOR
Hinweise
  • Dieser Parser unterstützt PDF-, HTML- und DOCX-Dateien.
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Afrikaans af Latn
Albanisch sq Latn
Arabisch ar Arab
Armenisch hy Armn
Belarussisch be Cyrl
Bengalisch bn Beng
Bengalisch bn Beng
Bulgarisch bg Cyrl
Katalanisch ca Latn
Chinesisch zh Hani
Kroatisch hr Latn
Tschechisch cs Latn
Dänisch da Latn
Niederländisch nl Latn
Englisch en Latn
Estnisch et Latn
Filipino fil Latn
Finnisch fi Latn
Französisch fr Latn
Deutsch de Latn
Griechisch el Grek
Gujarati gu Gujr
Hebräisch iw Hebr
Hindi hi Deva
Ungarisch hu Latn
Isländisch is Latn
Indonesisch id Latn
Italienisch it Latn
Japanisch ja Jpan
Kannada kn Knda
Khmer km Khmr
Koreanisch ko Kore
Lao lo Laoo
Lettisch lv Latn
Litauisch lt Latn
Mazedonisch mk Cyrl
Malaiisch ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalesisch ne Deva
Norwegisch no Latn
Persisch fa Arab
Polnisch pl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Punjabi pa Guru
Rumänisch ro Latn
Russisch ru Cyrl
Serbisch sr Cyrl
Slowakisch sk Latn
Slowenisch sl Latn
Spanisch es Latn
Schwedisch sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Thailändisch th Thai
Türkisch tr Latn
Ukrainisch uk Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Prozessorversionen
Versions-ID Version Beschreibung
pretrained-layout-parser-v1.0-2024-06-03 Stabil Empfohlene Version.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 500
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us
Weitere Informationen Layout Parser

Vortrainierte Prozessoren ansehen

Kontoauszugsparser

Beschreibung

Extrahiert Daten aus Kontoauszügen, einschließlich Name, Konto, Transaktionen usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben BANK_STATEMENT_PROCESSOR
Hinweise
  • Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Extraktion von Entitäten für das erste unterstützte Dokument durch. Wenn der Prozessor in der Eingabedatei keine anwendbaren Dokumente findet, gibt er eine Fehlermeldung zurück.
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Beschreibung
pretrained-bankstatement-v1.0-2021-08-08 Stabil
pretrained-bankstatement-v1.1-2021-08-13 Stabil
pretrained-bankstatement-v2.0-2021-12-10 Stabil
pretrained-bankstatement-v3.0-2022-05-16 Stabil In dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Kontoauszug enthält. Im Gegensatz zur Standardversion wird in dieser Version die Eingabedatei nicht auf Kontoauszüge geprüft. Es wird kein Fehler zurückgegeben, wenn keine Kontoauszüge gefunden werden.
pretrained-bankstatement-v4.0-2023-07-31 Releasekandidat
pretrained-bankstatement-v5.0-2023-12-06 Releasekandidat

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 30
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • bank_address
  • bank_name
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Anleitung zum Labeln In neuem Fenster öffnen
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

W2-Parser

Beschreibung

Extrahiert Daten aus Formular W2, einschließlich Arbeitnehmer, Arbeitgeber, Löhne usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben FORM_W2_PROCESSOR
Hinweise
  • Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Extraktion von Entitäten für das erste unterstützte Dokument durch. Wenn der Prozessor in der Eingabedatei keine anwendbaren Dokumente findet, gibt er eine Fehlermeldung zurück.
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Unterstützte Formulare/Versionen
  • 2020 (Standard- und benutzerdefinierte Versionen)
  • 2019 (Standard- und benutzerdefinierte Versionen)
  • 2018 (Standard- und benutzerdefinierte Versionen)
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Beschreibung
pretrained-w2-v1.0-2020-10-01 Stabil

Keine

pretrained-w2-v1.1-2022-01-27 Stabil

Keine

pretrained-w2-v1.2-2022-01-28 Stabil
Felder einblenden
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Qualitätsverbesserungen und Unterstützung neuer Felder; ohne Splitter.

pretrained-w2-v2.0-2022-03-30 Releasekandidat
Felder einblenden
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Qualitätsverbesserungen und Unterstützung für Felder in Zeile 12 sowie detaillierte Vorhersagen für EmployeeName, EmployeeAddress und EmployerNameAndAddress. Diese sind nicht mehr Teil der Ausgabe und werden durch zusätzliche Felder ersetzt.

pretrained-w2-v2.1-2022-06-08 Stabil
Felder einblenden
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Ähnlich wie Version pretrained-w2-v2.0-2022-03-30, jedoch mit weiteren Qualitätsverbesserungen und einer zusätzlichen Entität EmployeeName_Suffix.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 15
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 15
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • EmployerNameAndAddress
  • EIN
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Parser für US-amerikanische Reisepässe

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben US_PASSPORT_PROCESSOR
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Beschreibung
pretrained-us-passport-v1.0-2021-06-14 Stabil

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 2
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 2
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Dienstprogrammparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen von Energieversorgern, z. B. den Lieferantennamen und den zuvor bezahlten Betrag.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Eingeschränkt [*]
API eingeben UTILITY_PROCESSOR
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Beschreibung
pretrained-utility-v1.1-2021-04-09 Stabil
pretrained-utility-v1.2-2022-12-15 Releasekandidat

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 10
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Anleitung zum Labeln In neuem Fenster öffnen
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Identity Document Proofing Parser

Beschreibung

Die Gültigkeit von Ausweisdokumenten anhand mehrerer Signale vorhersagen.

Der Identity Document Proofing-Prozessor wurde entwickelt, um die Gültigkeit von Identitätsdokumenten anhand von vier verschiedenen Signalen vorherzusagen.

Der Prozessor gibt derzeit Informationen aus den folgenden Signalen zurück:

  • fraud_signals_is_identity_document-Erkennung: Hier wird vorhergesagt, ob ein Bild ein erkanntes Ausweisdokument enthält.
  • fraud_signals_suspicious_words-Erkennung: Es wird vorhergesagt, ob Wörter vorhanden sind, die für IDs nicht typisch sind.
  • fraud_signals_image_manipulation-Erkennung: Hier wird vorhergesagt, ob das Bild mit einem Bildbearbeitungstool verändert oder manipuliert wurde.
  • fraud_signals_online_duplicate-Erkennung: Es wird vorhergesagt, ob das Bild online gefunden werden kann (nur USA).

Kategorie Vortrainiert
Funktionen OCR, Qualitätsanalyse
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben ID_PROOFING_PROCESSOR
Hinweise
  • Die Funktion zur Online-Erkennung von Duplikaten wird derzeit in US-Rechenzentren verarbeitet. Außerhalb der USA ist für diese Funktion keine regionale und multiregionale Unterstützung verfügbar.
  • Dieser Prozessor wird von Algorithmen unterstützt, die häufiger aktualisiert werden, als neue Prozessorversionen veröffentlicht werden. Aus diesem Grund kann der Prozessor im Laufe der Zeit unterschiedliche Ausgaben zurückgeben, auch wenn dieselbe Prozessorversion verwendet wird. Das System zur Online-Erkennung von Duplikaten überwacht beispielsweise Bilder im Web. Das Verhalten des Systems kann sich dann schneller ändern, als es in Prozessorversionen nachvollzogen werden kann.
  • Weitere Informationen finden Sie in den Anmerkungen zu verantwortungsbewusster KI[†] und zur Überprüfung durch Menschen.[‡]
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Unterstützte Formulare/Versionen
  • Unterstützung für US-amerikanische Reisepässe, Passport Cards und Führerscheine.
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Beschreibung
pretrained-id-proofing-v1.0-2022-10-03 Stabil

Keine

pretrained-id-proofing-v1.1-2023-05-18 Releasekandidat
Felder einblenden
  • fraud_signals_photocopy_detection

Zusätzliches Signal zur Erkennung von Fotokopien

pretrained-id-proofing-v1.2-2023-10-04 Releasekandidat
Felder einblenden
  • fraud_signals_photocopy_detection

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 2
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 2
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Lohnabrechnungsparser

Beschreibung

Extrahiert Daten aus Lohnabrechnungen, einschließlich Name, Unternehmen, Beträge usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben PAYSTUB_PROCESSOR
Hinweise
  • Wenn das mehrseitige Eingabedokument mehrere gültige Gehaltsabrechnungen enthält, werden nur aus der ersten gültigen Gehaltsabrechnung Entitäten extrahiert. Wenn in der Eingabedatei keine Gehaltsabrechnungen gefunden werden, gibt der Prozessor eine Fehlermeldung zurück.
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Beschreibung
pretrained-paystub-v1.0-2021-03-19 Stabil

Keine

pretrained-paystub-v1.1-2021-08-13 Stabil
Felder einblenden
  • net_pay
  • net_pay_ytd
  • employee_account_number
Qualitätsverbesserung und Unterstützung neuer Felder
pretrained-paystub-v1.2-2021-12-10 Stabil

Keine

pretrained-paystub-v2.0-2022-05-17 Releasekandidat
Felder einblenden
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

Bei dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Gehaltszettel enthält. Im Gegensatz zur Standardversion wird in dieser Version die Eingabedatei nicht auf Gehaltsabrechnungen geprüft. Es wird kein Fehler zurückgegeben, wenn keine Gehaltsabrechnungen gefunden werden.

Qualitätsverbesserung, Unterstützung neuer Felder und neues Schema. Bonus, Provisionen, Feiertage, Überstunden, reguläre Vergütung und Urlaub sind jetzt Teil von earning_item/earning_this_period und die Versionen seit Jahresbeginn sind in earning_item/earning_ytd enthalten. „Direct Deposit“ (Direkte Einzahlung) und „Employee Account Number“ (Mitarbeiterkontonummer) sind jetzt unter „direct_deposit_item“ verschachtelt.

Das asynchrone Seitenlimit beträgt 10.

pretrained-paystub-v2.0-2022-07-22 Stabil

Keine

Qualitätsverbesserung und Verbesserungen beim Uptraining.

pretrained-paystub-v3.0-2023-12-06 Releasekandidat

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 50
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • employer_address
  • employer_name
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Anleitung zum Labeln In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Parser für US-Führerschein

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben US_DRIVER_LICENSE_PROCESSOR
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Unterstützte Formulare/Versionen
  • Unterstützt alle 50 Bundesstaaten und DC.
Prozessorversionen
Versions-ID Version Beschreibung
pretrained-us-driver-license-v1.0-2021-06-14 Stabil

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 2
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 2
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Kostenparser

Beschreibung

Extrahiert Text und Werte aus Ausgabendokumenten, z. B. Ausgabendatum, Lieferantenname, Gesamtbetrag und Währung.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben EXPENSE_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Deutsch de Latn
Englisch en Latn
Spanisch es Latn
Französisch fr Latn
Japanisch ja Jpan
Niederländisch nl Latn
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Unterstützung weiterer Sprachen Beschreibung
pretrained-expense-v1.1-2021-04-09 Stabil

Keine

Keine

Im April 2021 eingeführt.
pretrained-expense-v1.3.2-2024-09-11 Releasekandidat
Felder einblenden
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: Japanisch
Ein Upgrade auf Version 1.3 mit einem verbesserten zugrunde liegenden Vision-Modell.
pretrained-expense-v1.4-2022-11-18 Releasekandidat
Felder einblenden
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Japanisch
  • it: Italienisch
  • pt: Portugiesisch (Portugal und Brasilien)
Leistungsverbesserungen und Unterstützung für das Uptraining. Das Limit für die maximale Anzahl von Seiten (Online-/synchrone Anfragen) wurde auf 15 erhöht.
pretrained-expense-v1.4.2-2024-09-12 Releasekandidat
Felder einblenden
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Japanisch
  • it: Italienisch
  • pt: Portugiesisch (Portugal und Brasilien)
Ein Upgrade auf Version 1.4 mit einem verbesserten zugrunde liegenden Vision-Modell.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 10
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 10
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 10
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • supplier_address
  • supplier_name
  • supplier_phone
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Anleitung zum Labeln In neuem Fenster öffnen
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Rechnungsparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum.

Der Rechnungs-Parser extrahiert sowohl Kopf- als auch Positionsfelder, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum und Positionsbeträge.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben INVOICE_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Deutsch de Latn
Englisch en Latn
Spanisch es Latn
Estnisch et Latn
Französisch fr Latn
Italienisch it Latn
Lettisch lv Latn
Litauisch lt Latn
Niederländisch nl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Rumänisch ro Latn
Schwedisch sv Latn
Prozessorversionen
Versions-ID Version Unterstützung weiterer Sprachen Beschreibung
pretrained-invoice-v1.1-2021-04-09 Stabil

Keine

pretrained-invoice-v1.2-2022-02-18 Stabil

Keine

Die Einstellung ist für bald geplant.
pretrained-invoice-v1.3-2022-07-15 Stabil
  • it: Italienisch
  • pt: Portugiesisch (Portugal und Brasilien)
  • ro: Rumänisch
  • sv: Schwedisch
  • et: Estnisch
  • lv: Lettisch
  • lt: Litauisch
Prozessorversion, die neu trainiert werden kann. Die maximale Anzahl von Seiten (Online-/Synchronanfragen) wurde auf 15 erhöht.
pretrained-invoice-v1.4-2022-10-21 Releasekandidat

Keine

Prozessorversion, die neu trainiert werden kann. Die maximale Anzahl von Seiten (Online-/Synchronanfragen) wurde auf 15 erhöht.
pretrained-invoice-v1.5-2023-09-15 Releasekandidat

Keine

pretrained-invoice-v2.0-2023-12-06 Releasekandidat

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • supplier_address
  • supplier_name
  • supplier_phone
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Anleitung zum Labeln In neuem Fenster öffnen
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Dokumente klassifizieren

Benutzerdefinierter Klassifikator

Beschreibung

Modell trainieren, um einen Dokumenttyp aus einer Reihe von Klassen zu klassifizieren.

Kategorie Klassifizieren
Funktionen OCR, Klassifizierung
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben CUSTOM_CLASSIFICATION_PROCESSOR
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Benutzerdefinierten Klassifizierungsprozessor erstellen

Benutzerdefinierter Splitter

Beschreibung

Trainieren Sie ein Modell, um eine Datei mit mehreren Dokumenten in einzelne, klassifizierte Dokumente aufzuteilen.

Kategorie Klassifizieren
Funktionen OCR, Klassifizierung, Aufteilung
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben CUSTOM_SPLITTING_PROCESSOR
Hinweise
  • i18n kann nur über benutzerdefinierte Trainingsoptionen unterstützt werden.
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 1000
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Benutzerdefinierten Splitterprozessor erstellen

Dokumente zusammenfassen

Summarizer

Beschreibung

Sie können Zusammenfassungen in Form von Abstracts und Aufzählungspunkten für kurze und lange Dokumente abrufen.

Kategorie vorab trainiert
Funktionen Zusammenfassen
Releasestufe Vorschau
Zugriffsstatus Öffentlich
API eingeben SUMMARY_PROCESSOR
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Beschreibung
pretrained-foundation-model-v1.0-2023-08-22 Stabil Foundation Model von Google

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/Synchronanfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 250
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • us
Weitere Informationen Benutzerdefinierte Zusammenfassung

Fußnoten

[*] Dieser Prozessor ist nur für Kunden mit eingeschränktem Zugriff verfügbar.

Wenn Sie den Zugriff auf diese API anfordern möchten, füllen Sie das Kundenanfrageformular für den eingeschränkten Zugriff auf Document AI aus und reichen Sie es ein. Im Formular müssen Sie Informationen über sich, Ihr Unternehmen und Ihren Anwendungsfall angeben. Beachten Sie, dass eine Google Cloud-Projekt-ID für den Zugriff erforderlich ist. Halten Sie sich an diese Anleitung, um ein neues Google Cloud-Projekt zu erstellen oder die Projekt-ID eines vorhandenen Projekts zu ermitteln.

Nachdem Sie das Formular gesendet haben, prüft das Document AI-Team Ihre Anfrage, um sicherzustellen, dass Sie die Zugriffskriterien erfüllen. Bei Genehmigung erhalten Sie eine E-Mail mit einer Anleitung dazu, wie Sie auf das Feature zugreifen und es verwenden können.

[†] Beim Identitätsnachweis werden Informationen aus Ausweisdokumenten extrahiert und ausgewertet, um festzustellen, ob das Eingabebild einen authentischen Ausweis darstellt.

Bei Google Cloudhelfen wir Kunden bei der Entwicklung und Implementierung von KI-Lösungen auf Basis von KI-Prinzipien. Die Identitätsüberprüfung wurde in Übereinstimmung mit den KI-Grundsätzen von Google entwickelt.

Gemäß den KI-Grundsätzen von Google und dem aktuellen Produktdesign empfehlen wir dringend, Vorsicht walten zu lassen und die potenziellen Vorteile und Risiken der Verwendung der Funktion „Ausweisprüfung“ für die folgenden Zwecke sorgfältig abzuwägen:

  • Entscheidungsfindung ohne menschliche Beteiligung bei Vorhersagen, die sich auf Menschenrechte auswirken können.
  • In sensiblen Bereichen wie Beschäftigung, Zugang zu öffentlichen Diensten, Gesundheitswesen und sicherheitskritischen Kontexten.

[‡] Verwenden Sie die Identitätsüberprüfung immer als Teil Ihres umfassenderen Prozesses und Workflows zur Identitätserkennung. Es ist wichtig, dass Sie einen menschlichen Prüfer in Ihren Workflow einbeziehen, um zu überprüfen, ob die vorhergesagten Signale korrekt sind. Der Identity Proofing-Prozessor soll die manuelle Überprüfung von Ausweisen in einem Workflow nicht ersetzen, sondern Prüfer bei der Validierung von Ausweisdokumenten unterstützen. Der Identity Proofing-Prozessor sollte nicht als automatisiertes Entscheidungstool verwendet werden, um festzustellen, ob ein Ausweis gültig ist. Durch die manuelle Überprüfung können Kunden eine höhere Genauigkeit bei der Dokumentenverarbeitung erzielen und Unternehmen bei der Bewertung von Vorhersagen helfen, indem sie speziell entwickelte Tools verwenden, die diese Überprüfungen ermöglichen.

Prüfen Sie die rechtlichen Vorgaben in der Region, in der Sie diese Technologie einsetzen, und informieren Sie sich über vorhandene Branchenrichtlinien, um mehr über Richtlinien und häufig auftretende Probleme im Zusammenhang mit Fairness zu erfahren. Hier finden Sie Informationen zur Fairness beim maschinellen Lernen, einschließlich Möglichkeiten, Verzerrungen in Trainingsdatensätzen zu reduzieren, Ihre benutzerdefinierten Modelle auf Leistungsunterschiede zu bewerten und andere Aspekte zu berücksichtigen, wenn Sie Ihr benutzerdefiniertes Modell verwenden.

Wir empfehlen unseren Kunden, bei der Implementierung der Identitätsüberprüfung Best Practices für Fairness, Interpretierbarkeit, Datenschutz und Sicherheit zu berücksichtigen. Weitere Informationen zur Implementierung von verantwortungsbewusster KI finden Sie in den Empfehlungen von Google für die verantwortungsbewusste Anwendung von KI.

Weitere Informationen zu Anwendungsfällen und ein Beispiel für ein Anwendungs-Code-Repository finden Sie im Blogpost Automate identity document processing with Document AI.