Diese Seite wurde von der Cloud Translation API übersetzt.

Prozessorliste

Auf dieser Seite finden Sie detaillierte Informationen zu allen von Document AI angebotenen Prozessoren. Sie können eine Liste aller Auftragsverarbeiter nach Lösungstyp aufrufen.

Alle Document AI-Prozessoren unterliegen den Nutzungsbedingungen zur Datenverarbeitung und Sicherheitsbestimmungen.

Weitere Informationen finden Sie in der Dokumentation unter Prozessorversionen verwalten. Außerdem gelten zusätzlich zu den allgemeinen Kontingenten und Limits für das Produkt bestimmte Prozessorlimits.

Text digitalisieren

Enterprise Document OCR (Optische Zeichenerkennung)

Beschreibung

Erkennt und extrahiert Text in verschiedenen Arten von Dokumenten.

Mit diesem Prozessor können Sie Text, einschließlich handgeschriebenen Text, in Dokumenten in über 200 Sprachen erkennen und extrahieren. Der Prozessor verwendet auch maschinelles Lernen, um die Qualität eines Dokuments anhand der Lesbarkeit seiner Inhalte zu bewerten.

Kategorie Digitalisieren

Funktionen OCR, Qualitätsanalyse

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben OCR_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Afrikaans	`af`	`Latn`
Albanisch	`sq`	`Latn`
Arabisch	`ar`	`Arab`
Armenisch	`hy`	`Armn`
Belarussisch	`be`	`Cyrl`
Bengalisch	`bn`	`Beng`
Bengalisch	`bn`	`Beng`
Bulgarisch	`bg`	`Cyrl`
Katalanisch	`ca`	`Latn`
Chinesisch	`zh`	`Hani`
Kroatisch	`hr`	`Latn`
Tschechisch	`cs`	`Latn`
Dänisch	`da`	`Latn`
Niederländisch	`nl`	`Latn`
Englisch	`en`	`Latn`
Estnisch	`et`	`Latn`
Filipino	`fil`	`Latn`
Finnisch	`fi`	`Latn`
Französisch	`fr`	`Latn`
Deutsch	`de`	`Latn`
Griechisch	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebräisch	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungarisch	`hu`	`Latn`
Isländisch	`is`	`Latn`
Indonesisch	`id`	`Latn`
Italienisch	`it`	`Latn`
Japanisch	`ja`	`Jpan`
Kannada	`kn`	`Knda`
Khmer	`km`	`Khmr`
Koreanisch	`ko`	`Kore`
Lao	`lo`	`Laoo`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Malaiisch	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalesisch	`ne`	`Deva`
Norwegisch	`no`	`Latn`
Persisch	`fa`	`Arab`
Polnisch	`pl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Serbisch	`sr`	`Cyrl`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Spanisch	`es`	`Latn`
Schwedisch	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Thailändisch	`th`	`Thai`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`

Prozessorversionen

Versions-ID	Version	Beschreibung
`pretrained-ocr-v1.2-2022-11-10`	Stabil	Eingefrorene Modellversion 1.0: Modelldateien, Konfigurationen und Binärdateien einer Versionsmomentaufnahme, die bis zu 18 Monate lang in einem Container-Image eingefroren sind.
`pretrained-ocr-v2.0-2023-06-02`	Stabil	Produktionsreifes Modell, das auf Dokumentanwendungsfälle spezialisiert ist. Beinhaltet den Zugriff auf alle OCR-Add-ons.
`pretrained-ocr-v2.1-2024-08-07`	Stabil	Die wichtigsten Verbesserungen in Version 2.1 sind: bessere Erkennung von gedrucktem Text, genauere Erkennung von Kästchen und eine präzisere Lesereihenfolge.
`pretrained-ocr-v2.1.1-2025-01-31`	Releasekandidat	v2.1.1 ähnelt V2.1 und ist in allen Regionen verfügbar, mit Ausnahme von `US`, `EU` und `asia-southeast1`.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	500
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Enterprise Document OCR

Entitäten aus Dokumenten extrahieren

Beispiel-Datasets mit Beispiel-Datasets mit und ohne Labels, die Sie zum Trainieren verwenden können.

Benutzerdefinierter Extrahierer

Beschreibung

Extrahieren Sie Felder aus Dokumenten mit generativer KI oder benutzerdefinierten Modellen und optimieren Sie Modelle, um Daten aus Ihren Dokumenten genau zu extrahieren.

Kategorie Extrahieren

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben CUSTOM_EXTRACTION_PROCESSOR

Hinweise

Wenn Sie generative KI für die Extraktion verwenden, gilt Folgendes:
- Offiziell wird nur die englische Sprache unterstützt.
- Die regionale Verfügbarkeit ist in US, EU, northamerica-northeast1 und asia-southeast1.

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Afrikaans	`af`	`Latn`
Arabisch	`ar`	`Arab`
Aserbaidschanisch	`az`	`Latn`
Aserbaidschanisch (Kyrillisch)	`az-Cyrl`	`Cyrl`
Belarussisch	`be`	`Cyrl`
Bulgarisch	`bg`	`Cyrl`
Bosnisch	`bs`	`Latn`
Katalanisch	`ca`	`Latn`
Cebuano	`ceb`	`Latn`
Tschechisch	`cs`	`Latn`
Walisisch	`cy`	`Latn`
Dänisch	`da`	`Latn`
Deutsch	`de`	`Latn`
Griechisch	`el`	`Grek`
Englisch	`en`	`Latn`
Esperanto	`eo`	`Latn`
Spanisch	`es`	`Latn`
Estnisch	`et`	`Latn`
Baskisch	`eu`	`Latn`
Persisch	`fa`	`Arab`
Finnisch	`fi`	`Latn`
Filipino	`fil`	`Latn`
Französisch	`fr`	`Latn`
Irisch	`ga`	`Latn`
Galizisch	`gl`	`Latn`
Hindi	`hi`	`Deva`
Kroatisch	`hr`	`Latn`
Haitianisch	`ht`	`Latn`
Ungarisch	`hu`	`Latn`
Indonesisch	`id`	`Latn`
Isländisch	`is`	`Latn`
Italienisch	`it`	`Latn`
Hebräisch	`iw`	`Hebr`
Japanisch	`ja`	`Jpan`
Javanisch	`jv`	`Latn`
Kasachisch	`kk`	`Cyrl`
Koreanisch	`ko`	`Kore`
Kirgisisch	`ky`	`Cyrl`
Latein	`la`	`Latn`
Litauisch	`lt`	`Latn`
Lettisch	`lv`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Mongolisch	`mn`	`Cyrl`
Marathi	`mr`	`Deva`
Malaiisch	`ms`	`Latn`
Maltesisch	`mt`	`Latn`
Nepalesisch	`ne`	`Deva`
Niederländisch	`nl`	`Latn`
Norwegisch	`no`	`Latn`
Polnisch	`pl`	`Latn`
Paschtu	`ps`	`Arab`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Russisch (petrinische Orthografie)	`ru-PETR1708`	`Cyrl`
Sanskrit	`sa`	`Deva`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Albanisch	`sq`	`Latn`
Serbisch	`sr`	`Cyrl`
Schwedisch	`sv`	`Latn`
Swahili	`sw`	`Latn`
Tagalog	`tl`	`Latn`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Urdu	`ur`	`Arab`
Usbekisch	`uz`	`Latn`
Usbekisch (Kyrillisch)	`uz-Cyrl`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`
Chinesisch (vereinfacht)	`zh-Hans`	`Hani`
Chinesisch (traditionell)	`zh-Hant`	`Hani`
Zulu	`zu`	`Latn`

Prozessorversionen

Versions-ID	Version	Beschreibung
`pretrained-foundation-model-v1.4-2025-02-05`	Stabil	Produktionsreifer Kandidat, der auf dem Gemini 2.0 Flash-LLM basiert. Enthält auch erweiterte OCR-Funktionen wie die Erkennung von Kästchen.
`pretrained-foundation-model-v1.5-2025-05-05`	Stabil	Produktionsreifer Kandidat, der auf dem Gemini 2.5 Flash-LLM basiert. Empfohlen für Nutzer, die neuere Modelle ausprobieren möchten.
`pretrained-foundation-model-v1.5-pro-2025-06-20`	Releasekandidat	Vorschaumodell, das auf dem Gemini 2.5 Pro-LLM basiert. Unterstützt ein Kontingent von bis zu 30 Seiten pro Minute für Online-Verarbeitungsanfragen. Dieses Modell bietet eine höhere Qualität als Version 1.5 und kann eine höhere Latenz haben.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Normalisierte Datentypen

Weitere Informationen finden Sie auf den Seiten Anreicherung und Normalisierung und Dataset erstellen.

Vollständige Liste der normalisierten Datentypen

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Benutzerdefinierter Extrahierer

Formularparser

Beschreibung

Zusätzlich zu OCR-Text können Sie allgemeine Schlüssel/Wert-Paare (Entität und Kästchen), Tabellen und allgemeine Entitäten aus Dokumenten extrahieren.

Dieser Prozessor nutzt fortschrittliche Technologien für maschinelles Lernen, um Schlüssel/Wert-Paare, Kästchen und Tabellen aus Dokumenten in mehr als 200 Sprachen zu extrahieren. Dieser Prozessor nutzt auch Deep-Learning-Modelle, um 11 generische Entitäten zu extrahieren, die in verschiedenen Dokumenttypen häufig vorkommen.

Kategorie Extrahieren

Funktionen OCR, Formularanalyse, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben FORM_PARSER_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Afrikaans	`af`	`Latn`
Albanisch	`sq`	`Latn`
Arabisch	`ar`	`Arab`
Belarussisch	`be`	`Cyrl`
Katalanisch	`ca`	`Latn`
Chinesisch	`zh`	`Hani`
Kroatisch	`hr`	`Latn`
Tschechisch	`cs`	`Latn`
Dänisch	`da`	`Latn`
Niederländisch	`nl`	`Latn`
Englisch	`en`	`Latn`
Estnisch	`et`	`Latn`
Filipino	`fil`	`Latn`
Finnisch	`fi`	`Latn`
Französisch	`fr`	`Latn`
Deutsch	`de`	`Latn`
Hebräisch	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungarisch	`hu`	`Latn`
Isländisch	`is`	`Latn`
Indonesisch	`id`	`Latn`
Italienisch	`it`	`Latn`
Japanisch	`ja`	`Jpan`
Koreanisch	`ko`	`Kore`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Malaiisch	`ms`	`Latn`
Marathi	`mr`	`Deva`
Nepalesisch	`ne`	`Deva`
Norwegisch	`no`	`Latn`
Persisch	`fa`	`Arab`
Polnisch	`pl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Serbisch	`sr`	`Cyrl`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Spanisch	`es`	`Latn`
Schwedisch	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Beschreibung
`pretrained-form-parser-v1.0-2020-09-23`	Stabil	Keine	Legacy-Version Für optimale Qualität und den vollen Funktionsumfang sollten Sie den Form Parser v2.0 verwenden.
`pretrained-form-parser-v2.0-2022-11-10`	Stabil	Felder einblenden `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	Empfohlene Version. Unterstützt generische Einheiten und umfasst ein aktualisiertes Tabellen-, KVP- und Kontrollkästchenmodell sowie mehr als 200 Sprachen.
`pretrained-form-parser-v2.1-2023-06-26`	Releasekandidat	Keine	Version der öffentlichen Vorschau. Dasselbe Modell wie Version 2.0, aber mit aktivierter nativer Textextraktion aus digitalen PDF-Dateien.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	100
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Formularparser

Layoutparser

Beschreibung

Extrahiert Dokumentinhaltselemente (Text, Tabellen und Listen) und erstellt kontextsensitive Blöcke.

Der Layoutparser extrahiert Dokumentinhaltselemente wie Text, Tabellen und Listen und erstellt kontextsensitive Blöcke, die das Abrufen von Informationen in Anwendungen für generative KI und Discovery erleichtern.

Kategorie Extrahieren

Funktionen Layoutanalyse, Dokumentaufteilung

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben LAYOUT_PARSER_PROCESSOR

Hinweise

Dieser Parser unterstützt PDF-, HTML-, DOCX-, PPTX- und XLSX-/XLSM-Dateien.

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Afrikaans	`af`	`Latn`
Albanisch	`sq`	`Latn`
Arabisch	`ar`	`Arab`
Armenisch	`hy`	`Armn`
Belarussisch	`be`	`Cyrl`
Bengalisch	`bn`	`Beng`
Bengalisch	`bn`	`Beng`
Bulgarisch	`bg`	`Cyrl`
Katalanisch	`ca`	`Latn`
Chinesisch	`zh`	`Hani`
Kroatisch	`hr`	`Latn`
Tschechisch	`cs`	`Latn`
Dänisch	`da`	`Latn`
Niederländisch	`nl`	`Latn`
Englisch	`en`	`Latn`
Estnisch	`et`	`Latn`
Filipino	`fil`	`Latn`
Finnisch	`fi`	`Latn`
Französisch	`fr`	`Latn`
Deutsch	`de`	`Latn`
Griechisch	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebräisch	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungarisch	`hu`	`Latn`
Isländisch	`is`	`Latn`
Indonesisch	`id`	`Latn`
Italienisch	`it`	`Latn`
Japanisch	`ja`	`Jpan`
Kannada	`kn`	`Knda`
Khmer	`km`	`Khmr`
Koreanisch	`ko`	`Kore`
Lao	`lo`	`Laoo`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Malaiisch	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalesisch	`ne`	`Deva`
Norwegisch	`no`	`Latn`
Persisch	`fa`	`Arab`
Polnisch	`pl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Serbisch	`sr`	`Cyrl`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Spanisch	`es`	`Latn`
Schwedisch	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Thailändisch	`th`	`Thai`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`

Prozessorversionen

Versions-ID	Version	Beschreibung
`pretrained-layout-parser-v1.0-2024-06-03`	Stabil	Empfohlene Version.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	500
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Weitere Informationen Layout Parser

Vortrainierte Prozessoren ansehen

Kontoauszugsparser

Beschreibung

Extrahiert Daten aus Kontoauszügen, einschließlich Name, Konto, Transaktionen usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben BANK_STATEMENT_PROCESSOR

Hinweise

Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Extraktion von Entitäten für das erste unterstützte Dokument durch. Wenn der Prozessor in der Eingabedatei keine anwendbaren Dokumente findet, gibt er eine Fehlermeldung zurück.

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Beschreibung
`pretrained-bankstatement-v1.0-2021-08-08`	Stabil
`pretrained-bankstatement-v1.1-2021-08-13`	Stabil
`pretrained-bankstatement-v2.0-2021-12-10`	Stabil
`pretrained-bankstatement-v3.0-2022-05-16`	Stabil	In dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Kontoauszug enthält. Im Gegensatz zur Standardversion wird in dieser Version die Eingabedatei nicht auf Kontoauszüge geprüft. Es wird kein Fehler zurückgegeben, wenn keine Kontoauszüge gefunden werden.
`pretrained-bankstatement-v4.0-2023-07-31`	Releasekandidat
`pretrained-bankstatement-v5.0-2023-12-06`	Releasekandidat

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	30
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

bank_address
bank_name

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Uptraining

Anleitung zum Labeln In neuem Fenster öffnen

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

W2-Parser

Beschreibung

Extrahiert Daten aus Formular W2, einschließlich Arbeitnehmer, Arbeitgeber, Löhne usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben FORM_W2_PROCESSOR

Hinweise

Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Extraktion von Entitäten für das erste unterstützte Dokument durch. Wenn der Prozessor in der Eingabedatei keine anwendbaren Dokumente findet, gibt er eine Fehlermeldung zurück.

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Unterstützte Formulare/Versionen

2020 (Standard- und benutzerdefinierte Versionen)
2019 (Standard- und benutzerdefinierte Versionen)
2018 (Standard- und benutzerdefinierte Versionen)

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Beschreibung
`pretrained-w2-v1.0-2020-10-01`	Stabil	Keine
`pretrained-w2-v1.1-2022-01-27`	Stabil	Keine
`pretrained-w2-v1.2-2022-01-28`	Stabil	Felder einblenden `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	Qualitätsverbesserungen und Unterstützung neuer Felder; ohne Splitter.
`pretrained-w2-v2.0-2022-03-30`	Releasekandidat	Felder einblenden `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Qualitätsverbesserungen und Unterstützung für Felder in Feld 12 sowie detaillierte Vorhersagen von `EmployeeName`, `EmployeeAddress` und `EmployerNameAndAddress`, die alle nicht mehr Teil der Ausgabe sind und durch zusätzliche Felder ersetzt werden.
`pretrained-w2-v2.1-2022-06-08`	Stabil	Felder einblenden `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Ähnlich wie Version `pretrained-w2-v2.0-2022-03-30`, aber mit weiteren Qualitätsverbesserungen und einer zusätzlichen Entität `EmployeeName_Suffix`.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	15
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	15

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

EmployerNameAndAddress
EIN

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Parser für US-amerikanische Reisepässe

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben US_PASSPORT_PROCESSOR

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Beschreibung
`pretrained-us-passport-v1.0-2021-06-14`	Stabil

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	2
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	2

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
MRZ Code
Portrait

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

Date Of Birth
Expiration Date
Issue Date

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Dienstprogrammparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen von Energieversorgern, z. B. den Lieferantennamen und den zuvor bezahlten Betrag.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Eingeschränkt ^[*]

API eingeben UTILITY_PROCESSOR

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Beschreibung
`pretrained-utility-v1.1-2021-04-09`	Stabil
`pretrained-utility-v1.2-2022-12-15`	Releasekandidat

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	10
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

adjusted_amount
amount_due
balance_transfer_amount
carrier
currency
currency_exchange_rate
delivery_date
deposit_credited_amount
due_date
freight_amount
invoice_date
invoice_id
late_fee_amount
line_item

line_item/amount
line_item/description
line_item/frequency
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/service_address
line_item/service_end_date
line_item/service_id_1
line_item/service_id_2
line_item/service_start_date
line_item/supplier_account_number
line_item/tax_amount
line_item/unit_number
line_item/unit_of_measure
line_item/unit_price
line_item/usage

net_amount
payment_terms
prior_amount_due
prior_paid_amount
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
reclaimed_water
remit_to_address
remit_to_name
service

service/service_end_date
service/service_id
service/service_start_date
service/unit_of_measure
service/usage

service_address
service_end_date
service_id
service_start_date
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_account_number
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
tampering
total_amount
total_tax_amount
usage
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

Uptraining

Anleitung zum Labeln In neuem Fenster öffnen

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Identity Document Proofing Parser

Beschreibung

Die Gültigkeit von Ausweisdokumenten anhand mehrerer Signale vorhersagen.

Der Identity Document Proofing-Prozessor wurde entwickelt, um die Gültigkeit von Identitätsdokumenten anhand von vier verschiedenen Signalen vorherzusagen.

Der Prozessor gibt derzeit Informationen aus den folgenden Signalen zurück:

fraud_signals_is_identity_document-Erkennung: Hier wird vorhergesagt, ob ein Bild ein erkanntes Ausweisdokument enthält.
fraud_signals_suspicious_words-Erkennung: Es wird vorhergesagt, ob Wörter vorhanden sind, die für IDs nicht typisch sind.
fraud_signals_image_manipulation-Erkennung: Hier wird vorhergesagt, ob das Bild mit einem Bildbearbeitungstool verändert oder manipuliert wurde.
fraud_signals_online_duplicate-Erkennung: Es wird vorhergesagt, ob das Bild online gefunden werden kann (nur USA).

Kategorie Vortrainiert

Funktionen OCR, Qualitätsanalyse

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben ID_PROOFING_PROCESSOR

Hinweise

Die Funktion zur Online-Erkennung von Duplikaten wird derzeit in US-Rechenzentren verarbeitet. Außerhalb der USA ist für diese Funktion keine regionale und multiregionale Unterstützung verfügbar.
Dieser Prozessor wird von Algorithmen unterstützt, die häufiger aktualisiert werden, als neue Prozessorversionen veröffentlicht werden. Aus diesem Grund kann der Prozessor im Laufe der Zeit unterschiedliche Ausgaben zurückgeben, auch wenn dieselbe Prozessorversion verwendet wird. Das System zur Online-Duplikaterkennung überwacht beispielsweise Bilder im Web. Das Verhalten des Systems kann sich dann schneller ändern, als es in Prozessorversionen nachvollzogen werden kann.
Weitere Informationen finden Sie in den Anmerkungen zu verantwortungsbewusster KI^[†] und zur Überprüfung durch Menschen.^[‡]

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Unterstützte Formulare/Versionen

Unterstützung für US-amerikanische Reisepässe, Passport Cards und Führerscheine.

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Beschreibung
`pretrained-id-proofing-v1.0-2022-10-03`	Stabil	Keine
`pretrained-id-proofing-v1.1-2023-05-18`	Releasekandidat	Felder einblenden `fraud_signals_photocopy_detection`	Zusätzliches Signal zur Erkennung von Fotokopien
`pretrained-id-proofing-v1.2-2023-10-04`	Releasekandidat	Felder einblenden `fraud_signals_photocopy_detection`

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	2
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	2

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Lohnabrechnungsparser

Beschreibung

Extrahiert Daten aus Lohnabrechnungen, einschließlich Name, Unternehmen, Beträge usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben PAYSTUB_PROCESSOR

Hinweise

Wenn das mehrseitige Eingabedokument mehrere gültige Gehaltsabrechnungen enthält, werden nur aus der ersten gültigen Gehaltsabrechnung Entitäten extrahiert. Wenn in der Eingabedatei keine Gehaltsabrechnungen gefunden werden, gibt der Prozessor eine Fehlermeldung zurück.

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Beschreibung
`pretrained-paystub-v1.0-2021-03-19`	Stabil	Keine
`pretrained-paystub-v1.1-2021-08-13`	Stabil	Felder einblenden `net_pay` `net_pay_ytd` `employee_account_number`	Qualitätsverbesserung und Unterstützung neuer Felder
`pretrained-paystub-v1.2-2021-12-10`	Stabil	Keine
`pretrained-paystub-v2.0-2022-05-17`	Releasekandidat	Felder einblenden `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	In dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Gehaltszettel enthält. Im Gegensatz zur Standardversion wird in dieser Version die Eingabedatei nicht auf Gehaltsabrechnungen geprüft. Es wird kein Fehler zurückgegeben, wenn keine Gehaltsabrechnungen gefunden werden. Qualitätsverbesserung, Unterstützung neuer Felder und neues Schema. Bonus, Provisionen, Feiertage, Überstunden, reguläre Vergütung und Urlaub sind jetzt Teil von earning_item/earning_this_period und die Versionen seit Jahresbeginn sind in earning_item/earning_ytd enthalten. „Direct Deposit“ (Direkte Einzahlung) und „Employee Account Number“ (Mitarbeiterkontonummer) sind jetzt unter „direct_deposit_item“ verschachtelt. Das asynchrone Seitenlimit beträgt 10.
`pretrained-paystub-v2.0-2022-07-22`	Stabil	Keine	Verbesserungen bei der Qualität und beim Uptraining.
`pretrained-paystub-v3.0-2023-12-06`	Releasekandidat	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	50
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

employer_address
employer_name

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Uptraining

Anleitung zum Labeln In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Parser für US-Führerschein

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben US_DRIVER_LICENSE_PROCESSOR

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Unterstützte Formulare/Versionen

Unterstützt alle 50 Bundesstaaten und DC.

Prozessorversionen

Versions-ID	Version	Beschreibung
`pretrained-us-driver-license-v1.0-2021-06-14`	Stabil

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	2
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	2

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

Date Of Birth
Expiration Date
Issue Date

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Kostenparser

Beschreibung

Extrahiert Text und Werte aus Ausgabendokumenten, z. B. Ausgabendatum, Lieferantenname, Gesamtbetrag und Währung.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben EXPENSE_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Deutsch	`de`	`Latn`
Englisch	`en`	`Latn`
Spanisch	`es`	`Latn`
Französisch	`fr`	`Latn`
Japanisch	`ja`	`Jpan`
Niederländisch	`nl`	`Latn`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Unterstützung weiterer Sprachen	Beschreibung
`pretrained-expense-v1.1-2021-04-09`	Stabil	Keine	Keine	Im April 2021 eingeführt.
`pretrained-expense-v1.3.2-2024-09-11`	Releasekandidat	Felder einblenden `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: Japanisch	Ein Upgrade auf Version 1.3 mit einem verbesserten zugrunde liegenden Vision-Modell.
`pretrained-expense-v1.4-2022-11-18`	Releasekandidat	Felder einblenden `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Japanisch `it`: Italienisch `pt`: Portugiesisch (Portugal und Brasilien)	Leistungsverbesserungen und Unterstützung für das Uptraining. Das Limit für die maximale Anzahl von Seiten (Online-/synchrone Anfragen) wurde auf 15 erhöht. Hinweis:Wird ab dem 30. April 2025 in den USA und der EU eingestellt.
`pretrained-expense-v1.4.2-2024-09-12`	Releasekandidat	Felder einblenden `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Japanisch `it`: Italienisch `pt`: Portugiesisch (Portugal und Brasilien)	Ein Upgrade auf Version 1.4 mit einem verbesserten zugrunde liegenden Vision-Modell.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	10
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	10
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	10

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

supplier_address
supplier_name
supplier_phone

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Uptraining

Anleitung zum Labeln In neuem Fenster öffnen

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Rechnungsparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum.

Der Rechnungs-Parser extrahiert sowohl Kopf- als auch Positionsfelder, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum und Positionsbeträge.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben INVOICE_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Deutsch	`de`	`Latn`
Englisch	`en`	`Latn`
Spanisch	`es`	`Latn`
Estnisch	`et`	`Latn`
Französisch	`fr`	`Latn`
Italienisch	`it`	`Latn`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Niederländisch	`nl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Rumänisch	`ro`	`Latn`
Schwedisch	`sv`	`Latn`

Prozessorversionen

Versions-ID	Version	Unterstützung weiterer Sprachen	Beschreibung
`pretrained-invoice-v1.1-2021-04-09`	Stabil	Keine
`pretrained-invoice-v1.2-2022-02-18`	Stabil	Keine	Die Einstellung ist für bald geplant.
`pretrained-invoice-v1.3-2022-07-15`	Stabil	`it`: Italienisch `pt`: Portugiesisch (Portugal und Brasilien) `ro`: Rumänisch `sv`: Schwedisch `et`: Estnisch `lv`: Lettisch `lt`: Litauisch	Prozessorversion, die neu trainiert werden kann. Die maximale Anzahl von Seiten (Online-/Synchronanfragen) wurde auf 15 erhöht.
`pretrained-invoice-v1.4-2022-10-21`	Releasekandidat	Keine	Prozessorversion, die neu trainiert werden kann. Die maximale Anzahl von Seiten (Online-/Synchronanfragen) wurde auf 15 erhöht.
`pretrained-invoice-v1.5-2023-09-15`	Releasekandidat	Keine
`pretrained-invoice-v2.0-2023-12-06`	Releasekandidat	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

supplier_address
supplier_name
supplier_phone

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Uptraining

Anleitung zum Labeln In neuem Fenster öffnen

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Dokumente klassifizieren

Benutzerdefinierter Klassifikator

Beschreibung

Modell trainieren, um einen Dokumenttyp aus einer Reihe von Klassen zu klassifizieren.

Kategorie Klassifizieren

Funktionen OCR, Klassifizierung

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben CUSTOM_CLASSIFICATION_PROCESSOR

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Beschreibung
`pretrained-foundation-model-v1.4-2025-05-16`	Releasekandidat	Release-Kandidat, der auf dem Gemini 2.0 Flash-LLM basiert. Enthält auch erweiterte OCR-Funktionen.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Benutzerdefinierten Klassifizierungsprozessor erstellen

Benutzerdefinierter Splitter

Beschreibung

Trainieren Sie ein Modell, um eine Datei mit mehreren Dokumenten in einzelne, klassifizierte Dokumente aufzuteilen.

Kategorie Klassifizieren

Funktionen OCR, Klassifizierung, Aufteilung

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben CUSTOM_SPLITTING_PROCESSOR

Hinweise

i18n kann nur über benutzerdefinierte Trainingsoptionen unterstützt werden.

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	1000
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Benutzerdefinierten Splitterprozessor erstellen

Dokumente zusammenfassen

Summarizer

Beschreibung

Sie können Zusammenfassungen in Form von Abstracts und Aufzählungspunkten für kurze und lange Dokumente abrufen.

Kategorie vorab trainiert

Funktionen Zusammenfassen

Releasestufe Vorschau

Zugriffsstatus Öffentlich

API eingeben SUMMARY_PROCESSOR

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Beschreibung
`pretrained-foundation-model-v1.0-2023-08-22`	Stabil	Foundation Model von Google

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/Synchronanfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	250
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

us

Weitere Informationen Benutzerdefinierte Zusammenfassung

Fußnoten

^[*] Dieser Prozessor ist nur für Kunden mit eingeschränktem Zugriff verfügbar.

Wenn Sie den Zugriff auf diese API anfordern möchten, füllen Sie das Kundenanfrageformular für den eingeschränkten Zugriff auf Document AI aus und reichen Sie es ein. Im Formular müssen Sie Informationen über sich, Ihr Unternehmen und Ihren Anwendungsfall angeben. Beachten Sie, dass eine Google Cloud-Projekt-ID für den Zugriff erforderlich ist. Halten Sie sich an diese Anleitung, um ein neues Google Cloud-Projekt zu erstellen oder die Projekt-ID eines vorhandenen Projekts zu ermitteln.

Nachdem Sie das Formular gesendet haben, prüft das Document AI-Team Ihre Anfrage, um sicherzustellen, dass Sie die Kriterien für den Zugriff erfüllen. Bei Genehmigung erhalten Sie eine E-Mail mit einer Anleitung dazu, wie Sie auf das Feature zugreifen und es verwenden können.

^[†] Beim Identitätsnachweis werden Informationen aus Ausweisdokumenten extrahiert und ausgewertet, um festzustellen, ob das Eingabebild einen authentischen Ausweis darstellt.

Bei Google Cloudhelfen wir Kunden bei der Entwicklung und Implementierung von KI-Lösungen auf Basis von KI-Prinzipien. Die Identitätsüberprüfung wurde in Übereinstimmung mit den KI-Grundsätzen von Google entwickelt.

Gemäß den KI-Grundsätzen von Google und dem aktuellen Produktdesign empfehlen wir dringend, Vorsicht walten zu lassen und die potenziellen Vorteile und Risiken der Verwendung der Funktion „Ausweisprüfung“ für die folgenden Zwecke sorgfältig abzuwägen:

Entscheidungsfindung ohne menschliche Beteiligung bei Vorhersagen, die sich auf Menschenrechte auswirken können.
In sensiblen Bereichen wie Beschäftigung, Zugang zu öffentlichen Diensten, Gesundheitswesen und sicherheitskritischen Kontexten.

^[‡] Verwenden Sie die Identitätsüberprüfung immer als Teil Ihres umfassenderen Prozesses und Workflows zur Identitätserkennung. Es ist wichtig, dass Sie einen menschlichen Prüfer in Ihren Workflow einbeziehen, um zu überprüfen, ob die vorhergesagten Signale korrekt sind. Der Identity Proofing-Prozessor soll die manuelle Überprüfung von Ausweisen in einem Workflow nicht ersetzen, sondern Prüfer bei der Validierung von Ausweisdokumenten unterstützen. Der Identity Proofing-Prozessor sollte nicht als automatisiertes Entscheidungstool verwendet werden, um festzustellen, ob ein Ausweis gültig ist. Durch die manuelle Überprüfung können Kunden eine höhere Genauigkeit bei der Dokumentenverarbeitung erzielen und Unternehmen bei der Bewertung von Vorhersagen helfen, indem sie speziell entwickelte Tools verwenden, die diese Überprüfungen ermöglichen.

Prüfen Sie die rechtlichen Vorgaben in der Region, in der Sie diese Technologie einsetzen, und informieren Sie sich über vorhandene Branchenrichtlinien, um mehr über Richtlinien und häufig auftretende Probleme im Zusammenhang mit Fairness zu erfahren. Hier finden Sie Informationen zur Fairness beim maschinellen Lernen, einschließlich Möglichkeiten, Verzerrungen in Trainingsdatensätzen zu reduzieren, Ihre benutzerdefinierten Modelle auf Leistungsunterschiede zu bewerten und andere Aspekte zu berücksichtigen, wenn Sie Ihr benutzerdefiniertes Modell verwenden.

Wir empfehlen unseren Kunden, bei der Implementierung der Identitätsüberprüfung Best Practices für Fairness, Interpretierbarkeit, Datenschutz und Sicherheit zu berücksichtigen. Weitere Informationen zur Implementierung von verantwortungsbewusster KI finden Sie in den Empfehlungen von Google für die verantwortungsbewusste Anwendung von KI.

Weitere Informationen zu Anwendungsfällen und ein Beispiel für ein Anwendungs-Code-Repository finden Sie im Blogpost Automate identity document processing with Document AI.

Weiter

Unterstützte Dateien

Prozessorliste

Text digitalisieren

Enterprise Document OCR (Optische Zeichenerkennung)

Vollständige Liste der Sprachen

Entitäten aus Dokumenten extrahieren

Benutzerdefinierter Extrahierer

Vollständige Liste der Sprachen

Vollständige Liste der normalisierten Datentypen

Formularparser

Vollständige Liste der Sprachen

Felder einblenden

Layoutparser

Vollständige Liste der Sprachen

Vortrainierte Prozessoren ansehen

Kontoauszugsparser

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

W2-Parser

Felder einblenden

Felder einblenden

Felder einblenden

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Parser für US-amerikanische Reisepässe

Vollständige Liste der Felder

Vollständige Liste der normalisierten Felder

Dienstprogrammparser

Vollständige Liste der Felder

Vollständige Liste der normalisierten Felder

Identity Document Proofing Parser

Felder einblenden

Felder einblenden

Vollständige Liste der Felder

Vollständige Liste der normalisierten Felder

Lohnabrechnungsparser

Felder einblenden

Felder einblenden

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

Parser für US-Führerschein

Vollständige Liste der Felder

Vollständige Liste der normalisierten Felder

Kostenparser

Vollständige Liste der Sprachen

Felder einblenden

Felder einblenden

Felder einblenden

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

Rechnungsparser

Vollständige Liste der Sprachen

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

Dokumente klassifizieren

Benutzerdefinierter Klassifikator

Benutzerdefinierter Splitter

Dokumente zusammenfassen

Summarizer

Fußnoten