Der Formularparser extrahiert Schlüssel/Wert-Paare, Tabellen, Auswahlmarkierungen (Kästchen) und generische Felder, um die Extraktion zu ergänzen und zu automatisieren. Es kann standardmäßig bis zu 11 generische Entitäten und Kästchen extrahieren. Sie geben die Felder (Schema) nicht an, die Sie mit dem Formularparser extrahieren möchten. Das Modell erkennt und gibt Entitäten von Interesse auf jeder Seite der Dokumente zurück.
Benutzerdefinierter Extrahierer
Der benutzerdefinierte Extractor extrahiert Entitäten, die Sie im Schema definieren, und bietet drei Modellierungsoptionen: auf Basis des Basismodells, des benutzerdefinierten Modells und der benutzerdefinierten Vorlage. Angesichts der vielversprechenden Ergebnisse von Fundamentmodellen mit wenig bis gar keinen Trainingsdaten empfehlen wir, als Erstes mit dem Fundamentmodell zu beginnen und bei Bedarf andere Optionen auszuprobieren.
Die Grundlagenmodelle führen eine Vorhersage mit Null- bis wenigen Beispielen durch, basierend auf bis zu fünf gekennzeichneten Dokumenten im Dataset, und eine optimierte Vorhersage mit mehr als zehn gekennzeichneten Dokumenten im Dataset.
Trainingsmethode
Dokumentbeispiele
Abweichungen beim Dokumentlayout
Freitext oder Absätze
Anzahl der Trainingsdokumente für die produktionsreife Qualität, je nach Variabilität
Ähnliche Formulare mit unterschiedlichem Layout über Jahre oder Anbieter hinweg (z. B. W9)
Niedrig bis mittel.
Niedrig.
Hoch: 10–100 Dokumente oder mehr
Vorlage.
Steuerformulare mit einem festen Layout (z. B. Formulare 941 und 709)
Keine.
Niedrig.
Niedrig (3 Dokumente)
Da für Basismodelle in der Regel weniger Trainingsdokumente erforderlich sind, werden sie als erste Option für alle variablen Layouts empfohlen.
Layout-Parser
Der Layout-Parser wandelt Dokumente in verschiedenen Formaten in strukturierte Darstellungen um, macht Inhalte wie Absätze, Tabellen, Listen und strukturelle Elemente wie Überschriften, Seitenüberschriften und Fußzeilen zugänglich und erstellt kontextsensitive Blöcke, die das Abrufen von Informationen in einer Reihe von Anwendungen für generative KI und Discovery erleichtern.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-08-18 (UTC)."],[[["\u003cp\u003eDocument AI offers tools like Form Parser, Custom extractor, and Layout Parser for extracting information from documents based on various use cases.\u003c/p\u003e\n"],["\u003cp\u003eForm Parser automatically extracts key-value pairs, tables, selection marks, and up to 11 generic entities without needing a predefined schema.\u003c/p\u003e\n"],["\u003cp\u003eThe Custom extractor allows users to define their extraction schema and offers three modeling options: foundation model, custom model-based, and custom template-based.\u003c/p\u003e\n"],["\u003cp\u003eFoundation models in Custom extractors are recommended as the first option due to their ability to perform with minimal training data.\u003c/p\u003e\n"],["\u003cp\u003eLayout Parser transforms documents into structured data, identifying elements such as paragraphs, tables, lists, headings, and headers/footers, for use in information retrieval and generative AI applications.\u003c/p\u003e\n"]]],[],null,["# Extraction overview\n===================\n\nDocument AI offers multiple products to extract information from documents\nfor different use cases:\n\n- [Form Parser](#form-parser)\n- Custom extractor, which offers three different modeling types:\n\n - Foundation model\n - Custom model based\n - Custom template based\n- [Layout Parser](#layout-parser)\n\nForm Parser\n-----------\n\nForm Parser extracts key-value pairs (KVP), tables, selection marks (checkboxes),\nand generic fields to augment and automate extraction. It can extract up to 11\ngeneric entities and checkboxes out of the box. You don't specify the fields (schema),\nyou want to extract with the Form Parser. The model detects and returns entities\nof interest from each page of documents.\n\nCustom extractor\n----------------\n\nThe custom extractor extracts entities you define in schema and offers three modeling options:\nfoundation model, custom model based, and custom template based. Given promising\nresults from foundation models with little to no training data, we recommend starting\nwith the foundation model as the first option and try out other options as needed.\nThe foundation models do zero- to few-shot prediction, based on up to 5 labeled\ndocuments in the dataset, and fine-tuned prediction with more than 10 labeled documents in the dataset.\n\nBecause foundation models typically require fewer training documents, they're\nrecommended as the first option for all variable layouts.\n\nLayout Parser\n-------------\n\n| **Note:** Layout Parser is in Public preview\n\nLayout Parser transforms documents in various formats into structured\nrepresentations, making content like paragraphs, tables, lists, and structural\nelements like headings, page headers, and footers accessible, and creating\ncontext-aware chunks that facilitate information retrieval in a range of\ngenerative AI and discovery apps."]]