Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Die folgenden Produkte haben Funktionen mit Document AI gemeinsam. Diese Produkte führen jedoch eine bestimmte Text- und Analysefunktion aus. Je nach Anwendungsfall bieten diese Produkte möglicherweise die benötigten Funktionen.
Bilder in Text umwandeln
Sie haben zwei Möglichkeiten, Inhalte in Bildern in Text zu konvertieren:
Wenn Sie Dokumente als Nur-Text-Dokumente verwenden und vorher die Texterkennung ausführen, können Sie Dokumente mit den folgenden Produkten kategorisieren und labeln:
Mit der vortrainierten Natural Language API können Sie Inhalte anhand einer allgemeinen Liste von Kategorien klassifizieren.
Mit AutoML Natural Language Classification können Sie ein benutzerdefiniertes Modell für maschinelles Lernen erstellen und Inhalte mit Ihren eigenen Kategorielabels klassifizieren.
Es kann zwar Ausnahmen geben, aber die AutoML Vision-Klassifizierung wird im Allgemeinen nicht für die Dokumentklassifizierung empfohlen, da sie in der Regel weniger genau ist als textbasierte Methoden. Sie können es jedoch zum Klassifizieren von Bildinhalten verwenden.
Diese Methode wird im Allgemeinen nicht für die Klassifizierung von Dokumenten empfohlen, da ihre Genauigkeit in der Regel geringer ist als bei textbasierten Methoden. Es kann jedoch Ausnahmen geben.
Mit Form Parser oder einem der vortrainierten Prozessoren für Ihren Anwendungsfall können Sie bekannte Entitäten in Dokumenten (Eigennamen wie Personen des öffentlichen Lebens, Unternehmensmarken usw.) und Entitäten, die gängigen Mustern folgen, z. B. Telefonnummern und Adressen, identifizieren.
Sie können die Natural Language API auch verwenden, um gängige, öffentliche Entitäten zu identifizieren.
AutoML Natural Language-Produkte sind für die Entitätsextraktion vorgesehen. Sie können damit ein benutzerdefiniertes Modell für maschinelles Lernen erstellen, um Entitäten zu identifizieren, die für Ihr Unternehmen oder Ihren Anwendungsfall spezifisch sind.
Integrieren Sie diese ergänzenden Produkte in Document AI, um eine umfassende Lösung für die Dokumentverarbeitung und -analyse zu erstellen.
Vertex AI: Hier werden AutoML und AI Platform in einer einheitlichen API, Clientbibliothek und Plattform zusammengeführt.
Cloud Translation API: Übersetzt Text dynamisch zwischen Tausenden von Sprachpaaren mithilfe vortrainierter Modelle. Bietet eine Document Translation API, mit der Sie Dokumente in Formaten wie PDF und DOCX direkt übersetzen können. Weitere Informationen finden Sie unter Dokumente übersetzen.
Workflows: Kombiniert Google Cloud Dienste und APIs, um zuverlässige Anwendungen, Prozessautomatisierung sowie Daten- und ML-Pipelines zu erstellen.
AppSheet Automation: Erstellt benutzerdefinierte Automatisierungen und Anwendungen mit einer offenen Cloud.
Drive Scanner von Google Drive: Mit der Google Drive App für Android können Sie Dokumente scannen und in Google Drive hochladen. Außerdem erhalten Sie intelligente Titelvorschläge, die auf Document AI basieren.
Google Übersetzer: Mit diesem Dienst können Sie Wörter, Sätze und Webseiten sofort in über 100 Sprachen übersetzen.
Partner finden
Nutzen Sie unser wachsendes Partnernetzwerk, um Ihre Lösung für die Dokumentanalyse zu erstellen und zu verwalten. Eine Liste der Partner und der von ihnen angebotenen Dienste finden Sie unter Document AI-Partner.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-08-18 (UTC)."],[[["\u003cp\u003eDocument AI shares capabilities with other products that perform specific text and analysis functions, which might be more suitable depending on the use case.\u003c/p\u003e\n"],["\u003cp\u003eImages can be converted to text using Enterprise Document OCR or Cloud Vision API's text detection features, including handwriting and PDF/TIFF document text.\u003c/p\u003e\n"],["\u003cp\u003eDocuments can be classified by utilizing pretrained Natural Language API or custom AutoML Natural Language classification, but image classification methods are generally less accurate for documents.\u003c/p\u003e\n"],["\u003cp\u003eEntities, including common and custom-specific ones, can be identified within documents using Form Parser, pretrained processors, Natural Language API, or AutoML Natural Language entity extraction.\u003c/p\u003e\n"],["\u003cp\u003eSeveral complementary products, such as Vertex AI, Cloud Translation API, and Workflows, can integrate with Document AI to provide a comprehensive document processing and analysis solution.\u003c/p\u003e\n"]]],[],null,["# Related Google Cloud products\n\nThe following products share capabilities with Document AI. However,\nthese products perform a specific text and analysis function. Depending on your\nuse case, these products might provide the specific capabilities you need.\n\nConvert images to text\n----------------------\n\nYou can convert content in images to text using either:\n\n- [Enterprise Document OCR](/document-ai/docs/processors-list#processor_doc-ocr).\n- [Cloud Vision API](/vision) (using the `TEXT_DETECTION` or `DOCUMENT_TEXT_DETECTION` enums). See:\n\n - [Cloud Vision API Quickstarts](/vision/docs/quickstarts)\n\n - [Detect text (OCR)](/vision/docs/ocr)\n\n - [Detect handwriting (OCR)](/vision/docs/handwriting)\n\n - [PDF/TIFF Document text detection](/vision/docs/pdf)\n\nDetect visual artifacts\n-----------------------\n\nYou can use [AutoML Vision object detection](/vertex-ai/docs/training-overview#object_detection_for_images) to\nconvert sections of images into text documents. For details, see [Image data](/vertex-ai/docs/start/automl-model-types#image).\n\nClassify documents\n------------------\n\nWith document plain text and running OCR beforehand, you can categorize and label\ndocuments using the following products:\n\n- The pretrained Natural Language API helps you classify content using a generalized list of categories.\n- Use AutoML Natural Language classification to create a custom machine learning model, and classify content with your own category labels.\n- While there may be exceptions, AutoML Vision classification is not\n generally recommended for document classification because its tends to be less\n accurate than text-based methods. However, you can use it for classifying image content.\n\n - This is not generally a recommended method for classification of documents, as its accuracy tends to be less than text based methods, but there may be exceptions\n\nAnalyze and extract entities\n----------------------------\n\nYou can identify known entities in documents (proper nouns such as public\nfigures, company branding, and so on) and entities that follow common patterns\nsuch as phone numbers and addresses with using\n[Form Parser](/document-ai/docs/processors-list#processor_form-parser) or any of the\n[pretrained processors](/document-ai/docs/processor-overview) for your use case.\n\n- You can also use the Natural Language API to identify common, public entities.\n- AutoML Natural Language products are for entity extraction. Use them to create a custom machine learning model to identify entities specific to your company or use case.\n\nOther products\n--------------\n\nIntegrate these complimentary products with Document AI to create a\ncomplete document processing and analysis solution.\n\n- [Vertex AI](/vertex-ai): Brings AutoML and AI Platform together into a unified API, client library, and platform.\n- [Cloud Translation API](/translate/docs): Dynamically translates text between thousands of language pairs through pretrained models. Provides a document translation API for directly translating documents in formats such as PDF and DOCX. See [Translate documents](/translate/docs/advanced/translate-documents).\n- [Workflows](/workflows): Combines Google Cloud services and APIs to build reliable applications, process automation, and data and machine learning pipelines.\n- [AppSheet Automation](/appsheet/automation): Creates custom automations and applications with an open cloud.\n- [Drive scanner by Google Drive](https://support.google.com/drive/answer/3145835?&co=GENIE.Platform%3DAndroid): The Google Drive Android app lets you scan and upload documents to Google Drive and offers intelligent title suggestions powered by Document AI.\n- [Google Translate](https://translate.google.com/): This service instantly translates words, phrases, and web pages between English and over 100 other languages.\n\nFind a partner\n--------------\n\nTake advantage of our growing partner ecosystem to help you create and manage\nyour document analysis solution. For a list of partners and the\nservices that they provide, see\n[Document AI partners](https://cloud.google.com/find-a-partner/).\n\nWhat's next?\n------------\n\n- Learn how to [set up](/document-ai/docs/setup) Document AI.\n- Find specific guides in [How-to](/document-ai/docs/how-to)."]]