Text in Bildern erkennen

Optische Zeichenerkennung (Optical Character Recognition, OCR)

Mithilfe der Vision API können Sie Text in Bildern erkennen und extrahieren. Es gibt zwei Features für Annotationen, die die optische Zeichenerkennung unterstützen:

  • TEXT_DETECTION erkennt und extrahiert Text aus beliebigen Bildern. Nehmen wir als Beispiel ein Foto von einem Straßenschild oder Verkehrszeichen. Die JSON-Datei enthält den gesamten extrahierten String sowie einzelne Wörter und deren Begrenzungsrahmen.

    Bild eines Verkehrsschilds

  • DOCUMENT_TEXT_DETECTION extrahiert zusätzlich Text aus einem Bild, wobei die Antwort für Fließtext und Dokumente optimiert ist. Die JSON-Datei enthält Informationen zu Seite, Block, Absatz, Wort und Worttrennung.

    Bild mit Fließtext und Anmerkungen

    Weitere Informationen zur DOCUMENT_TEXT_DETECTION erhalten Sie unter Handschrift (OCR) erkennen und Texterkennung in PDF/TIFF-Dokumenten.

Texterkennungsanfragen

Google Cloud -Projekt und Authentifizierung einrichten