Unterstützte Sprachen

Die Texterkennungsfunktion von Google Distributed Cloud (GDC) Air-Gapped erkennt eine Vielzahl von Sprachen und kann mehrere Sprachen in einem einzigen Bild erkennen.

Sie können in einer API-Anfrage zur optischen Zeichenerkennung (Optical Character Recognition, OCR) einen optionalen Sprachhinweis angeben. Das kann beispielsweise sinnvoll sein, wenn die API Schwierigkeiten hat, die Sprache in Ihrem Bild zu erkennen.

Wenn Sie optionale Sprachhinweise angeben möchten, fügen Sie sie Ihrer BatchAnnotateImages- oder BatchAnnotateFiles-Anfrage im Feld image_context als Liste von Werten im Feld language_hints hinzu.

Das language_hints-Format folgt den folgenden Formatierungsrichtlinien für BCP 47-Sprachtags:

language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]

Der Sprachhinweis en-t-i0-handwrit gibt beispielsweise an, dass die Sprache „Englisch, aus Handschrift umgewandelt“ ist.

Die Texterkennungsfunktion bietet drei Ebenen der Sprachunterstützung:

  1. Unterstützte Sprachen werden priorisiert und regelmäßig auf ihre Leistung hin überprüft.
  2. Experimentelle Sprachen werden aktiv entwickelt. Es gibt keine regelmäßigen Leistungsbeurteilungen.
  3. Zugeordnete Sprachen werden unterstützt, indem sie einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet werden. en-GB wird beispielsweise unterstützt, bei der Texterkennung jedoch nicht anders behandelt als en. Der OCR-Dienst versucht, den korrekten Code der zugeordneten Sprache im Feld entity zurückzugeben. Bei zugeordneten Sprachen ist es jedoch wahrscheinlicher, dass sie falsch identifiziert werden als bei vollständig oder experimentell unterstützten Sprachen.

Eine der wichtigsten Funktionen des OCR-Dienstes ist die Möglichkeit, Text in Bildern zu erkennen und zu extrahieren. Ein Bild kann beispielsweise handschriftlicher Text sein. Eine Liste der Handschrift-Scripts, die für die Handschrifterkennung unterstützt werden, finden Sie unter Handschrift-Scripts.

Unterstützte Sprachen

Die Texterkennungsfunktion priorisiert und bewertet regelmäßig unterstützte Sprachen. Wenn Sie nach Sprache filtern möchten, geben Sie eine Sprache in das folgende Feld ein:

Sprache Sprache (deutscher Name) Code für Sprachhinweise Skript und Notizen
Afrikaans Afrikaans af Latn
shqip Albanisch sq Latn
العربية Arabisch ar Modernes Hocharabisch
беларуская Belarussisch be Cyrl
български Bulgarisch bg Cyrl
Català Katalanisch ca Latn
普通话 Chinesisch zh Hans/Hant
Hrvatski Kroatisch hr Latn
Čeština Tschechisch cs Latn
Dansk Dänisch da Latn
Nederlands Niederländisch nl Latn
Englisch Englisch en Latn; Amerikanisch
Eesti keel Estnisch et Latn
Filipino Filipino fil oder tl Latn
Suomi Finnisch fi Latn
Français Französisch fr Latn; Europäisch
Deutsch Deutsch de Latn
Ελληνικά Griechisch el Grek
עברית Hebräisch iw Hebr
हिन्दी Hindi hi Deva
Magyar Ungarisch hu Latn
Íslenska Isländisch is Latn
Bahasa Indonesia Indonesisch id Latn
Italiano Italienisch it Latn
日本語 Japanisch ja Jpan
한국어 Koreanisch ko Kore
Latviešu Lettisch lv Latn
Lietuvių Litauisch lt Latn
Македонски Mazedonisch mk Cyrl
Bahasa Melayu Malaiisch ms Latn
മലയാളം Malayalam ml Mlym
मराठी Marathi mr Deva
नेपाली Nepalesisch ne Deva
Norsk Norwegisch no Latn; Bokmål
فارسی Persisch fa Arab
Polski Polnisch pl Latn
Português Portugiesisch pt Latn; Brazilian
Română Rumänisch ro Latn
Русский Russisch ru Cyrl
Русский (старая орфография) Russisch ru-PETR1708 Cyrl: Alte Orthografie
Српски Serbisch sr Cyrl & Latn
Српски (латиница) Serbisch sr-Latn Latn
Slovenčina Slowakisch sk Latn
Slovenščina Slowenisch sl Latn
Español Spanisch es Latn; Europäisch
Svenska Schwedisch sv Latn
Tagalog Tagalog tl Latn
Türkçe Türkisch tr Latn
Українська Ukrainisch uk Cyrl
Tiếng Việt Vietnamesisch vi Latn
Jiddisch Jiddisch yi Hebr

Experimentelle Sprachen

Experimentelle Sprachen befinden sich in der Entwicklungsphase und werden nicht ausgewertet. Wenn Sie nach Sprache filtern möchten, geben Sie eine Sprache in das folgende Feld ein:

Sprache Sprache (deutscher Name) Code für Sprachhinweise Skript und Notizen
Αρχαία ελληνικά Altgriechisch grc Grek
Azərbaycan Aserbaidschanisch az Latn
Azərbaycan (qədim yazı) Aserbaidschanisch az-Cyrl Cyrl: alte Orthografie
Euskara Baskisch eu Latn
Bosanski Bosnisch bs Latn
Cebuano Cebuano ceb Latn
Esperanto Esperanto eo Latn
Galego Galizisch gl Latn
ქართული Georgisch ka Geor
Kreyòl Ayisyen Haitianisch ht Latn
Gaeilge Irisch ga Latn
Jawa Javanisch jv Latn
Қазақ Kasachisch kk Cyrl
Kirgisisch Kirgisisch ky Cyrl
Latine Latein la Latn
Malti Maltesisch mt Latn
Монгол Mongolisch mn Cyrl
پښتو Paschtu ps Arab
संस्कृतम् Sanskrit sa Deva
Swahili Swahili sw Latn
اردو Urdu ur Arab
oʻzbekcha Usbekisch uz Latn; Latin
oʻzbekcha Usbekisch uz-Cyrl Cyrl: alte Orthografie
Cymraeg Walisisch cy Latn
IsiZulu Zulu zu Latn

Zugeordnete Sprachen

Zugeordnete Sprachen sind einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet. Wenn Sie nach Sprache filtern möchten, geben Sie eine Sprache in das folgende Feld ein:

Sprache Sprache (deutscher Name) Code für Sprachhinweise Skript und Notizen Zugeordnet zu
بهسا اچيه Achinesisch ace Latn Lateinisches Skriptmodell
Lwo Acholi ach Latn Lateinisches Skriptmodell
Dangme Adangme ada Latn Lateinisches Skriptmodell
Akan Akan ak Latn Lateinisches Skriptmodell
Anicinâbemowin Algonquinian alg Latn Lateinisches Skriptmodell
Mapudungu Araucanian/Mapuche arn Latn Lateinisches Skriptmodell
Asturianu Asturisch ast Latn Lateinisches Skriptmodell
Dene Athapaskisch ath Latn Lateinisches Skriptmodell
Aymar aru Aymara ay Latn Lateinisches Skriptmodell
Bhāṣa Bali Balinesisch ban Latn Lateinisches Skriptmodell
Bamanankan Bambara bm Latn Lateinisches Skriptmodell
Enges Bantu Bantu bnt Latn Lateinisches Skriptmodell
башҡорт теле Baschkirisch ba Cyrl Kyrillisches Skriptmodell
Toba–Batak Batak btk Latn Lateinisches Skriptmodell
Chibemba Bemba bem Latn Lateinisches Skriptmodell
Bikol Naga Bikol bik Latn Lateinisches Skriptmodell
Bichelamar Bislama bi Latn Lateinisches Skriptmodell
Brezhoneg Bretonisch br Latn Lateinisches Skriptmodell
нохчийн мотт/noxçiyn mott Tschetschenisch ce Cyrl Kyrillisches Skriptmodell
汉语 Chinesisch zh-Hans Hans; Vereinfacht; Mandarin zh
漢語 Chinesisch zh-Hant Hant; Traditionell; Mandarin zh
普通話 Chinesisch zh-Hant-HK Hant; Mandarin; Hongkong zh
Chahta' Choctaw cho Latn Lateinisches Skriptmodell
Чӑвашла Tschuwaschisch cv Cyrl Kyrillisches Skriptmodell
Cree–Montagnais–Naskapi Cree cr Latn Lateinisches Skriptmodell
Mvskoke Muskogee mus Latn Lateinisches Skriptmodell
qırımtatar tili, къырымтатар тили Krimtatarisch crh Latn Kyrillisches Skriptmodell
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Lateinisches Skriptmodell
Douala Duala dua Latn Lateinisches Skriptmodell
Ikɔ Efik Efik efi Latn Lateinisches Skriptmodell
Englisch (Britisch) Englisch en-GB Latn; Britisch en
Èʋegbe Ewe ee Latn Lateinisches Skriptmodell
føroyskt mál Färöisch fo Latn Lateinisches Skriptmodell
Na Vosa Vakaviti Fidschianisch fj Latn Lateinisches Skriptmodell
fɔ̀ngbè Fon fon Latn Lateinisches Skriptmodell
Français canadien Französisch fr-CA Latn; Kanadisch fr
Fulani, Fulah, Peul Fulfulde ff Latn Lateinisches Skriptmodell
Ga gaa Latn Lateinisches Skriptmodell
Luganda Ganda lg Latn Lateinisches Skriptmodell
Basa Gayo Gayo gay Latn Lateinisches Skriptmodell
Kiribati Kiribatisch gil Latn Lateinisches Skriptmodell
Gotisch Gotisch got Latn Lateinisches Skriptmodell
Guaraní Guarani gn Latn Lateinisches Skriptmodell
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hausa ha Latn Lateinisches Skriptmodell
ʻŌlelo Hawaiʻi Hawaiisch haw Latn Lateinisches Skriptmodell
Otjiherero Herero hz Latn Lateinisches Skriptmodell
Ilonggo Hiligaynon hil Latn Lateinisches Skriptmodell
Jaku Iban Iban iba Latn Lateinisches Skriptmodell
Asụsụ Igbo Igbo ig Latn Lateinisches Skriptmodell
Ilokano Ilokano ilo Latn Lateinisches Skriptmodell
Taqbaylit Kabylisch kab Latn Lateinisches Skriptmodell
Jingpho Kachin kac Latn Lateinisches Skriptmodell
Kalaallisut Kalaallisut kl Latn Lateinisches Skriptmodell
Kikamba Kikamba kam Latn Lateinisches Skriptmodell
Kanuri Kanuri kr Latn Lateinisches Skriptmodell
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak kaa Cyrl/Latn Kyrillisches Skriptmodell
Ka Ktien Khasi Khasi kha Latn Lateinisches Skriptmodell
Gĩkũyũ Kikuyu ki Latn Lateinisches Skriptmodell
Kinyarwanda Kinyarwanda rw Latn Lateinisches Skriptmodell
коми кыв Komi kv Cyrl Kyrillisches Skriptmodell
Kikongo Kongo kg Latn Lateinisches Skriptmodell
Kosraeanisch Kosraeanisch kos Latn Lateinisches Skriptmodell
Oshikwanyama Kuanyama kj Latn Lateinisches Skriptmodell
Ngala Lingala ln Latn Lateinisches Skriptmodell
Plattdütsch, Plattdeutsch, Nedersaksisch Plattdeutsch nds Latn Lateinisches Skriptmodell
siLozi Lozi loz Latn Lateinisches Skriptmodell
Kiluba Luba-Katanga lu Latn Lateinisches Skriptmodell
Dholuo Luo luo Latn Lateinisches Skriptmodell
Madhura, Basa Mathura, بَهاسَ مَدورا Madura mad Latn Lateinisches Skriptmodell
Malagasy Malagasy mg Latn Lateinisches Skriptmodell
Mandinka, لغة مندنكا Mandingo man Latn Lateinisches Skriptmodell
Gaelg, Gailck Manx gv Latn Lateinisches Skriptmodell
Te reo Māori Maori mi Latn Lateinisches Skriptmodell
Ebon Marshallesisch mh Latn Lateinisches Skriptmodell
Mɛnde yia Mende men Latn Lateinisches Skriptmodell
Mittelenglisch Mittelenglisch enm Latn Lateinisches Skriptmodell
Mittelhochdeutsch Mittelhochdeutsch gmh Latn Lateinisches Skriptmodell
Baso Minangkabau, باسو مينڠكاباو Minangkabauisch min Latn Lateinisches Skriptmodell
Kanienʼkéha Mohawk moh Latn Lateinisches Skriptmodell
Nkundu Mongo lol Latn Lateinisches Skriptmodell
Nāhuatl Nahuatl nah Latn Lateinisches Skriptmodell
Diné bizaad Navajo nv Latn Lateinisches Skriptmodell
Ndonga Ndonga ng Latn Lateinisches Skriptmodell
ko e vagahau Niuē Niueanisch niu Latn Lateinisches Skriptmodell
Zimbabwe Ndebele Nord-Ndebele nd Latn Lateinisches Skriptmodell
Sesotho sa Leboa Nord-Sotho nso Latn Lateinisches Skriptmodell
Chichewa, Chinyanja Chichewa ny Latn Lateinisches Skriptmodell
Runyankore Nyankole nyn Latn Lateinisches Skriptmodell
Chitonga Nyasa Tonga tog Latn Lateinisches Skriptmodell
Appolo Nzima nzi Latn Lateinisches Skriptmodell
Occitan, lenga d'òc, provençal Okzitanisch oc Latn Lateinisches Skriptmodell
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Lateinisches Skriptmodell
Ænglisc, Englisc, Anglisc Altenglisch ang Latn Lateinisches Skriptmodell
Franceis, François, Romanz Altfranzösisch fro Latn Lateinisches Skriptmodell
Diutisk, Althochdeutsch Althochdeutsch goh Latn Lateinisches Skriptmodell
Dǫnsk tunga Altnordisch non Latn Lateinisches Skriptmodell
Occitan ancian Altprovenzalisch pro Latn Lateinisches Skriptmodell
ирон ӕвзаг Ossetisch os Cyrl Kyrillisches Skriptmodell
Kapampangan Pampanga pam Latn Lateinisches Skriptmodell
Salitan Pangasinan Pangasinensisch pag Latn Lateinisches Skriptmodell
Papiamentu Papiamento pap Latn Lateinisches Skriptmodell
Português (Portugal) Portugiesisch pt-PT Latn; Europäisch pt
Kechua/Runa Simi Quechua qu Latn Lateinisches Skriptmodell
Rumantsch Rätoromanisch rm Latn Lateinisches Skriptmodell
Romani čhib Romani rom Latn Lateinisches Skriptmodell
Ikirundi Kirundi rn Latn Lateinisches Skriptmodell
Jakutisch Jakutisch sah Cyrl Kyrillisches Skriptmodell
Gagana faʻa Sāmoa Samoanisch sm Latn Lateinisches Skriptmodell
yângâ tî sängö Sango sg Latn Lateinisches Skriptmodell
(Braid) Scots, Lallans, Doric Schottisch sco Latn Lateinisches Skriptmodell
Gàidhlig Schottisch-Gälisch gd Latn Lateinisches Skriptmodell
chiShona Shona sn Latn Lateinisches Skriptmodell
Songhay Songhai son Latn Lateinisches Skriptmodell
Sesotho Süd-Sotho st Latn Lateinisches Skriptmodell
Español (Latinoamérica) Spanisch es-419 Latn; Lateinamerikanisch es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanesisch su Latn Lateinisches Skriptmodell
siSwati Siswati ss Latn Lateinisches Skriptmodell
Reo Tahiti Tahitianisch ty Latn Lateinisches Skriptmodell
тоҷикӣ Tadschikisch tg Cyrl Kyrillisches Skriptmodell
татар теле Tatarisch tt Cyrl/Latn Kyrillisches Skriptmodell
KʌThemnɛ Temne tem Latn Lateinisches Skriptmodell
lea faka-Tonga Tongaisch to Latn Lateinisches Skriptmodell
Xitsonga Tsonga ts Latn Lateinisches Skriptmodell
Setswana Setswana tn Latn Lateinisches Skriptmodell
Türkmençe Turkmenisch tk Latn Kyrillisches Skriptmodell
удмурт кыл Udmurtisch udm Cyrl Kyrillisches Skriptmodell
Tshivenḓa Venda ve Latn Lateinisches Skriptmodell
Vod Wotisch vot Cyrl/Latn Kyrillisches Skriptmodell
Frysk Westfriesisch fy Latn Lateinisches Skriptmodell
Wolof Wolof wo Latn Lateinisches Skriptmodell
isiXhosa Xhosa xh Latn Lateinisches Skriptmodell
Èdè Yorùbá Yoruba yo Latn Lateinisches Skriptmodell
Diidxazá Zapotec zap Latn Lateinisches Skriptmodell

Handschrift-Skripts

Dieser Abschnitt enthält die Scripts, die für die Handschrifterkennung unterstützt werden. In den Tabellen für unterstützte, experimentelle und zugeordnete Sprachen finden Sie Informationen dazu, welche Sprachen das jeweilige Script verwenden. Wenn Sie nach einem Skript filtern möchten, geben Sie ein Skript in das folgende Feld ein:

Script-Tag Name Supportstufe
Beng Bengalisch Experimentell
Cyrl Kyrillisch Experimentell
Deva Dewanagari Experimentell
Grek Griechisch Experimentell
Hani Chinesisch Experimentell
Jpan Japanisch Unterstützt
Kore Koreanisch Unterstützt
Latn Latein Unterstützt
vi Vietnamesisch Experimentell