Die Texterkennungsfunktion von Google Distributed Cloud (GDC) Air-Gapped erkennt eine Vielzahl von Sprachen und kann mehrere Sprachen in einem einzigen Bild erkennen.
Sie können in einer API-Anfrage zur optischen Zeichenerkennung (Optical Character Recognition, OCR) einen optionalen Sprachhinweis angeben. Das kann beispielsweise sinnvoll sein, wenn die API Schwierigkeiten hat, die Sprache in Ihrem Bild zu erkennen.
Wenn Sie optionale Sprachhinweise angeben möchten, fügen Sie sie Ihrer BatchAnnotateImages
- oder BatchAnnotateFiles
-Anfrage im Feld image_context
als Liste von Werten im Feld language_hints
hinzu.
Das language_hints
-Format folgt den folgenden Formatierungsrichtlinien für BCP 47
-Sprachtags:
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
Der Sprachhinweis en-t-i0-handwrit
gibt beispielsweise an, dass die Sprache „Englisch, aus Handschrift umgewandelt“ ist.
Die Texterkennungsfunktion bietet drei Ebenen der Sprachunterstützung:
- Unterstützte Sprachen werden priorisiert und regelmäßig auf ihre Leistung hin überprüft.
- Experimentelle Sprachen werden aktiv entwickelt. Es gibt keine regelmäßigen Leistungsbeurteilungen.
- Zugeordnete Sprachen werden unterstützt, indem sie einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet werden.
en-GB
wird beispielsweise unterstützt, bei der Texterkennung jedoch nicht anders behandelt alsen
. Der OCR-Dienst versucht, den korrekten Code der zugeordneten Sprache im Feldentity
zurückzugeben. Bei zugeordneten Sprachen ist es jedoch wahrscheinlicher, dass sie falsch identifiziert werden als bei vollständig oder experimentell unterstützten Sprachen.
Eine der wichtigsten Funktionen des OCR-Dienstes ist die Möglichkeit, Text in Bildern zu erkennen und zu extrahieren. Ein Bild kann beispielsweise handschriftlicher Text sein. Eine Liste der Handschrift-Scripts, die für die Handschrifterkennung unterstützt werden, finden Sie unter Handschrift-Scripts.
Unterstützte Sprachen
Die Texterkennungsfunktion priorisiert und bewertet regelmäßig unterstützte Sprachen. Wenn Sie nach Sprache filtern möchten, geben Sie eine Sprache in das folgende Feld ein:
Sprache | Sprache (deutscher Name) | Code für Sprachhinweise | Skript und Notizen |
---|---|---|---|
Afrikaans | Afrikaans | af |
Latn |
shqip | Albanisch | sq |
Latn |
العربية | Arabisch | ar |
Modernes Hocharabisch |
беларуская | Belarussisch | be |
Cyrl |
български | Bulgarisch | bg |
Cyrl |
Català | Katalanisch | ca |
Latn |
普通话 | Chinesisch | zh |
Hans/Hant |
Hrvatski | Kroatisch | hr |
Latn |
Čeština | Tschechisch | cs |
Latn |
Dansk | Dänisch | da |
Latn |
Nederlands | Niederländisch | nl |
Latn |
Englisch | Englisch | en |
Latn; Amerikanisch |
Eesti keel | Estnisch | et |
Latn |
Filipino | Filipino | fil oder tl |
Latn |
Suomi | Finnisch | fi |
Latn |
Français | Französisch | fr |
Latn; Europäisch |
Deutsch | Deutsch | de |
Latn |
Ελληνικά | Griechisch | el |
Grek |
עברית | Hebräisch | iw |
Hebr |
हिन्दी | Hindi | hi |
Deva |
Magyar | Ungarisch | hu |
Latn |
Íslenska | Isländisch | is |
Latn |
Bahasa Indonesia | Indonesisch | id |
Latn |
Italiano | Italienisch | it |
Latn |
日本語 | Japanisch | ja |
Jpan |
한국어 | Koreanisch | ko |
Kore |
Latviešu | Lettisch | lv |
Latn |
Lietuvių | Litauisch | lt |
Latn |
Македонски | Mazedonisch | mk |
Cyrl |
Bahasa Melayu | Malaiisch | ms |
Latn |
മലയാളം | Malayalam | ml |
Mlym |
मराठी | Marathi | mr |
Deva |
नेपाली | Nepalesisch | ne |
Deva |
Norsk | Norwegisch | no |
Latn; Bokmål |
فارسی | Persisch | fa |
Arab |
Polski | Polnisch | pl |
Latn |
Português | Portugiesisch | pt |
Latn; Brazilian |
Română | Rumänisch | ro |
Latn |
Русский | Russisch | ru |
Cyrl |
Русский (старая орфография) | Russisch | ru-PETR1708 |
Cyrl: Alte Orthografie |
Српски | Serbisch | sr |
Cyrl & Latn |
Српски (латиница) | Serbisch | sr-Latn |
Latn |
Slovenčina | Slowakisch | sk |
Latn |
Slovenščina | Slowenisch | sl |
Latn |
Español | Spanisch | es |
Latn; Europäisch |
Svenska | Schwedisch | sv |
Latn |
Tagalog | Tagalog | tl |
Latn |
Türkçe | Türkisch | tr |
Latn |
Українська | Ukrainisch | uk |
Cyrl |
Tiếng Việt | Vietnamesisch | vi |
Latn |
Jiddisch | Jiddisch | yi |
Hebr |
Experimentelle Sprachen
Experimentelle Sprachen befinden sich in der Entwicklungsphase und werden nicht ausgewertet. Wenn Sie nach Sprache filtern möchten, geben Sie eine Sprache in das folgende Feld ein:
Sprache | Sprache (deutscher Name) | Code für Sprachhinweise | Skript und Notizen |
---|---|---|---|
Αρχαία ελληνικά | Altgriechisch | grc |
Grek |
Azərbaycan | Aserbaidschanisch | az |
Latn |
Azərbaycan (qədim yazı) | Aserbaidschanisch | az-Cyrl |
Cyrl: alte Orthografie |
Euskara | Baskisch | eu |
Latn |
Bosanski | Bosnisch | bs |
Latn |
Cebuano | Cebuano | ceb |
Latn |
Esperanto | Esperanto | eo |
Latn |
Galego | Galizisch | gl |
Latn |
ქართული | Georgisch | ka |
Geor |
Kreyòl Ayisyen | Haitianisch | ht |
Latn |
Gaeilge | Irisch | ga |
Latn |
Jawa | Javanisch | jv |
Latn |
Қазақ | Kasachisch | kk |
Cyrl |
Kirgisisch | Kirgisisch | ky |
Cyrl |
Latine | Latein | la |
Latn |
Malti | Maltesisch | mt |
Latn |
Монгол | Mongolisch | mn |
Cyrl |
پښتو | Paschtu | ps |
Arab |
संस्कृतम् | Sanskrit | sa |
Deva |
Swahili | Swahili | sw |
Latn |
اردو | Urdu | ur |
Arab |
oʻzbekcha | Usbekisch | uz |
Latn; Latin |
oʻzbekcha | Usbekisch | uz-Cyrl |
Cyrl: alte Orthografie |
Cymraeg | Walisisch | cy |
Latn |
IsiZulu | Zulu | zu |
Latn |
Zugeordnete Sprachen
Zugeordnete Sprachen sind einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet. Wenn Sie nach Sprache filtern möchten, geben Sie eine Sprache in das folgende Feld ein:
Sprache | Sprache (deutscher Name) | Code für Sprachhinweise | Skript und Notizen | Zugeordnet zu |
---|---|---|---|---|
بهسا اچيه | Achinesisch | ace |
Latn | Lateinisches Skriptmodell |
Lwo | Acholi | ach |
Latn | Lateinisches Skriptmodell |
Dangme | Adangme | ada |
Latn | Lateinisches Skriptmodell |
Akan | Akan | ak |
Latn | Lateinisches Skriptmodell |
Anicinâbemowin | Algonquinian | alg |
Latn | Lateinisches Skriptmodell |
Mapudungu | Araucanian/Mapuche | arn |
Latn | Lateinisches Skriptmodell |
Asturianu | Asturisch | ast |
Latn | Lateinisches Skriptmodell |
Dene | Athapaskisch | ath |
Latn | Lateinisches Skriptmodell |
Aymar aru | Aymara | ay |
Latn | Lateinisches Skriptmodell |
Bhāṣa Bali | Balinesisch | ban |
Latn | Lateinisches Skriptmodell |
Bamanankan | Bambara | bm |
Latn | Lateinisches Skriptmodell |
Enges Bantu | Bantu | bnt |
Latn | Lateinisches Skriptmodell |
башҡорт теле | Baschkirisch | ba |
Cyrl | Kyrillisches Skriptmodell |
Toba–Batak | Batak | btk |
Latn | Lateinisches Skriptmodell |
Chibemba | Bemba | bem |
Latn | Lateinisches Skriptmodell |
Bikol Naga | Bikol | bik |
Latn | Lateinisches Skriptmodell |
Bichelamar | Bislama | bi |
Latn | Lateinisches Skriptmodell |
Brezhoneg | Bretonisch | br |
Latn | Lateinisches Skriptmodell |
нохчийн мотт/noxçiyn mott | Tschetschenisch | ce |
Cyrl | Kyrillisches Skriptmodell |
汉语 | Chinesisch | zh-Hans |
Hans; Vereinfacht; Mandarin | zh |
漢語 | Chinesisch | zh-Hant |
Hant; Traditionell; Mandarin | zh |
普通話 | Chinesisch | zh-Hant-HK |
Hant; Mandarin; Hongkong | zh |
Chahta' | Choctaw | cho |
Latn | Lateinisches Skriptmodell |
Чӑвашла | Tschuwaschisch | cv |
Cyrl | Kyrillisches Skriptmodell |
Cree–Montagnais–Naskapi | Cree | cr |
Latn | Lateinisches Skriptmodell |
Mvskoke | Muskogee | mus |
Latn | Lateinisches Skriptmodell |
qırımtatar tili, къырымтатар тили | Krimtatarisch | crh |
Latn | Kyrillisches Skriptmodell |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak |
Latn | Lateinisches Skriptmodell |
Douala | Duala | dua |
Latn | Lateinisches Skriptmodell |
Ikɔ Efik | Efik | efi |
Latn | Lateinisches Skriptmodell |
Englisch (Britisch) | Englisch | en-GB |
Latn; Britisch | en |
Èʋegbe | Ewe | ee |
Latn | Lateinisches Skriptmodell |
føroyskt mál | Färöisch | fo |
Latn | Lateinisches Skriptmodell |
Na Vosa Vakaviti | Fidschianisch | fj |
Latn | Lateinisches Skriptmodell |
fɔ̀ngbè | Fon | fon |
Latn | Lateinisches Skriptmodell |
Français canadien | Französisch | fr-CA |
Latn; Kanadisch | fr |
Fulani, Fulah, Peul | Fulfulde | ff |
Latn | Lateinisches Skriptmodell |
Gã | Ga | gaa |
Latn | Lateinisches Skriptmodell |
Luganda | Ganda | lg |
Latn | Lateinisches Skriptmodell |
Basa Gayo | Gayo | gay |
Latn | Lateinisches Skriptmodell |
Kiribati | Kiribatisch | gil |
Latn | Lateinisches Skriptmodell |
Gotisch | Gotisch | got |
Latn | Lateinisches Skriptmodell |
Guaraní | Guarani | gn |
Latn | Lateinisches Skriptmodell |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Hausa | ha |
Latn | Lateinisches Skriptmodell |
ʻŌlelo Hawaiʻi | Hawaiisch | haw |
Latn | Lateinisches Skriptmodell |
Otjiherero | Herero | hz |
Latn | Lateinisches Skriptmodell |
Ilonggo | Hiligaynon | hil |
Latn | Lateinisches Skriptmodell |
Jaku Iban | Iban | iba |
Latn | Lateinisches Skriptmodell |
Asụsụ Igbo | Igbo | ig |
Latn | Lateinisches Skriptmodell |
Ilokano | Ilokano | ilo |
Latn | Lateinisches Skriptmodell |
Taqbaylit | Kabylisch | kab |
Latn | Lateinisches Skriptmodell |
Jingpho | Kachin | kac |
Latn | Lateinisches Skriptmodell |
Kalaallisut | Kalaallisut | kl |
Latn | Lateinisches Skriptmodell |
Kikamba | Kikamba | kam |
Latn | Lateinisches Skriptmodell |
Kanuri | Kanuri | kr |
Latn | Lateinisches Skriptmodell |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Kara-Kalpak | kaa |
Cyrl/Latn | Kyrillisches Skriptmodell |
Ka Ktien Khasi | Khasi | kha |
Latn | Lateinisches Skriptmodell |
Gĩkũyũ | Kikuyu | ki |
Latn | Lateinisches Skriptmodell |
Kinyarwanda | Kinyarwanda | rw |
Latn | Lateinisches Skriptmodell |
коми кыв | Komi | kv |
Cyrl | Kyrillisches Skriptmodell |
Kikongo | Kongo | kg |
Latn | Lateinisches Skriptmodell |
Kosraeanisch | Kosraeanisch | kos |
Latn | Lateinisches Skriptmodell |
Oshikwanyama | Kuanyama | kj |
Latn | Lateinisches Skriptmodell |
Ngala | Lingala | ln |
Latn | Lateinisches Skriptmodell |
Plattdütsch, Plattdeutsch, Nedersaksisch | Plattdeutsch | nds |
Latn | Lateinisches Skriptmodell |
siLozi | Lozi | loz |
Latn | Lateinisches Skriptmodell |
Kiluba | Luba-Katanga | lu |
Latn | Lateinisches Skriptmodell |
Dholuo | Luo | luo |
Latn | Lateinisches Skriptmodell |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madura | mad |
Latn | Lateinisches Skriptmodell |
Malagasy | Malagasy | mg |
Latn | Lateinisches Skriptmodell |
Mandinka, لغة مندنكا | Mandingo | man |
Latn | Lateinisches Skriptmodell |
Gaelg, Gailck | Manx | gv |
Latn | Lateinisches Skriptmodell |
Te reo Māori | Maori | mi |
Latn | Lateinisches Skriptmodell |
Ebon | Marshallesisch | mh |
Latn | Lateinisches Skriptmodell |
Mɛnde yia | Mende | men |
Latn | Lateinisches Skriptmodell |
Mittelenglisch | Mittelenglisch | enm |
Latn | Lateinisches Skriptmodell |
Mittelhochdeutsch | Mittelhochdeutsch | gmh |
Latn | Lateinisches Skriptmodell |
Baso Minangkabau, باسو مينڠكاباو | Minangkabauisch | min |
Latn | Lateinisches Skriptmodell |
Kanienʼkéha | Mohawk | moh |
Latn | Lateinisches Skriptmodell |
Nkundu | Mongo | lol |
Latn | Lateinisches Skriptmodell |
Nāhuatl | Nahuatl | nah |
Latn | Lateinisches Skriptmodell |
Diné bizaad | Navajo | nv |
Latn | Lateinisches Skriptmodell |
Ndonga | Ndonga | ng |
Latn | Lateinisches Skriptmodell |
ko e vagahau Niuē | Niueanisch | niu |
Latn | Lateinisches Skriptmodell |
Zimbabwe Ndebele | Nord-Ndebele | nd |
Latn | Lateinisches Skriptmodell |
Sesotho sa Leboa | Nord-Sotho | nso |
Latn | Lateinisches Skriptmodell |
Chichewa, Chinyanja | Chichewa | ny |
Latn | Lateinisches Skriptmodell |
Runyankore | Nyankole | nyn |
Latn | Lateinisches Skriptmodell |
Chitonga | Nyasa Tonga | tog |
Latn | Lateinisches Skriptmodell |
Appolo | Nzima | nzi |
Latn | Lateinisches Skriptmodell |
Occitan, lenga d'òc, provençal | Okzitanisch | oc |
Latn | Lateinisches Skriptmodell |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj |
Latn | Lateinisches Skriptmodell |
Ænglisc, Englisc, Anglisc | Altenglisch | ang |
Latn | Lateinisches Skriptmodell |
Franceis, François, Romanz | Altfranzösisch | fro |
Latn | Lateinisches Skriptmodell |
Diutisk, Althochdeutsch | Althochdeutsch | goh |
Latn | Lateinisches Skriptmodell |
Dǫnsk tunga | Altnordisch | non |
Latn | Lateinisches Skriptmodell |
Occitan ancian | Altprovenzalisch | pro |
Latn | Lateinisches Skriptmodell |
ирон ӕвзаг | Ossetisch | os |
Cyrl | Kyrillisches Skriptmodell |
Kapampangan | Pampanga | pam |
Latn | Lateinisches Skriptmodell |
Salitan Pangasinan | Pangasinensisch | pag |
Latn | Lateinisches Skriptmodell |
Papiamentu | Papiamento | pap |
Latn | Lateinisches Skriptmodell |
Português (Portugal) | Portugiesisch | pt-PT |
Latn; Europäisch | pt |
Kechua/Runa Simi | Quechua | qu |
Latn | Lateinisches Skriptmodell |
Rumantsch | Rätoromanisch | rm |
Latn | Lateinisches Skriptmodell |
Romani čhib | Romani | rom |
Latn | Lateinisches Skriptmodell |
Ikirundi | Kirundi | rn |
Latn | Lateinisches Skriptmodell |
Jakutisch | Jakutisch | sah |
Cyrl | Kyrillisches Skriptmodell |
Gagana faʻa Sāmoa | Samoanisch | sm |
Latn | Lateinisches Skriptmodell |
yângâ tî sängö | Sango | sg |
Latn | Lateinisches Skriptmodell |
(Braid) Scots, Lallans, Doric | Schottisch | sco |
Latn | Lateinisches Skriptmodell |
Gàidhlig | Schottisch-Gälisch | gd |
Latn | Lateinisches Skriptmodell |
chiShona | Shona | sn |
Latn | Lateinisches Skriptmodell |
Songhay | Songhai | son |
Latn | Lateinisches Skriptmodell |
Sesotho | Süd-Sotho | st |
Latn | Lateinisches Skriptmodell |
Español (Latinoamérica) | Spanisch | es-419 |
Latn; Lateinamerikanisch | es |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanesisch | su |
Latn | Lateinisches Skriptmodell |
siSwati | Siswati | ss |
Latn | Lateinisches Skriptmodell |
Reo Tahiti | Tahitianisch | ty |
Latn | Lateinisches Skriptmodell |
тоҷикӣ | Tadschikisch | tg |
Cyrl | Kyrillisches Skriptmodell |
татар теле | Tatarisch | tt |
Cyrl/Latn | Kyrillisches Skriptmodell |
KʌThemnɛ | Temne | tem |
Latn | Lateinisches Skriptmodell |
lea faka-Tonga | Tongaisch | to |
Latn | Lateinisches Skriptmodell |
Xitsonga | Tsonga | ts |
Latn | Lateinisches Skriptmodell |
Setswana | Setswana | tn |
Latn | Lateinisches Skriptmodell |
Türkmençe | Turkmenisch | tk |
Latn | Kyrillisches Skriptmodell |
удмурт кыл | Udmurtisch | udm |
Cyrl | Kyrillisches Skriptmodell |
Tshivenḓa | Venda | ve |
Latn | Lateinisches Skriptmodell |
Vod | Wotisch | vot |
Cyrl/Latn | Kyrillisches Skriptmodell |
Frysk | Westfriesisch | fy |
Latn | Lateinisches Skriptmodell |
Wolof | Wolof | wo |
Latn | Lateinisches Skriptmodell |
isiXhosa | Xhosa | xh |
Latn | Lateinisches Skriptmodell |
Èdè Yorùbá | Yoruba | yo |
Latn | Lateinisches Skriptmodell |
Diidxazá | Zapotec | zap |
Latn | Lateinisches Skriptmodell |
Handschrift-Skripts
Dieser Abschnitt enthält die Scripts, die für die Handschrifterkennung unterstützt werden. In den Tabellen für unterstützte, experimentelle und zugeordnete Sprachen finden Sie Informationen dazu, welche Sprachen das jeweilige Script verwenden. Wenn Sie nach einem Skript filtern möchten, geben Sie ein Skript in das folgende Feld ein:
Script-Tag | Name | Supportstufe |
---|---|---|
Beng | Bengalisch | Experimentell |
Cyrl | Kyrillisch | Experimentell |
Deva | Dewanagari | Experimentell |
Grek | Griechisch | Experimentell |
Hani | Chinesisch | Experimentell |
Jpan | Japanisch | Unterstützt |
Kore | Koreanisch | Unterstützt |
Latn | Latein | Unterstützt |
vi | Vietnamesisch | Experimentell |