La fonctionnalité de reconnaissance de texte de Google Distributed Cloud (GDC) air-gapped détecte une grande variété de langues et peut en détecter plusieurs dans une même image.
Vous pouvez spécifier un indice de langue facultatif pour une requête d'API de reconnaissance optique des caractères (OCR). Par exemple, vous pouvez fournir un indice lorsque l'API a du mal à détecter la langue utilisée dans votre image.
Pour spécifier des indices de langue facultatifs, ajoutez-les à votre requête BatchAnnotateImages
ou BatchAnnotateFiles
dans le champ image_context
sous forme de liste de valeurs dans le champ language_hints
.
Le format language_hints
utilise les consignes de mise en forme suivantes pour les balises de langue BCP 47
:
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
Par exemple, l'indication de langue en-t-i0-handwrit
signifie que la langue est "anglais transformé à partir de l'écriture manuscrite".
La fonctionnalité de reconnaissance de texte prend en charge trois niveaux de langue :
- Les langues acceptées sont prioritaires et leurs performances sont régulièrement évaluées.
- Les langues expérimentales sont en phase de développement actif. Ils ne font pas l'objet d'évaluations régulières de leurs performances.
- Les langues mappées sont celles qui sont compatibles avec un autre code de langue ou un outil de reconnaissance de caractères général. Par exemple,
en-GB
est accepté, mais n'est pas traité différemment deen
pour la reconnaissance de texte. Le service OCR tente de renvoyer le code de langue mappé correct dans le champentity
. Toutefois, les langues mappées sont plus susceptibles d'être mal identifiées que les langues entièrement ou expérimentalement acceptées.
L'une des principales caractéristiques du service OCR est sa capacité à détecter et extraire du texte à partir d'images. Il peut s'agir, par exemple, d'un texte manuscrit. Pour obtenir la liste des scripts d'écriture manuscrite compatibles avec la reconnaissance de l'écriture manuscrite, consultez Scripts d'écriture manuscrite.
Langues disponibles
La fonctionnalité de reconnaissance de texte priorise et évalue régulièrement les langues acceptées. Pour filtrer les résultats par langue, saisissez une langue dans le champ suivant :
Langue | Langue (nom français) | Code des suggestions de langue | Script et notes |
---|---|---|---|
Afrikaans | Afrikaans | af |
Latn |
shqip | Albanais | sq |
Latn |
العربية | Arabe | ar |
Arabe standard moderne |
беларуская | Biélorusse | be |
Cyrl |
български | Bulgare | bg |
Cyrl |
Català | Catalan | ca |
Latn |
普通话 | Chinois | zh |
Hans/Hant |
Hrvatski | Croate | hr |
Latn |
Čeština | Tchèque | cs |
Latn |
Dansk | Danois | da |
Latn |
Nederlands | Néerlandais | nl |
Latn |
Anglais | Anglais | en |
Latn ; Américain |
Eesti keel | Estonien | et |
Latn |
Philippin | Philippin | fil ou tl |
Latn |
Suomi | Finnois | fi |
Latn |
Français | Français | fr |
Latn ; Européen |
Deutsch | Allemand | de |
Latn |
Ελληνικά | Grec | el |
Grek |
עברית | Hébreu | iw |
Hebr |
हिन्दी | Hindi | hi |
Deva |
Magyar | Hongrois | hu |
Latn |
Íslenska | Islandais | is |
Latn |
Bahasa Indonesia | Indonésien | id |
Latn |
Italiano | Italien | it |
Latn |
日本語 | Japonais | ja |
Jpan |
한국어 | Coréen | ko |
Kore |
Latviešu | Letton | lv |
Latn |
Lietuvių | Lituanien | lt |
Latn |
Македонски | Macédonien | mk |
Cyrl |
Malaisien | Malaisien | ms |
Latn |
മലയാളം | Malayalam | ml |
Mlym |
मराठी | Marathi | mr |
Deva |
नेपाली | Népalais | ne |
Deva |
Norsk | Norvégien | no |
Latn ; Bokmål |
فارسی | Persan | fa |
Arabe |
Polski | Polonais | pl |
Latn |
Português | Portugais | pt |
Latn ; Brésilien |
Română | Roumain | ro |
Latn |
Pусский | Russe | ru |
Cyrl |
Русский (старая орфография) | Russe | ru-PETR1708 |
Cyrl ; Ancien orthographe |
Српски | Serbe | sr |
Cyrl & Latn |
Српски (латиница) | Serbe | sr-Latn |
Latn |
Slovenčina | Slovaque | sk |
Latn |
Slovenščina | Slovène | sl |
Latn |
Español | Espagnol | es |
Latn ; Européen |
Svenska | Suédois | sv |
Latn |
Tagalog | Tagalog | tl |
Latn |
Türkçe | Turc | tr |
Latn |
Українська | Ukrainien | uk |
Cyrl |
Tiếng Việt | Vietnamien | vi |
Latn |
Yiddish | Yiddish | yi |
Hebr |
Langues expérimentales
Les langues expérimentales sont en phase de développement actif et ne sont pas évaluées. Pour filtrer les résultats par langue, saisissez une langue dans le champ suivant :
Langue | Langue (nom français) | Code des suggestions de langue | Script et notes |
---|---|---|---|
Αρχαία ελληνικά | Grec ancien | grc |
Grek |
Azərbaycan | Azéri | az |
Latn |
Azərbaycan (qədim yazı) | Azéri | az-Cyrl |
Cyrl ; ancien orthographe |
Euskara | Basque | eu |
Latn |
Bosanski | Bosniaque | bs |
Latn |
Cebuano | Cebuano | ceb |
Latn |
Espéranto | Espéranto | eo |
Latn |
Galego | Galicien | gl |
Latn |
ქართული | Géorgien | ka |
Geor |
Kreyòl Ayisyen | Créole haïtien | ht |
Latn |
Gaeilge | Irlandais | ga |
Latn |
Jawa | Javanais | jv |
Latn |
Қазақ | Kazakh | kk |
Cyrl |
Kirghiz | Kirghiz | ky |
Cyrl |
Latine | Latin | la |
Latn |
Malti | Maltais | mt |
Latn |
Монгол | Mongol | mn |
Cyrl |
پښتو | Pachtô | ps |
Arabe |
संस्कृतम् | Sanskrit | sa |
Deva |
Swahili | Swahili | sw |
Latn |
اردو | Urdu | ur |
Arabe |
oʻzbekcha | Ouzbek | uz |
Latn ; latin |
oʻzbekcha | Ouzbek | uz-Cyrl |
Cyrl ; ancien orthographe |
Cymraeg | Gallois | cy |
Latn |
IsiZulu | Zulu | zu |
Latn |
Langues mappées
Les langues mappées sont associées à un autre code de langue ou à un outil de reconnaissance de caractères général. Pour filtrer par langue, saisissez une langue dans le champ suivant :
Langue | Langue (nom français) | Code des suggestions de langue | Script et notes | Associé à |
---|---|---|---|---|
بهسا اچيه | Aceh | ace |
Latn | Modèle de script latin |
Lwo | Acholi | ach |
Latn | Modèle de script latin |
Adangme | Adangme | ada |
Latn | Modèle de script latin |
Akan | Akan | ak |
Latn | Modèle de script latin |
Anicinâbemowin | Algonquien | alg |
Latn | Modèle de script latin |
Mapudungu | Araucan/Mapuche | arn |
Latn | Modèle de script latin |
Asturianu | Asturien | ast |
Latn | Modèle de script latin |
Dene | Athapascan | ath |
Latn | Modèle de script latin |
Aymar aru | Aymara | ay |
Latn | Modèle de script latin |
Bhāṣa Bali | Balinais | ban |
Latn | Modèle de script latin |
Bamanankan | Bambara | bm |
Latn | Modèle de script latin |
Bantu au sens étroit | Bantu | bnt |
Latn | Modèle de script latin |
башҡорт теле | Bachkir | ba |
Cyrl | Modèle de script cyrillique |
Toba–Batak | Batak | btk |
Latn | Modèle de script latin |
Chibemba | Bemba | bem |
Latn | Modèle de script latin |
Bikol Naga | Bicol | bik |
Latn | Modèle de script latin |
Bichelamar | Bislama | bi |
Latn | Modèle de script latin |
Brezhoneg | Breton | br |
Latn | Modèle de script latin |
нохчийн мотт / noxçiyn mott | Tchétchènes | ce |
Cyrl | Modèle de script cyrillique |
汉语 | Chinois | zh-Hans |
Hans ; Simplifié ; Mandarin | zh |
漢語 | Chinois | zh-Hant |
Hant ; Traditionnel ; Mandarin | zh |
普通話 | Chinois | zh-Hant-HK |
Hant ; Mandarin ; Hong Kong | zh |
Chahta' | Choctaw | cho |
Latn | Modèle de script latin |
Чӑвашла | Tchouvache | cv |
Cyrl | Modèle de script cyrillique |
Cree–Montagnais–Naskapi | Cri | cr |
Latn | Modèle de script latin |
Mvskoke | Creek | mus |
Latn | Modèle de script latin |
qırımtatar tili, къырымтатар тили | Tatar de Crimée | crh |
Latn | Modèle de script cyrillique |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak |
Latn | Modèle de script latin |
Douala | Douala | dua |
Latn | Modèle de script latin |
Ikɔ Efik | Efik | efi |
Latn | Modèle de script latin |
Anglais (britannique) | Anglais | en-GB |
Latn ; Anglais | fr |
Èʋegbe | Éwé | ee |
Latn | Modèle de script latin |
føroyskt mál | Féroé | fo |
Latn | Modèle de script latin |
Na Vosa Vakaviti | Fidjien | fj |
Latn | Modèle de script latin |
fɔ̀ngbè | Fon | fon |
Latn | Modèle de script latin |
Français canadien | Français | fr-CA |
Latn ; Canadien | fr |
Fulani, Fulah, Peul | Peul | ff |
Latn | Modèle de script latin |
Gã | Ga | gaa |
Latn | Modèle de script latin |
Luganda | ganda | lg |
Latn | Modèle de script latin |
Basa Gayo | Gayo | gay |
Latn | Modèle de script latin |
Kiribati | Gilbertin | gil |
Latn | Modèle de script latin |
Gothique | Gothique | got |
Latn | Modèle de script latin |
Guaraní | Guarani | gn |
Latn | Modèle de script latin |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Haoussa | ha |
Latn | Modèle de script latin |
'Ōlelo Hawai'i | Hawaïen | haw |
Latn | Modèle de script latin |
Otjiherero | Héréro | hz |
Latn | Modèle de script latin |
Ilonggo | Hiligaïnon | hil |
Latn | Modèle de script latin |
Jaku Iban | Iban | iba |
Latn | Modèle de script latin |
Asụsụ Igbo | Igbo | ig |
Latn | Modèle de script latin |
Ilokano | Ilocano | ilo |
Latn | Modèle de script latin |
Taqbaylit | Kabyle | kab |
Latn | Modèle de script latin |
Jingpho | Kachin | kac |
Latn | Modèle de script latin |
Kalaallisut | Kalaallisut | kl |
Latn | Modèle de script latin |
Kikamba | Kamba | kam |
Latn | Modèle de script latin |
Kanuri | Kanuri | kr |
Latn | Modèle de script latin |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Karakalpaks | kaa |
Cyrl/Latn | Modèle de script cyrillique |
Ka Ktien Khasi | Khasi | kha |
Latn | Modèle de script latin |
Gĩkũyũ | Kikuyu | ki |
Latn | Modèle de script latin |
Kinyarwanda | Kinyarwanda | rw |
Latn | Modèle de script latin |
коми кыв | Komi | kv |
Cyrl | Modèle de script cyrillique |
Kikongo | Kongo | kg |
Latn | Modèle de script latin |
Kosrae | Kosrae | kos |
Latn | Modèle de script latin |
Oshikwanyama | Kuanyama | kj |
Latn | Modèle de script latin |
Ngala | Lingala | ln |
Latn | Modèle de script latin |
Plattdütsch, Plattdeutsch, Nedersaksisch | Bas allemand | nds |
Latn | Modèle de script latin |
siLozi | lozi | loz |
Latn | Modèle de script latin |
Kiluba | Luba-katanga | lu |
Latn | Modèle de script latin |
Dholuo | Luo | luo |
Latn | Modèle de script latin |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madourais | mad |
Latn | Modèle de script latin |
Malgache | Malgache | mg |
Latn | Modèle de script latin |
Mandinka, لغة مندنكا | Mandingue | man |
Latn | Modèle de script latin |
Gaelg, Gailck | Manx | gv |
Latn | Modèle de script latin |
Te reo Māori | Maori | mi |
Latn | Modèle de script latin |
Ebon | Marshallais | mh |
Latn | Modèle de script latin |
Mɛnde yia | Mendé | men |
Latn | Modèle de script latin |
Moyen anglais | Moyen anglais | enm |
Latn | Modèle de script latin |
Mittelhochdeutsch | Moyen haut-allemand | gmh |
Latn | Modèle de script latin |
Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min |
Latn | Modèle de script latin |
Kanienʼkéha | Mohawk | moh |
Latn | Modèle de script latin |
Nkundu | Mongo | lol |
Latn | Modèle de script latin |
Nāhuatl | Nahuatl | nah |
Latn | Modèle de script latin |
Diné bizaad | Navajo | nv |
Latn | Modèle de script latin |
Ndonga | Ndonga | ng |
Latn | Modèle de script latin |
ko e vagahau Niuē | Niuéen | niu |
Latn | Modèle de script latin |
Zimbabwe Ndebele | Ndébélé du Nord | nd |
Latn | Modèle de script latin |
Sesotho sa Leboa | Sotho du Nord | nso |
Latn | Modèle de script latin |
Chichewa, Chinyanja | Chichewa | ny |
Latn | Modèle de script latin |
Runyankore | nyankolé | nyn |
Latn | Modèle de script latin |
Chitonga | Nyasa Tonga | tog |
Latn | Modèle de script latin |
Appolo | Nzema | nzi |
Latn | Modèle de script latin |
Occitan, lenga d'òc, provençal | Occitan | oc |
Latn | Modèle de script latin |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj |
Latn | Modèle de script latin |
Ænglisc, Englisc, Anglisc | Vieil anglais | ang |
Latn | Modèle de script latin |
Franceis, François, Romanz | Ancien français | fro |
Latn | Modèle de script latin |
Diutisk, Althochdeutsch | Vieux haut-allemand | goh |
Latn | Modèle de script latin |
Dǫnsk tunga | Vieux norrois | non |
Latn | Modèle de script latin |
Occitan ancian | Provençal ancien | pro |
Latn | Modèle de script latin |
ирон ӕвзаг | Ossète | os |
Cyrl | Modèle de script cyrillique |
Pampangan | Pampanga | pam |
Latn | Modèle de script latin |
Salitan Pangasinan | Pangasinan | pag |
Latn | Modèle de script latin |
Papiamentu | Papiamento | pap |
Latn | Modèle de script latin |
Português (Portugal) | Portugais | pt-PT |
Latn ; Européen | pt |
Kechua / Runa Simi | Quechua | qu |
Latn | Modèle de script latin |
Rumantsch | Romanche | rm |
Latn | Modèle de script latin |
Romani čhib | Romani | rom |
Latn | Modèle de script latin |
Ikirundi | Roundi | rn |
Latn | Modèle de script latin |
Sakha | Sakha | sah |
Cyrl | Modèle de script cyrillique |
Gagana faʻa Sāmoa | Samoan | sm |
Latn | Modèle de script latin |
yângâ tî sängö | Sango | sg |
Latn | Modèle de script latin |
(Braid) Scots, Lallans, Doric | Scots | sco |
Latn | Modèle de script latin |
Gàidhlig | Gaélique écossais | gd |
Latn | Modèle de script latin |
chiShona | Shona | sn |
Latn | Modèle de script latin |
Songhay | Songhaï | son |
Latn | Modèle de script latin |
Sesotho | Sotho du Sud | st |
Latn | Modèle de script latin |
Español (Latinoamérica) | Espagnol | es-419 |
Latn ; Amérique latine | es |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Soundanais | su |
Latn | Modèle de script latin |
siSwati | Swati | ss |
Latn | Modèle de script latin |
Reo Tahiti | Tahitien | ty |
Latn | Modèle de script latin |
тоҷикӣ | Tadjik | tg |
Cyrl | Modèle de script cyrillique |
татар теле | Tatar | tt |
Cyrl/Latn | Modèle de script cyrillique |
KʌThemnɛ | Temne | tem |
Latn | Modèle de script latin |
lea faka-Tonga | Tongien | to |
Latn | Modèle de script latin |
Xitsonga | Tsonga | ts |
Latn | Modèle de script latin |
Setswana | Tswana | tn |
Latn | Modèle de script latin |
Türkmençe | Turkmène | tk |
Latn | Modèle de script cyrillique |
удмурт кыл | Oudmourte | udm |
Cyrl | Modèle de script cyrillique |
Tshivenḓa | Venda | ve |
Latn | Modèle de script latin |
Vod | Vote | vot |
Cyrl/Latn | Modèle de script cyrillique |
Frysk | Frison occidental | fy |
Latn | Modèle de script latin |
Wolof | Wolof | wo |
Latn | Modèle de script latin |
isiXhosa | Xhosa | xh |
Latn | Modèle de script latin |
Èdè Yorùbá | Yoruba | yo |
Latn | Modèle de script latin |
Diidxazá | Zapotèque | zap |
Latn | Modèle de script latin |
Scripts d'écriture manuscrite
Cette section contient les scripts compatibles avec la reconnaissance de l'écriture manuscrite. Pour savoir quelles langues utilisent chaque script, consultez les tableaux des langues acceptées, expérimentales et mappées. Pour filtrer par script, saisissez un script dans le champ suivant :
Tag de script | Nom | Niveau d'assistance |
---|---|---|
Beng | Bengalî | Test |
Cyrl | Cyrillique | Test |
Deva | Dévanâgarî | Test |
Grek | Grec | Test |
Hani | Chinois | Test |
Jpan | Japonais | Compatible |
Kore | Coréen | Compatible |
Latn | Latin | Compatible |
vi | Vietnamien | Test |