Langues disponibles

La fonctionnalité de reconnaissance de texte de Google Distributed Cloud (GDC) air-gapped détecte une grande variété de langues et peut en détecter plusieurs dans une même image.

Vous pouvez spécifier un indice de langue facultatif pour une requête d'API de reconnaissance optique des caractères (OCR). Par exemple, vous pouvez fournir un indice lorsque l'API a du mal à détecter la langue utilisée dans votre image.

Pour spécifier des indices de langue facultatifs, ajoutez-les à votre requête BatchAnnotateImages ou BatchAnnotateFiles dans le champ image_context sous forme de liste de valeurs dans le champ language_hints.

Le format language_hints utilise les consignes de mise en forme suivantes pour les balises de langue BCP 47 :

language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]

Par exemple, l'indication de langue en-t-i0-handwrit signifie que la langue est "anglais transformé à partir de l'écriture manuscrite".

La fonctionnalité de reconnaissance de texte prend en charge trois niveaux de langue :

  1. Les langues acceptées sont prioritaires et leurs performances sont régulièrement évaluées.
  2. Les langues expérimentales sont en phase de développement actif. Ils ne font pas l'objet d'évaluations régulières de leurs performances.
  3. Les langues mappées sont celles qui sont compatibles avec un autre code de langue ou un outil de reconnaissance de caractères général. Par exemple, en-GB est accepté, mais n'est pas traité différemment de en pour la reconnaissance de texte. Le service OCR tente de renvoyer le code de langue mappé correct dans le champ entity. Toutefois, les langues mappées sont plus susceptibles d'être mal identifiées que les langues entièrement ou expérimentalement acceptées.

L'une des principales caractéristiques du service OCR est sa capacité à détecter et extraire du texte à partir d'images. Il peut s'agir, par exemple, d'un texte manuscrit. Pour obtenir la liste des scripts d'écriture manuscrite compatibles avec la reconnaissance de l'écriture manuscrite, consultez Scripts d'écriture manuscrite.

Langues disponibles

La fonctionnalité de reconnaissance de texte priorise et évalue régulièrement les langues acceptées. Pour filtrer les résultats par langue, saisissez une langue dans le champ suivant :

Langue Langue (nom français) Code des suggestions de langue Script et notes
Afrikaans Afrikaans af Latn
shqip Albanais sq Latn
العربية Arabe ar Arabe standard moderne
беларуская Biélorusse be Cyrl
български Bulgare bg Cyrl
Català Catalan ca Latn
普通话 Chinois zh Hans/Hant
Hrvatski Croate hr Latn
Čeština Tchèque cs Latn
Dansk Danois da Latn
Nederlands Néerlandais nl Latn
Anglais Anglais en Latn ; Américain
Eesti keel Estonien et Latn
Philippin Philippin fil ou tl Latn
Suomi Finnois fi Latn
Français Français fr Latn ; Européen
Deutsch Allemand de Latn
Ελληνικά Grec el Grek
עברית Hébreu iw Hebr
हिन्दी Hindi hi Deva
Magyar Hongrois hu Latn
Íslenska Islandais is Latn
Bahasa Indonesia Indonésien id Latn
Italiano Italien it Latn
日本語 Japonais ja Jpan
한국어 Coréen ko Kore
Latviešu Letton lv Latn
Lietuvių Lituanien lt Latn
Македонски Macédonien mk Cyrl
Malaisien Malaisien ms Latn
മലയാളം Malayalam ml Mlym
मराठी Marathi mr Deva
नेपाली Népalais ne Deva
Norsk Norvégien no Latn ; Bokmål
فارسی Persan fa Arabe
Polski Polonais pl Latn
Português Portugais pt Latn ; Brésilien
Română Roumain ro Latn
Pусский Russe ru Cyrl
Русский (старая орфография) Russe ru-PETR1708 Cyrl ; Ancien orthographe
Српски Serbe sr Cyrl & Latn
Српски (латиница) Serbe sr-Latn Latn
Slovenčina Slovaque sk Latn
Slovenščina Slovène sl Latn
Español Espagnol es Latn ; Européen
Svenska Suédois sv Latn
Tagalog Tagalog tl Latn
Türkçe Turc tr Latn
Українська Ukrainien uk Cyrl
Tiếng Việt Vietnamien vi Latn
Yiddish Yiddish yi Hebr

Langues expérimentales

Les langues expérimentales sont en phase de développement actif et ne sont pas évaluées. Pour filtrer les résultats par langue, saisissez une langue dans le champ suivant :

Langue Langue (nom français) Code des suggestions de langue Script et notes
Αρχαία ελληνικά Grec ancien grc Grek
Azərbaycan Azéri az Latn
Azərbaycan (qədim yazı) Azéri az-Cyrl Cyrl ; ancien orthographe
Euskara Basque eu Latn
Bosanski Bosniaque bs Latn
Cebuano Cebuano ceb Latn
Espéranto Espéranto eo Latn
Galego Galicien gl Latn
ქართული Géorgien ka Geor
Kreyòl Ayisyen Créole haïtien ht Latn
Gaeilge Irlandais ga Latn
Jawa Javanais jv Latn
Қазақ Kazakh kk Cyrl
Kirghiz Kirghiz ky Cyrl
Latine Latin la Latn
Malti Maltais mt Latn
Монгол Mongol mn Cyrl
پښتو Pachtô ps Arabe
संस्कृतम् Sanskrit sa Deva
Swahili Swahili sw Latn
اردو Urdu ur Arabe
oʻzbekcha Ouzbek uz Latn ; latin
oʻzbekcha Ouzbek uz-Cyrl Cyrl ; ancien orthographe
Cymraeg Gallois cy Latn
IsiZulu Zulu zu Latn

Langues mappées

Les langues mappées sont associées à un autre code de langue ou à un outil de reconnaissance de caractères général. Pour filtrer par langue, saisissez une langue dans le champ suivant :

Langue Langue (nom français) Code des suggestions de langue Script et notes Associé à
بهسا اچيه Aceh ace Latn Modèle de script latin
Lwo Acholi ach Latn Modèle de script latin
Adangme Adangme ada Latn Modèle de script latin
Akan Akan ak Latn Modèle de script latin
Anicinâbemowin Algonquien alg Latn Modèle de script latin
Mapudungu Araucan/Mapuche arn Latn Modèle de script latin
Asturianu Asturien ast Latn Modèle de script latin
Dene Athapascan ath Latn Modèle de script latin
Aymar aru Aymara ay Latn Modèle de script latin
Bhāṣa Bali Balinais ban Latn Modèle de script latin
Bamanankan Bambara bm Latn Modèle de script latin
Bantu au sens étroit Bantu bnt Latn Modèle de script latin
башҡорт теле Bachkir ba Cyrl Modèle de script cyrillique
Toba–Batak Batak btk Latn Modèle de script latin
Chibemba Bemba bem Latn Modèle de script latin
Bikol Naga Bicol bik Latn Modèle de script latin
Bichelamar Bislama bi Latn Modèle de script latin
Brezhoneg Breton br Latn Modèle de script latin
нохчийн мотт / noxçiyn mott Tchétchènes ce Cyrl Modèle de script cyrillique
汉语 Chinois zh-Hans Hans ; Simplifié ; Mandarin zh
漢語 Chinois zh-Hant Hant ; Traditionnel ; Mandarin zh
普通話 Chinois zh-Hant-HK Hant ; Mandarin ; Hong Kong zh
Chahta' Choctaw cho Latn Modèle de script latin
Чӑвашла Tchouvache cv Cyrl Modèle de script cyrillique
Cree–Montagnais–Naskapi Cri cr Latn Modèle de script latin
Mvskoke Creek mus Latn Modèle de script latin
qırımtatar tili, къырымтатар тили Tatar de Crimée crh Latn Modèle de script cyrillique
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Modèle de script latin
Douala Douala dua Latn Modèle de script latin
Ikɔ Efik Efik efi Latn Modèle de script latin
Anglais (britannique) Anglais en-GB Latn ; Anglais fr
Èʋegbe Éwé ee Latn Modèle de script latin
føroyskt mál Féroé fo Latn Modèle de script latin
Na Vosa Vakaviti Fidjien fj Latn Modèle de script latin
fɔ̀ngbè Fon fon Latn Modèle de script latin
Français canadien Français fr-CA Latn ; Canadien fr
Fulani, Fulah, Peul Peul ff Latn Modèle de script latin
Ga gaa Latn Modèle de script latin
Luganda ganda lg Latn Modèle de script latin
Basa Gayo Gayo gay Latn Modèle de script latin
Kiribati Gilbertin gil Latn Modèle de script latin
Gothique Gothique got Latn Modèle de script latin
Guaraní Guarani gn Latn Modèle de script latin
Harshen/Halshen Hausa هَرْشَن هَوْسَ Haoussa ha Latn Modèle de script latin
'Ōlelo Hawai'i Hawaïen haw Latn Modèle de script latin
Otjiherero Héréro hz Latn Modèle de script latin
Ilonggo Hiligaïnon hil Latn Modèle de script latin
Jaku Iban Iban iba Latn Modèle de script latin
Asụsụ Igbo Igbo ig Latn Modèle de script latin
Ilokano Ilocano ilo Latn Modèle de script latin
Taqbaylit Kabyle kab Latn Modèle de script latin
Jingpho Kachin kac Latn Modèle de script latin
Kalaallisut Kalaallisut kl Latn Modèle de script latin
Kikamba Kamba kam Latn Modèle de script latin
Kanuri Kanuri kr Latn Modèle de script latin
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Karakalpaks kaa Cyrl/Latn Modèle de script cyrillique
Ka Ktien Khasi Khasi kha Latn Modèle de script latin
Gĩkũyũ Kikuyu ki Latn Modèle de script latin
Kinyarwanda Kinyarwanda rw Latn Modèle de script latin
коми кыв Komi kv Cyrl Modèle de script cyrillique
Kikongo Kongo kg Latn Modèle de script latin
Kosrae Kosrae kos Latn Modèle de script latin
Oshikwanyama Kuanyama kj Latn Modèle de script latin
Ngala Lingala ln Latn Modèle de script latin
Plattdütsch, Plattdeutsch, Nedersaksisch Bas allemand nds Latn Modèle de script latin
siLozi lozi loz Latn Modèle de script latin
Kiluba Luba-katanga lu Latn Modèle de script latin
Dholuo Luo luo Latn Modèle de script latin
Madhura, Basa Mathura, بَهاسَ مَدورا Madourais mad Latn Modèle de script latin
Malgache Malgache mg Latn Modèle de script latin
Mandinka, لغة مندنكا Mandingue man Latn Modèle de script latin
Gaelg, Gailck Manx gv Latn Modèle de script latin
Te reo Māori Maori mi Latn Modèle de script latin
Ebon Marshallais mh Latn Modèle de script latin
Mɛnde yia Mendé men Latn Modèle de script latin
Moyen anglais Moyen anglais enm Latn Modèle de script latin
Mittelhochdeutsch Moyen haut-allemand gmh Latn Modèle de script latin
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modèle de script latin
Kanienʼkéha Mohawk moh Latn Modèle de script latin
Nkundu Mongo lol Latn Modèle de script latin
Nāhuatl Nahuatl nah Latn Modèle de script latin
Diné bizaad Navajo nv Latn Modèle de script latin
Ndonga Ndonga ng Latn Modèle de script latin
ko e vagahau Niuē Niuéen niu Latn Modèle de script latin
Zimbabwe Ndebele Ndébélé du Nord nd Latn Modèle de script latin
Sesotho sa Leboa Sotho du Nord nso Latn Modèle de script latin
Chichewa, Chinyanja Chichewa ny Latn Modèle de script latin
Runyankore nyankolé nyn Latn Modèle de script latin
Chitonga Nyasa Tonga tog Latn Modèle de script latin
Appolo Nzema nzi Latn Modèle de script latin
Occitan, lenga d'òc, provençal Occitan oc Latn Modèle de script latin
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Modèle de script latin
Ænglisc, Englisc, Anglisc Vieil anglais ang Latn Modèle de script latin
Franceis, François, Romanz Ancien français fro Latn Modèle de script latin
Diutisk, Althochdeutsch Vieux haut-allemand goh Latn Modèle de script latin
Dǫnsk tunga Vieux norrois non Latn Modèle de script latin
Occitan ancian Provençal ancien pro Latn Modèle de script latin
ирон ӕвзаг Ossète os Cyrl Modèle de script cyrillique
Pampangan Pampanga pam Latn Modèle de script latin
Salitan Pangasinan Pangasinan pag Latn Modèle de script latin
Papiamentu Papiamento pap Latn Modèle de script latin
Português (Portugal) Portugais pt-PT Latn ; Européen pt
Kechua / Runa Simi Quechua qu Latn Modèle de script latin
Rumantsch Romanche rm Latn Modèle de script latin
Romani čhib Romani rom Latn Modèle de script latin
Ikirundi Roundi rn Latn Modèle de script latin
Sakha Sakha sah Cyrl Modèle de script cyrillique
Gagana faʻa Sāmoa Samoan sm Latn Modèle de script latin
yângâ tî sängö Sango sg Latn Modèle de script latin
(Braid) Scots, Lallans, Doric Scots sco Latn Modèle de script latin
Gàidhlig Gaélique écossais gd Latn Modèle de script latin
chiShona Shona sn Latn Modèle de script latin
Songhay Songhaï son Latn Modèle de script latin
Sesotho Sotho du Sud st Latn Modèle de script latin
Español (Latinoamérica) Espagnol es-419 Latn ; Amérique latine es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Soundanais su Latn Modèle de script latin
siSwati Swati ss Latn Modèle de script latin
Reo Tahiti Tahitien ty Latn Modèle de script latin
тоҷикӣ Tadjik tg Cyrl Modèle de script cyrillique
татар теле Tatar tt Cyrl/Latn Modèle de script cyrillique
KʌThemnɛ Temne tem Latn Modèle de script latin
lea faka-Tonga Tongien to Latn Modèle de script latin
Xitsonga Tsonga ts Latn Modèle de script latin
Setswana Tswana tn Latn Modèle de script latin
Türkmençe Turkmène tk Latn Modèle de script cyrillique
удмурт кыл Oudmourte udm Cyrl Modèle de script cyrillique
Tshivenḓa Venda ve Latn Modèle de script latin
Vod Vote vot Cyrl/Latn Modèle de script cyrillique
Frysk Frison occidental fy Latn Modèle de script latin
Wolof Wolof wo Latn Modèle de script latin
isiXhosa Xhosa xh Latn Modèle de script latin
Èdè Yorùbá Yoruba yo Latn Modèle de script latin
Diidxazá Zapotèque zap Latn Modèle de script latin

Scripts d'écriture manuscrite

Cette section contient les scripts compatibles avec la reconnaissance de l'écriture manuscrite. Pour savoir quelles langues utilisent chaque script, consultez les tableaux des langues acceptées, expérimentales et mappées. Pour filtrer par script, saisissez un script dans le champ suivant :

Tag de script Nom Niveau d'assistance
Beng Bengalî Test
Cyrl Cyrillique Test
Deva Dévanâgarî Test
Grek Grec Test
Hani Chinois Test
Jpan Japonais Compatible
Kore Coréen Compatible
Latn Latin Compatible
vi Vietnamien Test