Compatibilidad de idiomas para el OCR

La función de reconocimiento de texto de la API Cloud Vision puede detectar una gran variedad de idiomas y varios idiomas en una sola imagen.

No es obligatorio proporcionar una pista de idioma al servicio, pero puedes hacerlo si el servicio tiene problemas para detectar el idioma que se usa en tu imagen.

Con el lanzamiento de la disponibilidad general del OCR de escritura a mano, las imágenes con escritura a mano ya no requieren la marca languageHints de escritura a mano cuando se usa DOCUMENT_TEXT_DETECTION.

Las sugerencias de idioma opcionales se especifican en el ImageContext de una solicitud como una lista de languageHints para una solicitud TEXT_DETECTION y DOCUMENT_TEXT_DETECTION.

Cada parámetro de código de idioma suele constar de un identificador BCP-47. Este parámetro puede tener el formato idioma-región, donde idioma hace referencia al idioma principal y región (opcional) hace referencia a una región (normalmente, el identificador de un país) de un dialecto concreto. Por ejemplo, el chino puede representarse como chino simplificado, tal como se escribe en la República Popular China (zh-Hans), o como chino tradicional, tal como se escribe en Taiwán (zh-Hant).

La función de reconocimiento de texto tiene tres niveles de compatibilidad con idiomas:

  1. Los idiomas admitidos son aquellos a los que damos prioridad y cuyo rendimiento evaluamos periódicamente.
  2. Los idiomas experimentales son aquellos que están en fase de desarrollo activo, pero que no se evalúan con regularidad.
  3. Los idiomas mapeados son aquellos que se admiten asignándolos a otro código de idioma o a un reconocedor de caracteres general. Por ejemplo, "en-GB" se admite, pero no se trata de forma diferente a "en" a la hora de reconocer texto. Hacemos todo lo posible para devolver el código de idioma asignado correcto en el campo de configuración regional de la entidad, pero es más probable que los idiomas asignados se identifiquen erróneamente como un idioma similar que los idiomas totalmente compatibles o compatibles de forma experimental.

A continuación, se muestra la lista de idiomas (con los códigos languageHint asociados) admitidos por TEXT_DETECTION y DOCUMENT_TEXT_DETECTION.

Si se deja en blanco, intentaremos detectar automáticamente el idioma más adecuado. El endpoint TEXT_DETECTION solo detectará automáticamente un subconjunto de los idiomas admitidos, mientras que el endpoint DOCUMENT_TEXT_DETECTION detectará automáticamente todos los idiomas admitidos.

Idiomas disponibles

Se priorizan y evalúan periódicamente los siguientes idiomas.

Para filtrar por funciones, escribe o selecciona directamente el idioma que quieras en el menú desplegable:

Idioma Idioma (nombre en inglés) languageHints código Secuencia de comandos Notas
Afrikaans Afrikáans af Latn
shqip Albanés sq Latn
العربية Árabe ar Arab Modern Standard
Հայ Armenio hy Armn
беларуская Bielorruso be Cyrl
বাংলা Bengalí bn Beng
български Búlgaro bg Cyrl
Català Catalán ca Latn
普通话 Chino zh Hans/Hant
Hrvatski Croata hr Latn
Čeština Checo cs Latn
Dansk Danés da Latn
Nederlands Neerlandés nl Latn
English Inglés en Latn Americano
Eesti keel Estonio et Latn
Filipino Filipino fil Latn
Suomi Finés fi Latn
Français Francés fr Latn Europea
Deutsch Alemán de Latn
Ελληνικά Griego el Grek
ગુજરાતી Gujarati gu Gujr
עברית Hebreo iw Hebr
हिन्दी Hindi hi Deva
Magyar Húngaro hu Latn
Íslenska Islandés is Latn
Bahasa Indonesia Indonesio id Latn
Italiano Italiano it Latn
日本語 Japonés ja Jpan
ಕನ್ನಡ Canarés kn Knda
ភាសាខ្មែរ Jemer km Khmr
한국어 Coreano ko Kore
ລາວ lao lo Laoo
Latviešu letón lv Latn
Lietuvių Lituano lt Latn
Македонски Macedonio mk Cyrl
Bahasa Melayu Malayo ms Latn
മലയാളം Malayalam ml Mlym
मराठी Marathi mr Deva
नेपाली Nepalí ne Deva
Norsk Noruego no Latn Bokmål
فارسی Persa fa Arab
Polski Polaco pl Latn
Português Portugués pt Latn Brasileño
ਪੰਜਾਬੀ Panyabí pa Guru Gurmuji
Română Rumano ro Latn
Русский Ruso ru Cyrl
Русский (старая орфография) Ruso ru-PETR1708 Cyrl Ortografía antigua
Српски Serbio sr Cyrl
Српски (латиница) Serbio sr-Latn Latn
Slovenčina Eslovaco sk Latn
Slovenščina Esloveno sl Latn
Español Español es Latn Europea
Svenska Sueco sv Latn
Tagalog Tagalo tl Latn
தமிழ் Tamil ta Taml
తెలుగు Telugu te Telu
ไทย Tailandés th Thai
Türkçe Turco tr Latn
Українська Ucraniano uk Cyrl
Tiếng Việt Vietnamita vi Latn
Yiddish Yiddish yi Hebr

Idiomas experimentales

Los siguientes idiomas están en fase de desarrollo activo y aún no se han evaluado de forma periódica.

Idioma Idioma (nombre en inglés) languageHints código Secuencia de comandos Notas
አማርኛ Amárico am Ethi
Αρχαία ελληνικά Griego antiguo grc Grek
অসমীয়া Asamés as Beng
Azərbaycan Azerí az Latn
Azərbaycan (qədim yazı) Azerí az-Cyrl Cyrl Ortografía antigua
Euskara Euskera eu Latn
Bosanski Bosnio bs Latn
မြန်မာ Birmano my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cheroqui chr Cher
dhivehi, dhivehi-bas Maldivo dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto Esperanto eo Latn
Galego Gallego gl Latn
ქართული Georgiano ka Geor
Kreyòl Ayisyen Criollo haitiano ht Latn
Gaeilge Irlandés ga Latn
Jawa Javanés jv Latn
Қазақ Kazajo kk Cyrl
Kirghiz Kirguís ky Cyrl
Latine Latín la Latn
Malti Maltés mt Latn
Монгол Mongol mn Cyrl
ଓଡ଼ିଆ Oriya or Orya
پښتو Pastún ps Arab
संस्कृतम् Sánscrito sa Deva
සිංහල Cingalés si Sinh
Swahili Swahili sw Latn
leššānā Suryāyā Siríaco syr Syriac
བོད་སྐད་ Tibetano bo Tibt
ትግርኛ Tigrinya ti Ethi
اردو Urdu ur Arab
oʻzbekcha Uzbeko uz Latn Latín
oʻzbekcha Uzbeko uz-Cyrl Cyrl Ortografía antigua
Cymraeg Galés cy Latn
IsiZulu Zulú zu Latn

Idiomas asignados

Los siguientes idiomas se han asignado a otro código de idioma o a un reconocedor de caracteres general.

Idioma Idioma (nombre en inglés) languageHints código Secuencia de comandos Notas
بهسا اچيه Acehnés ace Latn Modelo latino
Lwo Acholi ach Latn Modelo latino
Dangme Adangme ada Latn Modelo latino
Akan Acano ak Latn Modelo latino
Anicinâbemowin Algonquinian alg Latn Modelo latino
Mapudungu Araucano/mapuche arn Latn Modelo latino
Asturianu Asturiano ast Latn Modelo latino
Dene Athabaskan ath Latn Modelo latino
Aymar aru Aimara ay Latn Modelo latino
Bhāṣa Bali Balinés ban Latn Modelo latino
Bamanankan Bambara bm Latn Modelo latino
Narrow Bantu Bantu bnt Latn Modelo latino
башҡорт теле Baskir ba Cyrl Modelo cirílico
Toba–Batak Batak btk Latn Modelo latino
Chibemba Bemba bem Latn Modelo latino
Bikol Naga Bikol bik Latn Modelo latino
Bichelamar Bislama bi Latn Modelo latino
Brezhoneg Bretón br Latn Modelo latino
нохчийн мотт / noxçiyn mott Checheno ce Cyrl Modelo cirílico
汉语 Chino (mandarín, simplificado) zh-Hans Hans Modelo chino
漢語 Chino (mandarín, tradicional) zh-Hant Hant Modelo chino
普通話 Chino (mandarín, Hong Kong) zh-Hant-HK Hant Modelo chino
Chahta' Choctaw cho Latn Modelo latino
Чӑвашла Chuvasio cv Cyrl Modelo cirílico
Cree–Montagnais–Naskapi Cree cr Latn Modelo latino
Mvskoke Creek mus Latn Modelo latino
qırımtatar tili, къырымтатар тили Tártaro de Crimea crh Latn Modelo cirílico
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Modelo latino
Douala Duala dua Latn Modelo latino
Ikɔ Efik Efik efi Latn Modelo latino
English (British) Inglés (Reino Unido) en-GB Latn Modelo latino
Èʋegbe Ewé ee Latn Modelo latino
føroyskt mál Feroés fo Latn Modelo latino
Na Vosa Vakaviti Fiyiano fj Latn Modelo latino
fɔ̀ngbè Fon fon Latn Modelo latino
Français canadien Francés (Canadá) fr-CA Latn Modelo latino
Fulani, Fulah, Peul Fula ff Latn Modelo latino
ga gaa Latn Modelo latino
Luganda luganda lg Latn Modelo latino
Basa Gayo Gayo gay Latn Modelo latino
Kiribati Gilbertés gil Latn Modelo latino
Gothic Gótico got Latn Modelo latino
Guaraní Guaraní gn Latn Modelo latino
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hausa ha Latn Modelo latino
ʻŌlelo Hawaiʻi Hawaiano haw Latn Modelo latino
Otjiherero Herero hz Latn Modelo latino
Ilonggo Hiligainón hil Latn Modelo latino
Jaku Iban Iban iba Latn Modelo latino
Asụsụ Igbo Igbo ig Latn Modelo latino
Ilokano Ilocano ilo Latn Modelo latino
Taqbaylit Cabila kab Latn Modelo latino
Jingpho Kachin kac Latn Modelo latino
Kalaallisut Groenlandés kl Latn Modelo latino
Kikamba Kamba kam Latn Modelo latino
Kanuri Kanuri kr Latn Modelo latino
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Karakalpako kaa Cyrl/Latn Modelo cirílico
Ka Ktien Khasi Khasi kha Latn Modelo latino
Gĩkũyũ Kikuyu ki Latn Modelo latino
Kinyarwanda Kinyarwanda rw Latn Modelo latino
коми кыв Komi kv Cyrl Modelo cirílico
Kikongo Kikongo kg Latn Modelo latino
Kosraean Kosraean kos Latn Modelo latino
Oshikwanyama Kuanyama kj Latn Modelo latino
Ngala Lingala ln Latn Modelo latino
Plattdütsch, Plattdeutsch, Nedersaksisch Bajo alemán nds Latn Modelo latino
siLozi lozi loz Latn Modelo latino
Kiluba Luba-katanga lu Latn Modelo latino
Dholuo Luo luo Latn Modelo latino
Madhura, Basa Mathura, بَهاسَ مَدورا Madurés mad Latn Modelo latino
Malagasy Malgache mg Latn Modelo latino
Mandinka, لغة مندنكا Mandinga man Latn Modelo latino
Gaelg, Gailck Gaélico manés gv Latn Modelo latino
Te reo Māori Maorí mi Latn Modelo latino
Ebon Marshalés mh Latn Modelo latino
Mɛnde yia Mende men Latn Modelo latino
Middle English Inglés medio enm Latn Modelo latino
Mittelhochdeutsch Alto alemán medio gmh Latn Modelo latino
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modelo latino
Kanienʼkéha Mohawk moh Latn Modelo latino
Nkundu Mongo lol Latn Modelo latino
Nāhuatl Náhuatl nah Latn Modelo latino
Diné bizaad Navajo nv Latn Modelo latino
Ndonga Ndonga ng Latn Modelo latino
ko e vagahau Niuē Niueano niu Latn Modelo latino
Zimbabwe Ndebele Ndebele del norte nd Latn Modelo latino
Sesotho sa Leboa Sesotho norteño nso Latn Modelo latino
Chichewa, Chinyanja Chinyanja ny Latn Modelo latino
Runyankore nyankole nyn Latn Modelo latino
Chitonga Tonga de Nyasa tog Latn Modelo latino
Appolo Nzima nzi Latn Modelo latino
Occitan, lenga d'òc, provençal Occitano oc Latn Modelo latino
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Modelo latino
Ænglisc, Englisc, Anglisc Inglés antiguo ang Latn Modelo latino
Franceis, François, Romanz Francés antiguo fro Latn Modelo latino
Diutisk, Althochdeutsch Alto alemán antiguo goh Latn Modelo latino
Dǫnsk tunga Nórdico antiguo non Latn Modelo latino
Occitan ancian Provenzal antiguo pro Latn Modelo latino
ирон ӕвзаг Osetio os Cyrl Modelo cirílico
Kapampangan Pampanga pam Latn Modelo latino
Salitan Pangasinan Pangasinán pag Latn Modelo latino
Papiamentu Papiamento pap Latn Modelo latino
Português (Portugal) Portugués (Portugal) pt-PT Latn Modelo latino
Kechua / Runa Simi Quechua qu Latn Modelo latino
Rumantsch Romanche rm Latn Modelo latino
Romani čhib romaní rom Latn Modelo latino
Ikirundi Kirundi rn Latn Modelo latino
Sakha Yakuto sah Cyrl Modelo cirílico
Gagana faʻa Sāmoa Samoano sm Latn Modelo latino
yângâ tî sängö Sango sg Latn Modelo latino
(Braid) Scots, Lallans, Doric Escocés sco Latn Modelo latino
Gàidhlig Gaélico escocés gd Latn Modelo latino
chiShona Shona sn Latn Modelo latino
Songhay Songhai son Latn Modelo latino
Sesotho Sesoto austral st Latn Modelo latino
Español (Latinoamérica) Español (América Latina) es-419 Latn Modelo latino
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanés su Latn Modelo latino
siSwati Suazi ss Latn Modelo latino
Reo Tahiti Tahitiano ty Latn Modelo latino
тоҷикӣ Tayiko tg Cyrl Modelo cirílico
татар теле Tártaro tt Cyrl/Latn Modelo cirílico
KʌThemnɛ Temné tem Latn Modelo latino
lea faka-Tonga Tongano to Latn Modelo latino
Xitsonga Tsonga ts Latn Modelo latino
Setswana Setsuana tn Latn Modelo latino
Türkmençe Turkmeno tk Latn Modelo cirílico
удмурт кыл Udmurt udm Cyrl Modelo cirílico
Tshivenḓa Venda ve Latn Modelo latino
Vod Vótico vot Cyrl/Latn Modelo cirílico
Frysk Frisón occidental fy Latn Modelo latino
Wolof Wolof wo Latn Modelo latino
isiXhosa Xhosa xh Latn Modelo latino
Èdè Yorùbá Yoruba yo Latn Modelo latino
Diidxazá Zapoteco zap Latn Modelo latino

Secuencias de comandos de escritura a mano

Se admiten las siguientes secuencias de comandos para el reconocimiento de escritura a mano. Consulta las tablas de idiomas de arriba para ver qué idiomas usan cada alfabeto.

Secuencia de comandos Nombre Nivel de asistencia
Beng Bengalí Experimental
Cyrl Cirílico Experimental
Deva Devanagari Experimental
Grek Griego Experimental
Hani Chino Experimental
Jpan Japonés Compatible
Kore Coreano Compatible
Latn Latín Compatible
vi Vietnamita Experimental