A funcionalidade de reconhecimento de texto da Cloud Vision API consegue detetar uma grande variedade de idiomas e pode detetar vários idiomas numa única imagem.
Não é necessário fornecer uma sugestão de idioma ao serviço, mas pode fazê-lo se o serviço tiver problemas em detetar o idioma usado na sua imagem.
Com o lançamento da DG de OCR de escrita manual, as imagens
com escrita manual já não requerem uma languageHints flag de escrita manual
quando usam
DOCUMENT_TEXT_DETECTION.
As sugestões de idiomas opcionais
são especificadas no
ImageContext
de um pedido como uma lista de languageHints para um pedido de
TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.
Normalmente, cada parâmetro de código de idioma consiste num identificador BCP-47. Este parâmetro pode ter o formato idioma-região, em que idioma se refere ao idioma principal e a região opcional refere-se a uma região (normalmente, um identificador de país) de um dialeto específico. Por exemplo, o chinês pode ser representado como chinês simplificado, como é escrito na República Popular da China (zh-Hans), ou chinês tradicional, como é escrito em Taiwan (zh-Hant).
Existem três níveis de suporte de idiomas na funcionalidade de reconhecimento de texto:
- Os idiomas suportados são aqueles aos quais damos prioridade e em relação aos quais avaliamos regularmente o desempenho.
- Os idiomas experimentais são aqueles que estão em desenvolvimento ativo, mas não são avaliados regularmente.
- Os idiomas mapeados são os que são suportados através do respetivo mapeamento para outro código de idioma ou para um reconhecedor de carateres geral. Por exemplo, "
en-GB" é suportado, mas não é tratado de forma diferente de "en" para efeitos de reconhecimento de texto. Fazemos o nosso melhor para devolver o código do idioma mapeado correto no campo de localidade da entidade, mas é mais provável que os idiomas mapeados do que os idiomas totalmente suportados ou suportados experimentalmente sejam identificados incorretamente como um idioma semelhante.
A lista de idiomas (com códigos languageHint associados) suportados pelo
TEXT_DETECTION e DOCUMENT_TEXT_DETECTION é apresentada abaixo.
Se a sugestão de idioma for deixada em branco, vamos tentar detetar automaticamente o idioma mais adequado. O ponto final TEXT_DETECTION deteta automaticamente apenas um subconjunto de idiomas suportados, enquanto o ponto final DOCUMENT_TEXT_DETECTION deteta automaticamente o conjunto completo de idiomas suportados.
Idiomas suportados
Os seguintes idiomas são prioritários e avaliados regularmente.
Para filtrar por funcionalidades, escreva ou selecione diretamente o idioma pretendido no menu pendente:
| Idioma | Idioma (nome em inglês) | Código languageHints |
Script | Notas | |
|---|---|---|---|---|---|
| Afrikaans | Afrikaans | af |
Latn |
||
| shqip | Albanês | sq |
Latn |
||
| العربية | Árabe | ar |
Arab |
Modern Standard | |
| Հայ | Arménio | hy |
Armn |
||
| беларуская | Bielorrusso | be |
Cyrl |
||
| বাংলা | Bengali | bn |
Beng |
||
| български | Búlgaro | bg |
Cyrl |
||
| Català | Catalão | ca |
Latn |
||
| 普通话 | Chinês | zh |
Hans/Hant |
||
| Hrvatski | Croata | hr |
Latn |
||
| Čeština | Checo | cs |
Latn |
||
| Dansk | Dinamarquês | da |
Latn |
||
| Nederlands | Neerlandês | nl |
Latn |
||
| English | Inglês | en |
Latn |
Americano | |
| Eesti keel | Estónio | et |
Latn |
||
| Filipino | Filipino | fil |
Latn |
||
| Suomi | Finlandês | fi |
Latn |
||
| Français | Francês | fr |
Latn |
Europeu | |
| Deutsch | Alemão | de |
Latn |
||
| Ελληνικά | Grego | el |
Grek |
||
| ગુજરાતી | Gujarati | gu |
Gujr |
||
| עברית | Hebraico | iw |
Hebr |
||
| हिन्दी | Hindi | hi |
Deva |
||
| Magyar | Húngaro | hu |
Latn |
||
| Íslenska | Islandês | is |
Latn |
||
| Bahasa Indonesia | Indonésio | id |
Latn |
||
| Italiano | Italiano | it |
Latn |
||
| 日本語 | Japonês | ja |
Jpan |
||
| ಕನ್ನಡ | Canará | kn |
Knda |
||
| ភាសាខ្មែរ | Khmer | km |
Khmr |
||
| 한국어 | Coreano | ko |
Kore |
||
| ລາວ | Laociano | lo |
Laoo |
||
| Latviešu | Letão | lv |
Latn |
||
| Lietuvių | Lituano | lt |
Latn |
||
| Македонски | Macedónio | mk |
Cyrl |
||
| Bahasa Melayu | Malaio | ms |
Latn |
||
| മലയാളം | Malaiala | ml |
Mlym |
||
| मराठी | Marati | mr |
Deva |
||
| नेपाली | Nepalês | ne |
Deva |
||
| Norsk | Norueguês | no |
Latn |
Bokmål | |
| فارسی | Persa | fa |
Arab |
||
| Polski | Polaco | pl |
Latn |
||
| Português | Português | pt |
Latn |
Brasileiro | |
| ਪੰਜਾਬੀ | Punjabi | pa |
Guru |
Gurmukhi | |
| Română | Romeno | ro |
Latn |
||
| Русский | Russo | ru |
Cyrl |
||
| Русский (старая орфография) | Russo | ru-PETR1708 |
Cyrl |
Ortografia antiga | |
| Српски | Sérvio | sr |
Cyrl |
||
| Српски (латиница) | Sérvio | sr-Latn |
Latn |
||
| Slovenčina | Eslovaco | sk |
Latn |
||
| Slovenščina | Esloveno | sl |
Latn |
||
| Español | Espanhol | es |
Latn |
Europeu | |
| Svenska | Sueco | sv |
Latn |
||
| Tagalog | Tagalo | tl |
Latn |
||
| தமிழ் | Tamil | ta |
Taml |
||
| తెలుగు | Telugu | te |
Telu |
||
| ไทย | Tailandês | th |
Thai |
||
| Türkçe | Turco | tr |
Latn |
||
| Українська | Ucraniano | uk |
Cyrl |
||
| Tiếng Việt | Vietnamita | vi |
Latn |
||
| Yiddish | Iídiche | yi |
Hebr |
Idiomas experimentais
Os seguintes idiomas estão em desenvolvimento ativo e ainda não são avaliados regularmente.
| Idioma | Idioma (nome em inglês) | Código languageHints |
Script | Notas | |
|---|---|---|---|---|---|
| አማርኛ | Amárico | am |
Ethi |
||
| Αρχαία ελληνικά | Grego antigo | grc |
Grek |
||
| অসমীয়া | Assamês | as |
Beng |
||
| Azərbaycan | Azeri | az |
Latn |
||
| Azərbaycan (qədim yazı) | Azeri | az-Cyrl |
Cyrl |
Ortografia antiga | |
| Euskara | Basco | eu |
Latn |
||
| Bosanski | Bósnio | bs |
Latn |
||
| မြန်မာ | Birmanês | my |
Mymr |
||
| Cebuano | Cebuano | ceb |
Latn |
||
| ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | Cherokee | chr |
Cher |
||
| dhivehi, dhivehi-bas | Divehi | dv |
Thaa |
||
| རྫོང་ཁ | Dzonkha | dz |
Tibt |
||
| Esperanto | Esperanto | eo |
Latn |
||
| Galego | Galego | gl |
Latn |
||
| ქართული | Georgiana | ka |
Geor |
||
| Kreyòl Ayisyen | Crioulo haitiano | ht |
Latn |
||
| Gaeilge | Irlandês | ga |
Latn |
||
| Jawa | Javanês | jv |
Latn |
||
| Қазақ | Cazaque | kk |
Cyrl |
||
| Kirghiz | Quirguiz | ky |
Cyrl |
||
| Latine | Latim | la |
Latn |
||
| Malti | Maltês | mt |
Latn |
||
| Монгол | Mongol | mn |
Cyrl |
||
| ଓଡ଼ିଆ | Oriya | or |
Orya |
||
| پښتو | Pastó | ps |
Arab |
||
| संस्कृतम् | Sânscrito | sa |
Deva |
||
| සිංහල | Cingalês | si |
Sinh |
||
| Swahili | Suaíli | sw |
Latn |
||
| leššānā Suryāyā | Siríaco | syr |
Syriac |
||
| བོད་སྐད་ | Tibetano | bo |
Tibt |
||
| ትግርኛ | Tigrinya | ti |
Ethi |
||
| اردو | Urdu | ur |
Arab |
||
| oʻzbekcha | Usbeque | uz |
Latn |
Latim | |
| oʻzbekcha | Usbeque | uz-Cyrl |
Cyrl |
Ortografia antiga | |
| Cymraeg | Galês | cy |
Latn |
||
| IsiZulu | Zulu | zu |
Latn |
Idiomas mapeados
Os seguintes idiomas estão mapeados para outro código de idioma ou para um reconhecedor de carateres geral.
| Idioma | Idioma (nome em inglês) | Código languageHints |
Script | Notas | |
|---|---|---|---|---|---|
| بهسا اچيه | Achém | ace |
Latn |
Modelo latino | |
| Lwo | Acholi | ach |
Latn |
Modelo latino | |
| Dangme | Adangme | ada |
Latn |
Modelo latino | |
| Akan | Akan | ak |
Latn |
Modelo latino | |
| Anicinâbemowin | Algonquinian | alg |
Latn |
Modelo latino | |
| Mapudungu | Araucano/mapuche | arn |
Latn |
Modelo latino | |
| Asturianu | Asturiano | ast |
Latn |
Modelo latino | |
| Dene | Athabaskan | ath |
Latn |
Modelo latino | |
| Aymar aru | Aimará | ay |
Latn |
Modelo latino | |
| Bhāṣa Bali | Balinês | ban |
Latn |
Modelo latino | |
| Bamanankan | Bambara | bm |
Latn |
Modelo latino | |
| Narrow Bantu | Bantu | bnt |
Latn |
Modelo latino | |
| башҡорт теле | Bashkir | ba |
Cyrl |
Modelo cirílico | |
| Toba–Batak | Bataque | btk |
Latn |
Modelo latino | |
| Chibemba | Bemba | bem |
Latn |
Modelo latino | |
| Bikol Naga | Bikol | bik |
Latn |
Modelo latino | |
| Bichelamar | Bislama | bi |
Latn |
Modelo latino | |
| Brezhoneg | Bretão | br |
Latn |
Modelo latino | |
| нохчийн мотт / noxçiyn mott | Checheno | ce |
Cyrl |
Modelo cirílico | |
| 汉语 | Chinês (mandarim, simplificado) | zh-Hans |
Hans |
Modelo chinês | |
| 漢語 | Chinês (mandarim, tradicional) | zh-Hant |
Hant |
Modelo chinês | |
| 普通話 | Chinês (mandarim, Hong Kong) | zh-Hant-HK |
Hant |
Modelo chinês | |
| Chahta' | Choctaw | cho |
Latn |
Modelo latino | |
| Чӑвашла | Chuvache | cv |
Cyrl |
Modelo cirílico | |
| Cree–Montagnais–Naskapi | Cree | cr |
Latn |
Modelo latino | |
| Mvskoke | Riacho | mus |
Latn |
Modelo latino | |
| qırımtatar tili, къырымтатар тили | Tártaro da Crimeia | crh |
Latn |
Modelo cirílico | |
| Dakhótiyapi, Dakȟótiyapi | Dacota | dak |
Latn |
Modelo latino | |
| Douala | Duala | dua |
Latn |
Modelo latino | |
| Ikɔ Efik | Efik | efi |
Latn |
Modelo latino | |
| English (British) | Inglês (Reino Unido) | en-GB |
Latn |
Modelo latino | |
| Èʋegbe | Ewe | ee |
Latn |
Modelo latino | |
| føroyskt mál | Faroé | fo |
Latn |
Modelo latino | |
| Na Vosa Vakaviti | Fijiano | fj |
Latn |
Modelo latino | |
| fɔ̀ngbè | Fon | fon |
Latn |
Modelo latino | |
| Français canadien | Francês (Canadá) | fr-CA |
Latn |
Modelo latino | |
| Fulani, Fulah, Peul | Fula | ff |
Latn |
Modelo latino | |
| Gã | Ga | gaa |
Latn |
Modelo latino | |
| Luganda | Ganda | lg |
Latn |
Modelo latino | |
| Basa Gayo | Gayo | gay |
Latn |
Modelo latino | |
| Kiribati | Gilbertês | gil |
Latn |
Modelo latino | |
| Gothic | Gótico | got |
Latn |
Modelo latino | |
| Guaraní | Guarani | gn |
Latn |
Modelo latino | |
| Harshen/Halshen Hausa هَرْشَن هَوْسَ | Haúça | ha |
Latn |
Modelo latino | |
| ʻŌlelo Hawaiʻi | Havaiano | haw |
Latn |
Modelo latino | |
| Otjiherero | Herero | hz |
Latn |
Modelo latino | |
| Ilonggo | Hiligaynon | hil |
Latn |
Modelo latino | |
| Jaku Iban | Iban | iba |
Latn |
Modelo latino | |
| Asụsụ Igbo | Igbo | ig |
Latn |
Modelo latino | |
| Ilokano | Ilocano | ilo |
Latn |
Modelo latino | |
| Taqbaylit | Cabila | kab |
Latn |
Modelo latino | |
| Jingpho | Kachin | kac |
Latn |
Modelo latino | |
| Kalaallisut | Kalaallisut | kl |
Latn |
Modelo latino | |
| Kikamba | Kikamba | kam |
Latn |
Modelo latino | |
| Kanuri | Kanuri | kr |
Latn |
Modelo latino | |
| Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Caracalpaque | kaa |
Cyrl/Latn |
Modelo cirílico | |
| Ka Ktien Khasi | Khasi | kha |
Latn |
Modelo latino | |
| Gĩkũyũ | Kikuyu | ki |
Latn |
Modelo latino | |
| Kinyarwanda | Kinyarwanda | rw |
Latn |
Modelo latino | |
| коми кыв | Komi | kv |
Cyrl |
Modelo cirílico | |
| Kikongo | Conguês | kg |
Latn |
Modelo latino | |
| Kosraean | Kosraean | kos |
Latn |
Modelo latino | |
| Oshikwanyama | Cuanhama | kj |
Latn |
Modelo latino | |
| Ngala | Lingala | ln |
Latn |
Modelo latino | |
| Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds |
Latn |
Modelo latino | |
| siLozi | Lozi | loz |
Latn |
Modelo latino | |
| Kiluba | Luba-katanga | lu |
Latn |
Modelo latino | |
| Dholuo | Luo | luo |
Latn |
Modelo latino | |
| Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad |
Latn |
Modelo latino | |
| Malagasy | Malgaxe | mg |
Latn |
Modelo latino | |
| Mandinka, لغة مندنكا | Mandingo | man |
Latn |
Modelo latino | |
| Gaelg, Gailck | Manquês | gv |
Latn |
Modelo latino | |
| Te reo Māori | Maori | mi |
Latn |
Modelo latino | |
| Ebon | Marshalês | mh |
Latn |
Modelo latino | |
| Mɛnde yia | Mende | men |
Latn |
Modelo latino | |
| Middle English | Inglês médio | enm |
Latn |
Modelo latino | |
| Mittelhochdeutsch | Alto-alemão médio | gmh |
Latn |
Modelo latino | |
| Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min |
Latn |
Modelo latino | |
| Kanienʼkéha | Mohawk | moh |
Latn |
Modelo latino | |
| Nkundu | Mongo | lol |
Latn |
Modelo latino | |
| Nāhuatl | Nauatle | nah |
Latn |
Modelo latino | |
| Diné bizaad | Navajo | nv |
Latn |
Modelo latino | |
| Ndonga | Ndonga | ng |
Latn |
Modelo latino | |
| ko e vagahau Niuē | Niueano | niu |
Latn |
Modelo latino | |
| Zimbabwe Ndebele | Ndebele do norte | nd |
Latn |
Modelo latino | |
| Sesotho sa Leboa | Soto do Norte | nso |
Latn |
Modelo latino | |
| Chichewa, Chinyanja | Nianja | ny |
Latn |
Modelo latino | |
| Runyankore | Nyankole | nyn |
Latn |
Modelo latino | |
| Chitonga | Nyasa tonga | tog |
Latn |
Modelo latino | |
| Appolo | Nzima | nzi |
Latn |
Modelo latino | |
| Occitan, lenga d'òc, provençal | Occitânico | oc |
Latn |
Modelo latino | |
| Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojíbua | oj |
Latn |
Modelo latino | |
| Ænglisc, Englisc, Anglisc | Inglês antigo | ang |
Latn |
Modelo latino | |
| Franceis, François, Romanz | Francês antigo | fro |
Latn |
Modelo latino | |
| Diutisk, Althochdeutsch | Alto-alemão antigo | goh |
Latn |
Modelo latino | |
| Dǫnsk tunga | Nórdico antigo | non |
Latn |
Modelo latino | |
| Occitan ancian | Provençal antigo | pro |
Latn |
Modelo latino | |
| ирон ӕвзаг | Osseta | os |
Cyrl |
Modelo cirílico | |
| Kapampangan | Pampanga | pam |
Latn |
Modelo latino | |
| Salitan Pangasinan | Pangasinês | pag |
Latn |
Modelo latino | |
| Papiamentu | Papiamento | pap |
Latn |
Modelo latino | |
| Português (Portugal) | Português (europeu) | pt-PT |
Latn |
Modelo latino | |
| Kechua / Runa Simi | Quíchua | qu |
Latn |
Modelo latino | |
| Rumantsch | Romanche | rm |
Latn |
Modelo latino | |
| Romani čhib | Romani | rom |
Latn |
Modelo latino | |
| Ikirundi | Rundi | rn |
Latn |
Modelo latino | |
| Sakha | Sakha | sah |
Cyrl |
Modelo cirílico | |
| Gagana faʻa Sāmoa | Samoano | sm |
Latn |
Modelo latino | |
| yângâ tî sängö | Sango | sg |
Latn |
Modelo latino | |
| (Braid) Scots, Lallans, Doric | Escocês | sco |
Latn |
Modelo latino | |
| Gàidhlig | Gaélico Escocês | gd |
Latn |
Modelo latino | |
| chiShona | Shona | sn |
Latn |
Modelo latino | |
| Songhay | Songai | son |
Latn |
Modelo latino | |
| Sesotho | Sesoto | st |
Latn |
Modelo latino | |
| Español (Latinoamérica) | Espanhol (latino-americano) | es-419 |
Latn |
Modelo latino | |
| ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanês | su |
Latn |
Modelo latino | |
| siSwati | Suazi | ss |
Latn |
Modelo latino | |
| Reo Tahiti | Taitiano | ty |
Latn |
Modelo latino | |
| тоҷикӣ | Tajique | tg |
Cyrl |
Modelo cirílico | |
| татар теле | Tártaro | tt |
Cyrl/Latn |
Modelo cirílico | |
| KʌThemnɛ | Temne | tem |
Latn |
Modelo latino | |
| lea faka-Tonga | Tonga | to |
Latn |
Modelo latino | |
| Xitsonga | Tsonga | ts |
Latn |
Modelo latino | |
| Setswana | Tsuana | tn |
Latn |
Modelo latino | |
| Türkmençe | Turcomenistão | tk |
Latn |
Modelo cirílico | |
| удмурт кыл | Udmurte | udm |
Cyrl |
Modelo cirílico | |
| Tshivenḓa | Venda | ve |
Latn |
Modelo latino | |
| Vod | Vótico | vot |
Cyrl/Latn |
Modelo cirílico | |
| Frysk | Frísico ocidental | fy |
Latn |
Modelo latino | |
| Wolof | Jalofo | wo |
Latn |
Modelo latino | |
| isiXhosa | Xhosa | xh |
Latn |
Modelo latino | |
| Èdè Yorùbá | Iorubá | yo |
Latn |
Modelo latino | |
| Diidxazá | Zapoteca | zap |
Latn |
Modelo latino |
Scripts de escrita manual
Os seguintes scripts são suportados para o reconhecimento de escrita manual. Consulte as tabelas de idiomas acima para ver os idiomas que usam cada escrita.
| Script | Nome | Nível de apoio técnico |
|---|---|---|
Beng |
Bengali | Experimental |
Cyrl |
Cirílico | Experimental |
Deva |
Devanagari | Experimental |
Grek |
Grego | Experimental |
Hani |
Chinês | Experimental |
Jpan |
Japonês | Suportado |
Kore |
Coreano | Suportado |
Latn |
Latim | Suportado |
vi |
Vietnamita | Experimental |