O recurso de reconhecimento de texto do Google Distributed Cloud (GDC) air-gapped detecta vários idiomas e pode detectar vários idiomas em uma única imagem.
É possível especificar uma dica de idioma opcional para uma solicitação de API de reconhecimento óptico de caracteres (OCR). Por exemplo, você pode fornecer uma dica quando a API tiver dificuldade para detectar o idioma usado na imagem.
Para especificar dicas de idioma opcionais, adicione-as à sua solicitação BatchAnnotateImages ou
BatchAnnotateFiles no campo image_context como uma lista de valores no
campo language_hints.
O formato language_hints usa as seguintes diretrizes de formatação de tag de idioma BCP 47:
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
Por exemplo, a dica de idioma en-t-i0-handwrit indica que o idioma é "Inglês transformado da escrita à mão".
O recurso de reconhecimento de texto oferece suporte a três níveis de idioma:
- Os idiomas compatíveis são priorizados com avaliação regular de desempenho.
- Os idiomas experimentais estão em desenvolvimento ativo. Não têm avaliações de performance regulares.
- Os idiomas mapeados são compatíveis com o mapeamento para outro código de idioma ou um reconhecedor geral de caracteres. Por exemplo,
en-GBé compatível, mas não é tratado de forma diferente deenpara reconhecimento de texto. O serviço de OCR tenta retornar o código de idioma mapeado correto no campoentity. No entanto, os idiomas mapeados têm mais chance de serem identificados incorretamente do que os idiomas com suporte total ou experimental.
Um dos principais recursos do serviço de OCR é a capacidade de detectar e extrair texto de imagens. Por exemplo, um texto escrito à mão. Para uma lista de scripts de escrita manual compatíveis com o reconhecimento de escrita manual, consulte Scripts de escrita manual.
Idiomas disponíveis
O recurso de reconhecimento de texto prioriza e avalia regularmente os idiomas compatíveis. Para filtrar por idioma, digite um idioma no campo a seguir:
| Idioma | Idioma (nome em português) | Código de dicas de idioma | Script e observações |
|---|---|---|---|
| Africâner | Africâner | af |
Latn |
| shqip | Albanês | sq |
Latn |
| العربية | Árabe | ar |
Arabrabe; Padrão moderno |
| беларуская | Bielorrusso | be |
Cyrl |
| български | Búlgaro | bg |
Cyrl |
| Catalão | Catalão | ca |
Latn |
| 普通话 | Chinês | zh |
Hans/Hant |
| Hrvatski | Croata | hr |
Latn |
| Čeština | Tcheco | cs |
Latn |
| Dansk | Dinamarquês | da |
Latn |
| Nederlands | Holandês | nl |
Latn |
| Inglês | Inglês | en |
Latn; Americano |
| Eesti keel | Estoniano | et |
Latn |
| Filipino | Filipino | fil ou tl |
Latn |
| Suomi | Finlandês | fi |
Latn |
| Français | Francês | fr |
Latn; Europeu |
| Deutsch | Alemão | de |
Latn |
| Ελληνικά | Grego | el |
Grego |
| עברית | Hebraico | iw |
Hebr |
| हिन्दी | Hindi | hi |
Deva |
| Magyar | Húngaro | hu |
Latn |
| Íslenska | Islandês | is |
Latn |
| Bahasa Indonesia | Indonésio | id |
Latn |
| Italiano | Italiano | it |
Latn |
| 日本語 | Japonês | ja |
Japão |
| 한국어 | Coreano | ko |
Kore |
| Latviešu | Letão | lv |
Latn |
| Lietuvių | Lituano | lt |
Latn |
| Македонски | Macedônio | mk |
Cyrl |
| Bahasa Melayu | Malaio | ms |
Latn |
| മലയാളം | Malaiala | ml |
Mlym |
| मराठी | Marati | mr |
Deva |
| नेपाली | Nepalês | ne |
Deva |
| Norsk | Norueguês | no |
Latn; Bokmål |
| فارسی | Persa | fa |
Arab |
| Polski | Polonês | pl |
Latn |
| Português | Português | pt |
Latn; Brasileiro |
| Română | Romeno | ro |
Latn |
| Pусский | Russo | ru |
Cyrl |
| Русский (старая орфография) | Russo | ru-PETR1708 |
Cyrl; Ortografia antiga |
| Српски | Sérvio | sr |
Cyrl & Latn |
| Српски (латиница) | Sérvio | sr-Latn |
Latn |
| Slovenčina | Eslovaco | sk |
Latn |
| Slovenščina | Esloveno | sl |
Latn |
| Español | Espanhol | es |
Latn; Europeu |
| Svenska | Sueco | sv |
Latn |
| Tagalo | Tagalo | tl |
Latn |
| Türkçe | Turco | tr |
Latn |
| Українськa | Ucraniano | uk |
Cyrl |
| Tiếng Việt | Vietnamita | vi |
Latn |
| Ídiche | Ídiche | yi |
Hebr |
Idiomas experimentais
Os idiomas experimentais estão em desenvolvimento ativo e não são avaliados. Para filtrar por idioma, digite um idioma no campo a seguir:
| Idioma | Idioma (nome em português) | Código de dicas de idioma | Script e observações |
|---|---|---|---|
| Αρχαία ελληνικά | grego antigo | grc |
Grego |
| Azərbaycan | Azerbaijano | az |
Latn |
| Azərbaycan (qədim yazı) | Azerbaijano | az-Cyrl |
Cyrl; ortografia antiga |
| Euskara | Basco | eu |
Latn |
| Bosanski | Bósnio | bs |
Latn |
| Cebuano | Cebuano | ceb |
Latn |
| Esperanto | Esperanto | eo |
Latn |
| Galego | Galego | gl |
Latn |
| ქართული | Georgiano | ka |
Geor |
| Kreyòl Ayisyen | Crioulo haitiano | ht |
Latn |
| Gaeilge | Irlandês | ga |
Latn |
| Jawa | Javanês | jv |
Latn |
| Қазақ | Cazaque | kk |
Cyrl |
| Quirguiz | Quirguiz | ky |
Cyrl |
| Latim | Latim | la |
Latn |
| Malti | Maltês | mt |
Latn |
| Монгол | Mongol | mn |
Cyrl |
| پښتو | Pashto | ps |
Arab |
| संस्कृतम् | Sânscrito | sa |
Deva |
| Suaíli | Suaíli | sw |
Latn |
| اردو | Urdu | ur |
Arab |
| oʻzbekcha | Usbeque | uz |
Latn; Latim |
| oʻzbekcha | Usbeque | uz-Cyrl |
Cyrl; ortografia antiga |
| Cymraeg | Galês | cy |
Latn |
| IsiZulu | Zulu | zu |
Latn |
Idiomas mapeados
Os idiomas mapeados estão associados a outro código de idioma ou a um reconhecedor geral de caracteres. Para filtrar por idioma, digite um idioma no seguinte campo:
| Idioma | Idioma (nome em português) | Código de dicas de idioma | Script e observações | Mapeado para |
|---|---|---|---|---|
| بهسا | Achém | ace |
Latn | Modelo de script latino |
| Lwo | Acholi | ach |
Latn | Modelo de script latino |
| Dangme | Adangme | ada |
Latn | Modelo de script latino |
| Akan | Akan | ak |
Latn | Modelo de script latino |
| Anicinâbemowin | Algonquinian | alg |
Latn | Modelo de script latino |
| Mapudungu | Araucanian/Mapuche | arn |
Latn | Modelo de script latino |
| Asturianu | Asturiano | ast |
Latn | Modelo de script latino |
| Dene | Athabaskan | ath |
Latn | Modelo de script latino |
| Aymar aru | Aimará | ay |
Latn | Modelo de script latino |
| Bhāṣa Bali | Balinês | ban |
Latn | Modelo de script latino |
| Bamanankan | Bambara | bm |
Latn | Modelo de script latino |
| Narrow Bantu | Bantu | bnt |
Latn | Modelo de script latino |
| башҡорт теле | Bashkir | ba |
Cyrl | Modelo de script Cirílico |
| Toba–Batak | Batak | btk |
Latn | Modelo de script latino |
| Chibemba | Bemba | bem |
Latn | Modelo de script latino |
| Bikol Naga | Bikol | bik |
Latn | Modelo de script latino |
| Bichelamar | Bislama | bi |
Latn | Modelo de script latino |
| Brezhoneg | Bretão | br |
Latn | Modelo de script latino |
| нохчийн мотт / noxçiyn mott | Chechenos | ce |
Cyrl | Modelo de script Cirílico |
| 汉语 | Chinês | zh-Hans |
Hans Simplificado Mandarim | zh |
| 漢語 | Chinês | zh-Hant |
Hant Tradicional Mandarim | zh |
| 普通話 | Chinês | zh-Hant-HK |
Hant; Mandarim; Hong Kong | zh |
| Chahta' | Choctaw | cho |
Latn | Modelo de script latino |
| Чӑвашла | Chuvache | cv |
Cyrl | Modelo de script Cirílico |
| Cree–Montagnais–Naskapi | Cree | cr |
Latn | Modelo de script latino |
| Mvskoke | Creek | mus |
Latn | Modelo de script latino |
| qırımtatar tili, къырымтатар тили | Tártaro da Crimeia | crh |
Latn | Modelo de script Cirílico |
| Dakhótiyapi, Dakȟótiyapi | Dakota | dak |
Latn | Modelo de script latino |
| Douala | Duala | dua |
Latn | Modelo de script latino |
| Ikɔ Efik | Efik | efi |
Latn | Modelo de script latino |
| Inglês (britânico) | Inglês | en-GB |
Latn; Britânica | en |
| Èʋegbe | Ewe | ee |
Latn | Modelo de script latino |
| føroyskt mál | Faroês | fo |
Latn | Modelo de script latino |
| Na Vosa Vakaviti | Fijiano | fj |
Latn | Modelo de script latino |
| fɔ̀ngbè | Fon | fon |
Latn | Modelo de script latino |
| Français canadien | Francês | fr-CA |
Latn; Canadá | fr |
| Fulani, Fulah, Peul | Fulah | ff |
Latn | Modelo de script latino |
| Gã | Ga | gaa |
Latn | Modelo de script latino |
| Luganda | Ganda | lg |
Latn | Modelo de script latino |
| Basa Gayo | Gayo | gay |
Latn | Modelo de script latino |
| Kiribati | Gilbertese | gil |
Latn | Modelo de script latino |
| Gothic | Gótico | got |
Latn | Modelo de script latino |
| Guaraní | Guarani | gn |
Latn | Modelo de script latino |
| Harshen/Halshen Hausa هَرْشَن هَوْسَ | Hauçá | ha |
Latn | Modelo de script latino |
| ʻŌlelo Hawaiʻi | Havaiano | haw |
Latn | Modelo de script latino |
| Otjiherero | Herero | hz |
Latn | Modelo de script latino |
| Ilonggo | Hiligaynon | hil |
Latn | Modelo de script latino |
| Jaku Iban | Iban | iba |
Latn | Modelo de script latino |
| Asụsụ Igbo | Ibo | ig |
Latn | Modelo de script latino |
| Ilokano | Iloko | ilo |
Latn | Modelo de script latino |
| Taqbaylit | Kabyle | kab |
Latn | Modelo de script latino |
| Jingpho | Kachin | kac |
Latn | Modelo de script latino |
| Groenlandês | Groenlandês | kl |
Latn | Modelo de script latino |
| Kikamba | Kamba | kam |
Latn | Modelo de script latino |
| Kanuri | Kanuri | kr |
Latn | Modelo de script latino |
| Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Kara-Kalpak | kaa |
Cyrl/Latn | Modelo de script Cirílico |
| Ka Ktien Khasi | Khasi | kha |
Latn | Modelo de script latino |
| Gĩkũyũ | Kikuyu | ki |
Latn | Modelo de script latino |
| Kinyarwanda | Quiniaruanda | rw |
Latn | Modelo de script latino |
| коми кыв | Komi | kv |
Cyrl | Modelo de script Cirílico |
| Kikongo | Quicongo | kg |
Latn | Modelo de script latino |
| Kosraean | Kosraean | kos |
Latn | Modelo de script latino |
| Oshikwanyama | Kuanyama | kj |
Latn | Modelo de script latino |
| Ngala | Lingala | ln |
Latn | Modelo de script latino |
| Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds |
Latn | Modelo de script latino |
| siLozi | Lozi | loz |
Latn | Modelo de script latino |
| Kiluba | Luba-katanga | lu |
Latn | Modelo de script latino |
| Dholuo | Luo | luo |
Latn | Modelo de script latino |
| Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad |
Latn | Modelo de script latino |
| Malgaxe | Malgaxe | mg |
Latn | Modelo de script latino |
| Mandinka, لغة مندنكا | Mandingo | man |
Latn | Modelo de script latino |
| Gaelg, Gailck | Manx | gv |
Latn | Modelo de script latino |
| Te reo Māori | Maori | mi |
Latn | Modelo de script latino |
| Ebon | Marshallese | mh |
Latn | Modelo de script latino |
| Mɛnde yia | Mende | men |
Latn | Modelo de script latino |
| Inglês médio | Inglês médio | enm |
Latn | Modelo de script latino |
| Mittelhochdeutsch | Alto-alemão médio | gmh |
Latn | Modelo de script latino |
| Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min |
Latn | Modelo de script latino |
| Kanienʼkéha | Mohawk | moh |
Latn | Modelo de script latino |
| Nkundu | Mongo | lol |
Latn | Modelo de script latino |
| Nāhuatl | Náuatle | nah |
Latn | Modelo de script latino |
| Diné bizaad | Navajo | nv |
Latn | Modelo de script latino |
| Ndonga | Ndonga | ng |
Latn | Modelo de script latino |
| ko e vagahau Niuē | Niueano | niu |
Latn | Modelo de script latino |
| Zimbabwe Ndebele | Ndebele do norte | nd |
Latn | Modelo de script latino |
| Sesotho sa Leboa | Soto do norte | nso |
Latn | Modelo de script latino |
| Chichewa, Chinyanja | Nianja | ny |
Latn | Modelo de script latino |
| Runyankore | Nyankole | nyn |
Latn | Modelo de script latino |
| Chitonga | Nyasa Tonga | tog |
Latn | Modelo de script latino |
| Appolo | Nzima | nzi |
Latn | Modelo de script latino |
| Occitan, lenga d'òc, provençal | Occitânico | oc |
Latn | Modelo de script latino |
| Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj |
Latn | Modelo de script latino |
| Ænglisc, Englisc, Anglisc | Inglês antigo | ang |
Latn | Modelo de script latino |
| Franceis, François, Romanz | Francês antigo | fro |
Latn | Modelo de script latino |
| Diutisk, Althochdeutsch | Alto alemão antigo | goh |
Latn | Modelo de script latino |
| Dǫnsk tunga | Norueguês antigo | non |
Latn | Modelo de script latino |
| Anciano occitano | Provençal antigo | pro |
Latn | Modelo de script latino |
| ирон ӕвзаг | Ossetic | os |
Cyrl | Modelo de script Cirílico |
| Kapampangan | Pampanga | pam |
Latn | Modelo de script latino |
| Salitan Pangasinan | Língua pangasiana | pag |
Latn | Modelo de script latino |
| Papiamentu | Papiamento | pap |
Latn | Modelo de script latino |
| Português (Portugal) | Português | pt-PT |
Latn; Europeu | pt |
| Kechua / Runa Simi | Quíchua | qu |
Latn | Modelo de script latino |
| Rumantsch | Romanche | rm |
Latn | Modelo de script latino |
| Romani čhib | Romani | rom |
Latn | Modelo de script latino |
| Ikirundi | Rundi | rn |
Latn | Modelo de script latino |
| Sakha | Sakha | sah |
Cyrl | Modelo de script Cirílico |
| Gagana faʻa Sāmoa | Samoano | sm |
Latn | Modelo de script latino |
| yângâ tî sängö | Sango | sg |
Latn | Modelo de script latino |
| (Trança) Escocês, Lallans, Dórico | Scots | sco |
Latn | Modelo de script latino |
| Gàidhlig | Gaélico escocês | gd |
Latn | Modelo de script latino |
| chiShona | Chona | sn |
Latn | Modelo de script latino |
| Songhay | Songhai | son |
Latn | Modelo de script latino |
| Sesoto | Soto do sul | st |
Latn | Modelo de script latino |
| Espanhol (América Latina) | Espanhol | es-419 |
Latn; América Latina | es |
| ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanês | su |
Latn | Modelo de script latino |
| siSwati | Swati | ss |
Latn | Modelo de script latino |
| Reo Tahiti | Taitiano | ty |
Latn | Modelo de script latino |
| тоҷикӣ | Tadjique | tg |
Cyrl | Modelo de script Cirílico |
| татар теле | Tártaro | tt |
Cyrl/Latn | Modelo de script Cirílico |
| KʌThemnɛ | Temne | tem |
Latn | Modelo de script latino |
| lea faka-Tonga | Tonga | to |
Latn | Modelo de script latino |
| Xitsonga | Tsonga | ts |
Latn | Modelo de script latino |
| Setsuana | Tswana | tn |
Latn | Modelo de script latino |
| Türkmençe | Turcomano | tk |
Latn | Modelo de script Cirílico |
| удмурт кыл | Udmurte | udm |
Cyrl | Modelo de script Cirílico |
| Tshivenḓa | Venda | ve |
Latn | Modelo de script latino |
| Vod | Votic | vot |
Cyrl/Latn | Modelo de script Cirílico |
| Frysk | Frísio ocidental | fy |
Latn | Modelo de script latino |
| Wolof | Wolof | wo |
Latn | Modelo de script latino |
| isiXhosa | Xhosa | xh |
Latn | Modelo de script latino |
| Èdè Yorùbá | Iorubá | yo |
Latn | Modelo de script latino |
| Diidxazá | Zapotec | zap |
Latn | Modelo de script latino |
Scripts de escrita à mão
Esta seção contém os scripts compatíveis com o reconhecimento de escrita manual. Para saber quais idiomas usam cada script, consulte as tabelas de idiomas compatíveis, experimentais e mapeados. Para filtrar por script, digite um script no campo a seguir:
| Tag de script | Nome | Nível de suporte |
|---|---|---|
| Beng | Bengalês | Experimental |
| Cyrl | Cirílico | Experimental |
| Deva | Devanágari | Experimental |
| Grego | Grego | Experimental |
| Hani | Chinês | Experimental |
| Japão | Japonês | Compatível |
| Kore | Coreano | Compatível |
| Latn | Latim | Compatível |
| vi | Vietnamita | Experimental |