O recurso de reconhecimento de texto do Google Distributed Cloud (GDC) air-gapped detecta vários idiomas e pode detectar vários idiomas em uma única imagem.
É possível especificar uma dica de idioma opcional para uma solicitação de API de reconhecimento óptico de caracteres (OCR). Por exemplo, você pode fornecer uma dica quando a API tiver dificuldade para detectar o idioma usado na imagem.
Para especificar dicas de idioma opcionais, adicione-as à sua solicitação BatchAnnotateImages
ou
BatchAnnotateFiles
no campo image_context
como uma lista de valores no
campo language_hints
.
O formato language_hints
usa as seguintes diretrizes de formatação de tag de idioma BCP 47
:
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
Por exemplo, a dica de idioma en-t-i0-handwrit
indica que o idioma é "Inglês transformado da escrita à mão".
O recurso de reconhecimento de texto oferece suporte a três níveis de idioma:
- Os idiomas compatíveis são priorizados com avaliação regular de desempenho.
- Os idiomas experimentais estão em desenvolvimento ativo. Não têm avaliações de performance regulares.
- Os idiomas mapeados são compatíveis com o mapeamento para outro código de idioma ou um reconhecedor geral de caracteres. Por exemplo,
en-GB
é compatível, mas não é tratado de forma diferente deen
para reconhecimento de texto. O serviço de OCR tenta retornar o código de idioma mapeado correto no campoentity
. No entanto, os idiomas mapeados têm mais chance de serem identificados incorretamente do que os idiomas com suporte total ou experimental.
Um dos principais recursos do serviço de OCR é a capacidade de detectar e extrair texto de imagens. Por exemplo, um texto escrito à mão. Para uma lista de scripts de escrita manual compatíveis com o reconhecimento de escrita manual, consulte Scripts de escrita manual.
Idiomas disponíveis
O recurso de reconhecimento de texto prioriza e avalia regularmente os idiomas compatíveis. Para filtrar por idioma, digite um idioma no campo a seguir:
Idioma | Idioma (nome em português) | Código de dicas de idioma | Script e observações |
---|---|---|---|
Africâner | Africâner | af |
Latn |
shqip | Albanês | sq |
Latn |
العربية | Árabe | ar |
Arabrabe; Padrão moderno |
беларуская | Bielorrusso | be |
Cyrl |
български | Búlgaro | bg |
Cyrl |
Catalão | Catalão | ca |
Latn |
普通话 | Chinês | zh |
Hans/Hant |
Hrvatski | Croata | hr |
Latn |
Čeština | Tcheco | cs |
Latn |
Dansk | Dinamarquês | da |
Latn |
Nederlands | Holandês | nl |
Latn |
Inglês | Inglês | en |
Latn; Americano |
Eesti keel | Estoniano | et |
Latn |
Filipino | Filipino | fil ou tl |
Latn |
Suomi | Finlandês | fi |
Latn |
Français | Francês | fr |
Latn; Europeu |
Deutsch | Alemão | de |
Latn |
Ελληνικά | Grego | el |
Grego |
עברית | Hebraico | iw |
Hebr |
हिन्दी | Hindi | hi |
Deva |
Magyar | Húngaro | hu |
Latn |
Íslenska | Islandês | is |
Latn |
Bahasa Indonesia | Indonésio | id |
Latn |
Italiano | Italiano | it |
Latn |
日本語 | Japonês | ja |
Japão |
한국어 | Coreano | ko |
Kore |
Latviešu | Letão | lv |
Latn |
Lietuvių | Lituano | lt |
Latn |
Македонски | Macedônio | mk |
Cyrl |
Bahasa Melayu | Malaio | ms |
Latn |
മലയാളം | Malaiala | ml |
Mlym |
मराठी | Marati | mr |
Deva |
नेपाली | Nepalês | ne |
Deva |
Norsk | Norueguês | no |
Latn; Bokmål |
فارسی | Persa | fa |
Arab |
Polski | Polonês | pl |
Latn |
Português | Português | pt |
Latn; Brasileiro |
Română | Romeno | ro |
Latn |
Pусский | Russo | ru |
Cyrl |
Русский (старая орфография) | Russo | ru-PETR1708 |
Cyrl; Ortografia antiga |
Српски | Sérvio | sr |
Cyrl & Latn |
Српски (латиница) | Sérvio | sr-Latn |
Latn |
Slovenčina | Eslovaco | sk |
Latn |
Slovenščina | Esloveno | sl |
Latn |
Español | Espanhol | es |
Latn; Europeu |
Svenska | Sueco | sv |
Latn |
Tagalo | Tagalo | tl |
Latn |
Türkçe | Turco | tr |
Latn |
Українськa | Ucraniano | uk |
Cyrl |
Tiếng Việt | Vietnamita | vi |
Latn |
Ídiche | Ídiche | yi |
Hebr |
Idiomas experimentais
Os idiomas experimentais estão em desenvolvimento ativo e não são avaliados. Para filtrar por idioma, digite um idioma no campo a seguir:
Idioma | Idioma (nome em português) | Código de dicas de idioma | Script e observações |
---|---|---|---|
Αρχαία ελληνικά | grego antigo | grc |
Grego |
Azərbaycan | Azerbaijano | az |
Latn |
Azərbaycan (qədim yazı) | Azerbaijano | az-Cyrl |
Cyrl; ortografia antiga |
Euskara | Basco | eu |
Latn |
Bosanski | Bósnio | bs |
Latn |
Cebuano | Cebuano | ceb |
Latn |
Esperanto | Esperanto | eo |
Latn |
Galego | Galego | gl |
Latn |
ქართული | Georgiano | ka |
Geor |
Kreyòl Ayisyen | Crioulo haitiano | ht |
Latn |
Gaeilge | Irlandês | ga |
Latn |
Jawa | Javanês | jv |
Latn |
Қазақ | Cazaque | kk |
Cyrl |
Quirguiz | Quirguiz | ky |
Cyrl |
Latim | Latim | la |
Latn |
Malti | Maltês | mt |
Latn |
Монгол | Mongol | mn |
Cyrl |
پښتو | Pashto | ps |
Arab |
संस्कृतम् | Sânscrito | sa |
Deva |
Suaíli | Suaíli | sw |
Latn |
اردو | Urdu | ur |
Arab |
oʻzbekcha | Usbeque | uz |
Latn; Latim |
oʻzbekcha | Usbeque | uz-Cyrl |
Cyrl; ortografia antiga |
Cymraeg | Galês | cy |
Latn |
IsiZulu | Zulu | zu |
Latn |
Idiomas mapeados
Os idiomas mapeados estão associados a outro código de idioma ou a um reconhecedor geral de caracteres. Para filtrar por idioma, digite um idioma no seguinte campo:
Idioma | Idioma (nome em português) | Código de dicas de idioma | Script e observações | Mapeado para |
---|---|---|---|---|
بهسا | Achém | ace |
Latn | Modelo de script latino |
Lwo | Acholi | ach |
Latn | Modelo de script latino |
Dangme | Adangme | ada |
Latn | Modelo de script latino |
Akan | Akan | ak |
Latn | Modelo de script latino |
Anicinâbemowin | Algonquinian | alg |
Latn | Modelo de script latino |
Mapudungu | Araucanian/Mapuche | arn |
Latn | Modelo de script latino |
Asturianu | Asturiano | ast |
Latn | Modelo de script latino |
Dene | Athabaskan | ath |
Latn | Modelo de script latino |
Aymar aru | Aimará | ay |
Latn | Modelo de script latino |
Bhāṣa Bali | Balinês | ban |
Latn | Modelo de script latino |
Bamanankan | Bambara | bm |
Latn | Modelo de script latino |
Narrow Bantu | Bantu | bnt |
Latn | Modelo de script latino |
башҡорт теле | Bashkir | ba |
Cyrl | Modelo de script Cirílico |
Toba–Batak | Batak | btk |
Latn | Modelo de script latino |
Chibemba | Bemba | bem |
Latn | Modelo de script latino |
Bikol Naga | Bikol | bik |
Latn | Modelo de script latino |
Bichelamar | Bislama | bi |
Latn | Modelo de script latino |
Brezhoneg | Bretão | br |
Latn | Modelo de script latino |
нохчийн мотт / noxçiyn mott | Chechenos | ce |
Cyrl | Modelo de script Cirílico |
汉语 | Chinês | zh-Hans |
Hans Simplificado Mandarim | zh |
漢語 | Chinês | zh-Hant |
Hant Tradicional Mandarim | zh |
普通話 | Chinês | zh-Hant-HK |
Hant; Mandarim; Hong Kong | zh |
Chahta' | Choctaw | cho |
Latn | Modelo de script latino |
Чӑвашла | Chuvache | cv |
Cyrl | Modelo de script Cirílico |
Cree–Montagnais–Naskapi | Cree | cr |
Latn | Modelo de script latino |
Mvskoke | Creek | mus |
Latn | Modelo de script latino |
qırımtatar tili, къырымтатар тили | Tártaro da Crimeia | crh |
Latn | Modelo de script Cirílico |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak |
Latn | Modelo de script latino |
Douala | Duala | dua |
Latn | Modelo de script latino |
Ikɔ Efik | Efik | efi |
Latn | Modelo de script latino |
Inglês (britânico) | Inglês | en-GB |
Latn; Britânica | en |
Èʋegbe | Ewe | ee |
Latn | Modelo de script latino |
føroyskt mál | Faroês | fo |
Latn | Modelo de script latino |
Na Vosa Vakaviti | Fijiano | fj |
Latn | Modelo de script latino |
fɔ̀ngbè | Fon | fon |
Latn | Modelo de script latino |
Français canadien | Francês | fr-CA |
Latn; Canadá | fr |
Fulani, Fulah, Peul | Fulah | ff |
Latn | Modelo de script latino |
Gã | Ga | gaa |
Latn | Modelo de script latino |
Luganda | Ganda | lg |
Latn | Modelo de script latino |
Basa Gayo | Gayo | gay |
Latn | Modelo de script latino |
Kiribati | Gilbertese | gil |
Latn | Modelo de script latino |
Gothic | Gótico | got |
Latn | Modelo de script latino |
Guaraní | Guarani | gn |
Latn | Modelo de script latino |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Hauçá | ha |
Latn | Modelo de script latino |
ʻŌlelo Hawaiʻi | Havaiano | haw |
Latn | Modelo de script latino |
Otjiherero | Herero | hz |
Latn | Modelo de script latino |
Ilonggo | Hiligaynon | hil |
Latn | Modelo de script latino |
Jaku Iban | Iban | iba |
Latn | Modelo de script latino |
Asụsụ Igbo | Ibo | ig |
Latn | Modelo de script latino |
Ilokano | Iloko | ilo |
Latn | Modelo de script latino |
Taqbaylit | Kabyle | kab |
Latn | Modelo de script latino |
Jingpho | Kachin | kac |
Latn | Modelo de script latino |
Groenlandês | Groenlandês | kl |
Latn | Modelo de script latino |
Kikamba | Kamba | kam |
Latn | Modelo de script latino |
Kanuri | Kanuri | kr |
Latn | Modelo de script latino |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Kara-Kalpak | kaa |
Cyrl/Latn | Modelo de script Cirílico |
Ka Ktien Khasi | Khasi | kha |
Latn | Modelo de script latino |
Gĩkũyũ | Kikuyu | ki |
Latn | Modelo de script latino |
Kinyarwanda | Quiniaruanda | rw |
Latn | Modelo de script latino |
коми кыв | Komi | kv |
Cyrl | Modelo de script Cirílico |
Kikongo | Quicongo | kg |
Latn | Modelo de script latino |
Kosraean | Kosraean | kos |
Latn | Modelo de script latino |
Oshikwanyama | Kuanyama | kj |
Latn | Modelo de script latino |
Ngala | Lingala | ln |
Latn | Modelo de script latino |
Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds |
Latn | Modelo de script latino |
siLozi | Lozi | loz |
Latn | Modelo de script latino |
Kiluba | Luba-katanga | lu |
Latn | Modelo de script latino |
Dholuo | Luo | luo |
Latn | Modelo de script latino |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad |
Latn | Modelo de script latino |
Malgaxe | Malgaxe | mg |
Latn | Modelo de script latino |
Mandinka, لغة مندنكا | Mandingo | man |
Latn | Modelo de script latino |
Gaelg, Gailck | Manx | gv |
Latn | Modelo de script latino |
Te reo Māori | Maori | mi |
Latn | Modelo de script latino |
Ebon | Marshallese | mh |
Latn | Modelo de script latino |
Mɛnde yia | Mende | men |
Latn | Modelo de script latino |
Inglês médio | Inglês médio | enm |
Latn | Modelo de script latino |
Mittelhochdeutsch | Alto-alemão médio | gmh |
Latn | Modelo de script latino |
Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min |
Latn | Modelo de script latino |
Kanienʼkéha | Mohawk | moh |
Latn | Modelo de script latino |
Nkundu | Mongo | lol |
Latn | Modelo de script latino |
Nāhuatl | Náuatle | nah |
Latn | Modelo de script latino |
Diné bizaad | Navajo | nv |
Latn | Modelo de script latino |
Ndonga | Ndonga | ng |
Latn | Modelo de script latino |
ko e vagahau Niuē | Niueano | niu |
Latn | Modelo de script latino |
Zimbabwe Ndebele | Ndebele do norte | nd |
Latn | Modelo de script latino |
Sesotho sa Leboa | Soto do norte | nso |
Latn | Modelo de script latino |
Chichewa, Chinyanja | Nianja | ny |
Latn | Modelo de script latino |
Runyankore | Nyankole | nyn |
Latn | Modelo de script latino |
Chitonga | Nyasa Tonga | tog |
Latn | Modelo de script latino |
Appolo | Nzima | nzi |
Latn | Modelo de script latino |
Occitan, lenga d'òc, provençal | Occitânico | oc |
Latn | Modelo de script latino |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj |
Latn | Modelo de script latino |
Ænglisc, Englisc, Anglisc | Inglês antigo | ang |
Latn | Modelo de script latino |
Franceis, François, Romanz | Francês antigo | fro |
Latn | Modelo de script latino |
Diutisk, Althochdeutsch | Alto alemão antigo | goh |
Latn | Modelo de script latino |
Dǫnsk tunga | Norueguês antigo | non |
Latn | Modelo de script latino |
Anciano occitano | Provençal antigo | pro |
Latn | Modelo de script latino |
ирон ӕвзаг | Ossetic | os |
Cyrl | Modelo de script Cirílico |
Kapampangan | Pampanga | pam |
Latn | Modelo de script latino |
Salitan Pangasinan | Língua pangasiana | pag |
Latn | Modelo de script latino |
Papiamentu | Papiamento | pap |
Latn | Modelo de script latino |
Português (Portugal) | Português | pt-PT |
Latn; Europeu | pt |
Kechua / Runa Simi | Quíchua | qu |
Latn | Modelo de script latino |
Rumantsch | Romanche | rm |
Latn | Modelo de script latino |
Romani čhib | Romani | rom |
Latn | Modelo de script latino |
Ikirundi | Rundi | rn |
Latn | Modelo de script latino |
Sakha | Sakha | sah |
Cyrl | Modelo de script Cirílico |
Gagana faʻa Sāmoa | Samoano | sm |
Latn | Modelo de script latino |
yângâ tî sängö | Sango | sg |
Latn | Modelo de script latino |
(Trança) Escocês, Lallans, Dórico | Scots | sco |
Latn | Modelo de script latino |
Gàidhlig | Gaélico escocês | gd |
Latn | Modelo de script latino |
chiShona | Chona | sn |
Latn | Modelo de script latino |
Songhay | Songhai | son |
Latn | Modelo de script latino |
Sesoto | Soto do sul | st |
Latn | Modelo de script latino |
Espanhol (América Latina) | Espanhol | es-419 |
Latn; América Latina | es |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanês | su |
Latn | Modelo de script latino |
siSwati | Swati | ss |
Latn | Modelo de script latino |
Reo Tahiti | Taitiano | ty |
Latn | Modelo de script latino |
тоҷикӣ | Tadjique | tg |
Cyrl | Modelo de script Cirílico |
татар теле | Tártaro | tt |
Cyrl/Latn | Modelo de script Cirílico |
KʌThemnɛ | Temne | tem |
Latn | Modelo de script latino |
lea faka-Tonga | Tonga | to |
Latn | Modelo de script latino |
Xitsonga | Tsonga | ts |
Latn | Modelo de script latino |
Setsuana | Tswana | tn |
Latn | Modelo de script latino |
Türkmençe | Turcomano | tk |
Latn | Modelo de script Cirílico |
удмурт кыл | Udmurte | udm |
Cyrl | Modelo de script Cirílico |
Tshivenḓa | Venda | ve |
Latn | Modelo de script latino |
Vod | Votic | vot |
Cyrl/Latn | Modelo de script Cirílico |
Frysk | Frísio ocidental | fy |
Latn | Modelo de script latino |
Wolof | Wolof | wo |
Latn | Modelo de script latino |
isiXhosa | Xhosa | xh |
Latn | Modelo de script latino |
Èdè Yorùbá | Iorubá | yo |
Latn | Modelo de script latino |
Diidxazá | Zapotec | zap |
Latn | Modelo de script latino |
Scripts de escrita à mão
Esta seção contém os scripts compatíveis com o reconhecimento de escrita manual. Para saber quais idiomas usam cada script, consulte as tabelas de idiomas compatíveis, experimentais e mapeados. Para filtrar por script, digite um script no campo a seguir:
Tag de script | Nome | Nível de suporte |
---|---|---|
Beng | Bengalês | Experimental |
Cyrl | Cirílico | Experimental |
Deva | Devanágari | Experimental |
Grego | Grego | Experimental |
Hani | Chinês | Experimental |
Japão | Japonês | Compatível |
Kore | Coreano | Compatível |
Latn | Latim | Compatível |
vi | Vietnamita | Experimental |