Idiomas compatíveis

O recurso de reconhecimento de texto do Google Distributed Cloud (GDC) air-gapped detecta vários idiomas e pode detectar vários idiomas em uma única imagem.

É possível especificar uma dica de idioma opcional para uma solicitação de API de reconhecimento óptico de caracteres (OCR). Por exemplo, você pode fornecer uma dica quando a API tiver dificuldade para detectar o idioma usado na imagem.

Para especificar dicas de idioma opcionais, adicione-as à sua solicitação BatchAnnotateImages ou BatchAnnotateFiles no campo image_context como uma lista de valores no campo language_hints.

O formato language_hints usa as seguintes diretrizes de formatação de tag de idioma BCP 47:

language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]

Por exemplo, a dica de idioma en-t-i0-handwrit indica que o idioma é "Inglês transformado da escrita à mão".

O recurso de reconhecimento de texto oferece suporte a três níveis de idioma:

  1. Os idiomas compatíveis são priorizados com avaliação regular de desempenho.
  2. Os idiomas experimentais estão em desenvolvimento ativo. Não têm avaliações de performance regulares.
  3. Os idiomas mapeados são compatíveis com o mapeamento para outro código de idioma ou um reconhecedor geral de caracteres. Por exemplo, en-GB é compatível, mas não é tratado de forma diferente de en para reconhecimento de texto. O serviço de OCR tenta retornar o código de idioma mapeado correto no campo entity. No entanto, os idiomas mapeados têm mais chance de serem identificados incorretamente do que os idiomas com suporte total ou experimental.

Um dos principais recursos do serviço de OCR é a capacidade de detectar e extrair texto de imagens. Por exemplo, um texto escrito à mão. Para uma lista de scripts de escrita manual compatíveis com o reconhecimento de escrita manual, consulte Scripts de escrita manual.

Idiomas disponíveis

O recurso de reconhecimento de texto prioriza e avalia regularmente os idiomas compatíveis. Para filtrar por idioma, digite um idioma no campo a seguir:

Idioma Idioma (nome em português) Código de dicas de idioma Script e observações
Africâner Africâner af Latn
shqip Albanês sq Latn
العربية Árabe ar Arabrabe; Padrão moderno
беларуская Bielorrusso be Cyrl
български Búlgaro bg Cyrl
Catalão Catalão ca Latn
普通话 Chinês zh Hans/Hant
Hrvatski Croata hr Latn
Čeština Tcheco cs Latn
Dansk Dinamarquês da Latn
Nederlands Holandês nl Latn
Inglês Inglês en Latn; Americano
Eesti keel Estoniano et Latn
Filipino Filipino fil ou tl Latn
Suomi Finlandês fi Latn
Français Francês fr Latn; Europeu
Deutsch Alemão de Latn
Ελληνικά Grego el Grego
עברית Hebraico iw Hebr
हिन्दी Hindi hi Deva
Magyar Húngaro hu Latn
Íslenska Islandês is Latn
Bahasa Indonesia Indonésio id Latn
Italiano Italiano it Latn
日本語 Japonês ja Japão
한국어 Coreano ko Kore
Latviešu Letão lv Latn
Lietuvių Lituano lt Latn
Македонски Macedônio mk Cyrl
Bahasa Melayu Malaio ms Latn
മലയാളം Malaiala ml Mlym
मराठी Marati mr Deva
नेपाली Nepalês ne Deva
Norsk Norueguês no Latn; Bokmål
فارسی Persa fa Arab
Polski Polonês pl Latn
Português Português pt Latn; Brasileiro
Română Romeno ro Latn
Pусский Russo ru Cyrl
Русский (старая орфография) Russo ru-PETR1708 Cyrl; Ortografia antiga
Српски Sérvio sr Cyrl & Latn
Српски (латиница) Sérvio sr-Latn Latn
Slovenčina Eslovaco sk Latn
Slovenščina Esloveno sl Latn
Español Espanhol es Latn; Europeu
Svenska Sueco sv Latn
Tagalo Tagalo tl Latn
Türkçe Turco tr Latn
Українськa Ucraniano uk Cyrl
Tiếng Việt Vietnamita vi Latn
Ídiche Ídiche yi Hebr

Idiomas experimentais

Os idiomas experimentais estão em desenvolvimento ativo e não são avaliados. Para filtrar por idioma, digite um idioma no campo a seguir:

Idioma Idioma (nome em português) Código de dicas de idioma Script e observações
Αρχαία ελληνικά grego antigo grc Grego
Azərbaycan Azerbaijano az Latn
Azərbaycan (qədim yazı) Azerbaijano az-Cyrl Cyrl; ortografia antiga
Euskara Basco eu Latn
Bosanski Bósnio bs Latn
Cebuano Cebuano ceb Latn
Esperanto Esperanto eo Latn
Galego Galego gl Latn
ქართული Georgiano ka Geor
Kreyòl Ayisyen Crioulo haitiano ht Latn
Gaeilge Irlandês ga Latn
Jawa Javanês jv Latn
Қазақ Cazaque kk Cyrl
Quirguiz Quirguiz ky Cyrl
Latim Latim la Latn
Malti Maltês mt Latn
Монгол Mongol mn Cyrl
پښتو Pashto ps Arab
संस्कृतम् Sânscrito sa Deva
Suaíli Suaíli sw Latn
اردو Urdu ur Arab
oʻzbekcha Usbeque uz Latn; Latim
oʻzbekcha Usbeque uz-Cyrl Cyrl; ortografia antiga
Cymraeg Galês cy Latn
IsiZulu Zulu zu Latn

Idiomas mapeados

Os idiomas mapeados estão associados a outro código de idioma ou a um reconhecedor geral de caracteres. Para filtrar por idioma, digite um idioma no seguinte campo:

Idioma Idioma (nome em português) Código de dicas de idioma Script e observações Mapeado para
بهسا Achém ace Latn Modelo de script latino
Lwo Acholi ach Latn Modelo de script latino
Dangme Adangme ada Latn Modelo de script latino
Akan Akan ak Latn Modelo de script latino
Anicinâbemowin Algonquinian alg Latn Modelo de script latino
Mapudungu Araucanian/Mapuche arn Latn Modelo de script latino
Asturianu Asturiano ast Latn Modelo de script latino
Dene Athabaskan ath Latn Modelo de script latino
Aymar aru Aimará ay Latn Modelo de script latino
Bhāṣa Bali Balinês ban Latn Modelo de script latino
Bamanankan Bambara bm Latn Modelo de script latino
Narrow Bantu Bantu bnt Latn Modelo de script latino
башҡорт теле Bashkir ba Cyrl Modelo de script Cirílico
Toba–Batak Batak btk Latn Modelo de script latino
Chibemba Bemba bem Latn Modelo de script latino
Bikol Naga Bikol bik Latn Modelo de script latino
Bichelamar Bislama bi Latn Modelo de script latino
Brezhoneg Bretão br Latn Modelo de script latino
нохчийн мотт / noxçiyn mott Chechenos ce Cyrl Modelo de script Cirílico
汉语 Chinês zh-Hans Hans Simplificado Mandarim zh
漢語 Chinês zh-Hant Hant Tradicional Mandarim zh
普通話 Chinês zh-Hant-HK Hant; Mandarim; Hong Kong zh
Chahta' Choctaw cho Latn Modelo de script latino
Чӑвашла Chuvache cv Cyrl Modelo de script Cirílico
Cree–Montagnais–Naskapi Cree cr Latn Modelo de script latino
Mvskoke Creek mus Latn Modelo de script latino
qırımtatar tili, къырымтатар тили Tártaro da Crimeia crh Latn Modelo de script Cirílico
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Modelo de script latino
Douala Duala dua Latn Modelo de script latino
Ikɔ Efik Efik efi Latn Modelo de script latino
Inglês (britânico) Inglês en-GB Latn; Britânica en
Èʋegbe Ewe ee Latn Modelo de script latino
føroyskt mál Faroês fo Latn Modelo de script latino
Na Vosa Vakaviti Fijiano fj Latn Modelo de script latino
fɔ̀ngbè Fon fon Latn Modelo de script latino
Français canadien Francês fr-CA Latn; Canadá fr
Fulani, Fulah, Peul Fulah ff Latn Modelo de script latino
Ga gaa Latn Modelo de script latino
Luganda Ganda lg Latn Modelo de script latino
Basa Gayo Gayo gay Latn Modelo de script latino
Kiribati Gilbertese gil Latn Modelo de script latino
Gothic Gótico got Latn Modelo de script latino
Guaraní Guarani gn Latn Modelo de script latino
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hauçá ha Latn Modelo de script latino
ʻŌlelo Hawaiʻi Havaiano haw Latn Modelo de script latino
Otjiherero Herero hz Latn Modelo de script latino
Ilonggo Hiligaynon hil Latn Modelo de script latino
Jaku Iban Iban iba Latn Modelo de script latino
Asụsụ Igbo Ibo ig Latn Modelo de script latino
Ilokano Iloko ilo Latn Modelo de script latino
Taqbaylit Kabyle kab Latn Modelo de script latino
Jingpho Kachin kac Latn Modelo de script latino
Groenlandês Groenlandês kl Latn Modelo de script latino
Kikamba Kamba kam Latn Modelo de script latino
Kanuri Kanuri kr Latn Modelo de script latino
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak kaa Cyrl/Latn Modelo de script Cirílico
Ka Ktien Khasi Khasi kha Latn Modelo de script latino
Gĩkũyũ Kikuyu ki Latn Modelo de script latino
Kinyarwanda Quiniaruanda rw Latn Modelo de script latino
коми кыв Komi kv Cyrl Modelo de script Cirílico
Kikongo Quicongo kg Latn Modelo de script latino
Kosraean Kosraean kos Latn Modelo de script latino
Oshikwanyama Kuanyama kj Latn Modelo de script latino
Ngala Lingala ln Latn Modelo de script latino
Plattdütsch, Plattdeutsch, Nedersaksisch Baixo-alemão nds Latn Modelo de script latino
siLozi Lozi loz Latn Modelo de script latino
Kiluba Luba-katanga lu Latn Modelo de script latino
Dholuo Luo luo Latn Modelo de script latino
Madhura, Basa Mathura, بَهاسَ مَدورا Madurês mad Latn Modelo de script latino
Malgaxe Malgaxe mg Latn Modelo de script latino
Mandinka, لغة مندنكا Mandingo man Latn Modelo de script latino
Gaelg, Gailck Manx gv Latn Modelo de script latino
Te reo Māori Maori mi Latn Modelo de script latino
Ebon Marshallese mh Latn Modelo de script latino
Mɛnde yia Mende men Latn Modelo de script latino
Inglês médio Inglês médio enm Latn Modelo de script latino
Mittelhochdeutsch Alto-alemão médio gmh Latn Modelo de script latino
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modelo de script latino
Kanienʼkéha Mohawk moh Latn Modelo de script latino
Nkundu Mongo lol Latn Modelo de script latino
Nāhuatl Náuatle nah Latn Modelo de script latino
Diné bizaad Navajo nv Latn Modelo de script latino
Ndonga Ndonga ng Latn Modelo de script latino
ko e vagahau Niuē Niueano niu Latn Modelo de script latino
Zimbabwe Ndebele Ndebele do norte nd Latn Modelo de script latino
Sesotho sa Leboa Soto do norte nso Latn Modelo de script latino
Chichewa, Chinyanja Nianja ny Latn Modelo de script latino
Runyankore Nyankole nyn Latn Modelo de script latino
Chitonga Nyasa Tonga tog Latn Modelo de script latino
Appolo Nzima nzi Latn Modelo de script latino
Occitan, lenga d'òc, provençal Occitânico oc Latn Modelo de script latino
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Modelo de script latino
Ænglisc, Englisc, Anglisc Inglês antigo ang Latn Modelo de script latino
Franceis, François, Romanz Francês antigo fro Latn Modelo de script latino
Diutisk, Althochdeutsch Alto alemão antigo goh Latn Modelo de script latino
Dǫnsk tunga Norueguês antigo non Latn Modelo de script latino
Anciano occitano Provençal antigo pro Latn Modelo de script latino
ирон ӕвзаг Ossetic os Cyrl Modelo de script Cirílico
Kapampangan Pampanga pam Latn Modelo de script latino
Salitan Pangasinan Língua pangasiana pag Latn Modelo de script latino
Papiamentu Papiamento pap Latn Modelo de script latino
Português (Portugal) Português pt-PT Latn; Europeu pt
Kechua / Runa Simi Quíchua qu Latn Modelo de script latino
Rumantsch Romanche rm Latn Modelo de script latino
Romani čhib Romani rom Latn Modelo de script latino
Ikirundi Rundi rn Latn Modelo de script latino
Sakha Sakha sah Cyrl Modelo de script Cirílico
Gagana faʻa Sāmoa Samoano sm Latn Modelo de script latino
yângâ tî sängö Sango sg Latn Modelo de script latino
(Trança) Escocês, Lallans, Dórico Scots sco Latn Modelo de script latino
Gàidhlig Gaélico escocês gd Latn Modelo de script latino
chiShona Chona sn Latn Modelo de script latino
Songhay Songhai son Latn Modelo de script latino
Sesoto Soto do sul st Latn Modelo de script latino
Espanhol (América Latina) Espanhol es-419 Latn; América Latina es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanês su Latn Modelo de script latino
siSwati Swati ss Latn Modelo de script latino
Reo Tahiti Taitiano ty Latn Modelo de script latino
тоҷикӣ Tadjique tg Cyrl Modelo de script Cirílico
татар теле Tártaro tt Cyrl/Latn Modelo de script Cirílico
KʌThemnɛ Temne tem Latn Modelo de script latino
lea faka-Tonga Tonga to Latn Modelo de script latino
Xitsonga Tsonga ts Latn Modelo de script latino
Setsuana Tswana tn Latn Modelo de script latino
Türkmençe Turcomano tk Latn Modelo de script Cirílico
удмурт кыл Udmurte udm Cyrl Modelo de script Cirílico
Tshivenḓa Venda ve Latn Modelo de script latino
Vod Votic vot Cyrl/Latn Modelo de script Cirílico
Frysk Frísio ocidental fy Latn Modelo de script latino
Wolof Wolof wo Latn Modelo de script latino
isiXhosa Xhosa xh Latn Modelo de script latino
Èdè Yorùbá Iorubá yo Latn Modelo de script latino
Diidxazá Zapotec zap Latn Modelo de script latino

Scripts de escrita à mão

Esta seção contém os scripts compatíveis com o reconhecimento de escrita manual. Para saber quais idiomas usam cada script, consulte as tabelas de idiomas compatíveis, experimentais e mapeados. Para filtrar por script, digite um script no campo a seguir:

Tag de script Nome Nível de suporte
Beng Bengalês Experimental
Cyrl Cirílico Experimental
Deva Devanágari Experimental
Grego Grego Experimental
Hani Chinês Experimental
Japão Japonês Compatível
Kore Coreano Compatível
Latn Latim Compatível
vi Vietnamita Experimental