Bahasa yang didukung

Fitur pengenalan teks Google Distributed Cloud (GDC) dengan air gap mendeteksi berbagai bahasa dan dapat mendeteksi beberapa bahasa dalam satu gambar.

Anda dapat menentukan petunjuk bahasa opsional untuk permintaan Optical Character Recognition (OCR) API. Misalnya, Anda mungkin ingin memberikan petunjuk saat API mengalami masalah dalam mendeteksi bahasa yang digunakan dalam gambar.

Untuk menentukan petunjuk bahasa opsional, tambahkan ke permintaan BatchAnnotateImages atau BatchAnnotateFiles di kolom image_context sebagai daftar nilai di kolom language_hints.

Format language_hints menggunakan panduan pemformatan tag bahasa BCP 47 berikut:

language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]

Misalnya, petunjuk bahasa en-t-i0-handwrit menunjukkan bahwa bahasanya adalah "Inggris yang diubah dari tulisan tangan".

Fitur pengenalan teks mendukung tiga tingkat bahasa:

  1. Bahasa yang didukung diprioritaskan dengan evaluasi performa rutin.
  2. Bahasa Eksperimental sedang dalam pengembangan aktif. Mereka tidak memiliki evaluasi performa rutin.
  3. Bahasa yang dipetakan didukung dengan memetakannya ke kode bahasa lain atau pengenal karakter umum. Misalnya, en-GB didukung, tetapi tidak diperlakukan secara berbeda dengan en untuk pengenalan teks. Layanan OCR mencoba menampilkan kode bahasa yang dipetakan dengan benar di kolom entity. Namun, bahasa yang dipetakan cenderung salah diidentifikasi daripada bahasa yang didukung sepenuhnya atau secara eksperimental.

Salah satu fitur utama layanan OCR adalah kemampuan untuk mendeteksi dan mengekstrak teks dari gambar. Gambar dapat berupa, misalnya, teks tulisan tangan. Untuk mengetahui daftar skrip tulisan tangan yang didukung untuk pengenalan tulisan tangan, lihat Skrip tulisan tangan.

Bahasa yang didukung

Fitur pengenalan teks memprioritaskan dan mengevaluasi bahasa yang didukung secara berkala. Untuk memfilter menurut bahasa, ketik bahasa di kolom berikut:

Bahasa Bahasa (nama bahasa Inggris) Kode petunjuk bahasa Skrip dan catatan
Afrika Afrika af Latn
shqip Albania sq Latn
العربية Arab ar Arab; Standar Modern
Belarusia Belarusia be Cyrl
български Bulgaria bg Cyrl
Català Catalan ca Latn
普通话 China zh Hans/Hant
Hrvatski Kroasia hr Latn
Čeština Ceko cs Latn
Dansk Denmark da Latn
Nederlands Belanda nl Latn
Inggris Inggris en Latn; Amerika
Eesti keel Estonia et Latn
Filipina Filipina fil atau tl Latn
Suomi Finlandia fi Latn
Français Prancis fr Latn; Eropa
Deutsch Jerman de Latn
Ελληνικά Yunani el Grek
עברית Ibrani iw Hebr
Hindi Hindi hi Deva
Magyar Hungaria hu Latn
Íslenska Islan is Latn
Bahasa Indonesia Indonesia id Latn
Italiano Italia it Latn
日本語 Jepang ja Jepang
한국어 Korea ko Kore
Latvia Latvia lv Latn
Lietuvių Lituania lt Latn
Macedonian Makedonia mk Cyrl
Bahasa Melayu Melayu ms Latn
Malayalam Malayalam ml Mlym
Marathi Marathi mr Deva
Nepal Nepal ne Deva
Norsk Norwegia no Latn; Bokmål
فارسی Persia fa Arab
Polski Polandia pl Latn
Português Portugis pt Latn; Brasil
Română Rumania ro Latn
Русский Rusia ru Cyrl
Русский (старая орфография) Rusia ru-PETR1708 Cyrl; Ortografi Lama
Serbia Serbia sr Cyrl & Latn
Српски (латиница) Serbia sr-Latn Latn
Slovenčina Slovakia sk Latn
Slovenščina Slovenia sl Latn
Español Spanyol es Latn; Eropa
Svenska Swedia sv Latn
Tagalog Tagalog tl Latn
Türkçe Turki tr Latn
Українська Ukraina uk Cyrl
Tiếng Việt Vietnam vi Latn
Yiddish Yiddish yi Hebr

Bahasa eksperimental

Bahasa eksperimental sedang dalam pengembangan aktif dan tidak dievaluasi. Untuk memfilter menurut bahasa, ketik bahasa di kolom berikut:

Bahasa Bahasa (nama bahasa Inggris) Kode petunjuk bahasa Skrip dan catatan
Αρχαία ελληνικά Yunani Kuno grc Grek
Azerbaijan Azerbaijani az Latn
Azərbaycan (qədim yazı) Azerbaijani az-Cyrl Cyrl; ortografi lama
Euskara Basque eu Latn
Bosanski Bosnia bs Latn
Cebuano Cebuano ceb Latn
Esperanto Esperanto eo Latn
Galego Galisia gl Latn
ქართული Georgia ka Geor
Kreyòl Ayisyen Kreol Haiti ht Latn
Gaeilge Irlandia ga Latn
Jawa Jawa jv Latn
Kazak Kazak kk Cyrl
Kirgiz Kirgiz ky Cyrl
Latine Latin la Latn
Malti Malta mt Latn
Mongolia Mongolia mn Cyrl
پښتو Pashto ps Arab
संस्कृतम् Sanskrit sa Deva
Swahili Swahili sw Latn
اردو Urdu ur Arab
oʻzbekcha Uzbekistan uz Latn; Latin
oʻzbekcha Uzbekistan uz-Cyrl Cyrl; ortografi lama
Cymraeg Wales cy Latn
IsiZulu Zulu zu Latn

Bahasa yang dipetakan

Bahasa yang dipetakan dikaitkan dengan kode bahasa lain atau pengenal karakter umum. Untuk memfilter menurut bahasa, ketik bahasa di kolom berikut:

Bahasa Bahasa (nama bahasa Inggris) Kode petunjuk bahasa Skrip dan catatan Dipetakan ke
بهسا اچيه Aceh ace Latn Model skrip Latin
Lwo Acholi ach Latn Model skrip Latin
Dangme Adangme ada Latn Model skrip Latin
Akan Akan ak Latn Model skrip Latin
Anicinâbemowin Algonquinian alg Latn Model skrip Latin
Mapudungu Araucanian/Mapuche arn Latn Model skrip Latin
Asturianu Asturia ast Latn Model skrip Latin
Dene Athabaskan ath Latn Model skrip Latin
Aymar aru Aymara ay Latn Model skrip Latin
Bhāṣa Bali Bali ban Latn Model skrip Latin
Bamanankan Bambara bm Latn Model skrip Latin
Bantu Sempit Bantu bnt Latn Model skrip Latin
bashҡорт теле Bashkir ba Cyrl Model skrip Sirilik
Toba–Batak Batak btk Latn Model skrip Latin
Chibemba Bemba bem Latn Model skrip Latin
Bikol Naga Bikol bik Latn Model skrip Latin
Bichelamar Bislama bi Latn Model skrip Latin
Brezhoneg Breton br Latn Model skrip Latin
нохчийн мотт / noxçiyn mott Suku Chechen ce Cyrl Model skrip Sirilik
汉语 China zh-Hans Hans; Sederhana; Mandarin zh
漢語 China zh-Hant Hant; Tradisional; Mandarin zh
普通話 China zh-Hant-HK Hant; Mandarin; Hong Kong zh
Chahta' Choctaw cho Latn Model skrip Latin
Чӑвашла Chuvash cv Cyrl Model skrip Sirilik
Cree–Montagnais–Naskapi Cree cr Latn Model skrip Latin
Mvskoke Creek mus Latn Model skrip Latin
qırımtatar tili, къырымтатар тили Crimean Tatar crh Latn Model skrip Sirilik
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Model skrip Latin
Douala Duala dua Latn Model skrip Latin
Ikɔ Efik Efik efi Latn Model skrip Latin
Inggris (Britania Raya) Inggris en-GB Latn; British en
Èʋegbe Ewe ee Latn Model skrip Latin
føroyskt mál Faroese fo Latn Model skrip Latin
Na Vosa Vakaviti Fiji fj Latn Model skrip Latin
fɔ̀ngbè Fon fon Latn Model skrip Latin
Français canadien Prancis fr-CA Latn; Kanada fr
Fulani, Fulah, Peul Fulah ff Latn Model skrip Latin
Ga gaa Latn Model skrip Latin
Luganda Ganda lg Latn Model skrip Latin
Basa Gayo Gayo gay Latn Model skrip Latin
Kiribati Gilbert gil Latn Model skrip Latin
Gotik Gotik got Latn Model skrip Latin
Guaraní Guarani gn Latn Model skrip Latin
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hausa ha Latn Model skrip Latin
ʻŌlelo Hawaiʻi Hawaii haw Latn Model skrip Latin
Otjiherero Herero hz Latn Model skrip Latin
Ilonggo Hiligaynon hil Latn Model skrip Latin
Jaku Iban Iban iba Latn Model skrip Latin
Asụsụ Igbo Igbo ig Latn Model skrip Latin
Ilokano Iloko ilo Latn Model skrip Latin
Taqbaylit Kabyle kab Latn Model skrip Latin
Jingpho Kachin kac Latn Model skrip Latin
Kalaallisut Kalaallisut kl Latn Model skrip Latin
Kikamba Kamba kam Latn Model skrip Latin
Kanuri Kanuri kr Latn Model skrip Latin
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Karakalpak kaa Cyrl/Latn Model skrip Sirilik
Ka Ktien Khasi Khasi kha Latn Model skrip Latin
Gĩkũyũ Kikuyu ki Latn Model skrip Latin
Kinyarwanda Kinyarwanda rw Latn Model skrip Latin
коми кыв Komi kv Cyrl Model skrip Sirilik
Kikongo Kongo kg Latn Model skrip Latin
Kosrae Kosrae kos Latn Model skrip Latin
Oshikwanyama Kuanyama kj Latn Model skrip Latin
Ngala Lingala ln Latn Model skrip Latin
Plattdütsch, Plattdeutsch, Nedersaksisch Dialek Jerman Utara nds Latn Model skrip Latin
siLozi Lozi loz Latn Model skrip Latin
Kiluba Luba-Katanga lu Latn Model skrip Latin
Dholuo Luo luo Latn Model skrip Latin
Madhura, Basa Mathura, بَهاسَ مَدورا Madura mad Latn Model skrip Latin
Malagasi Malagasi mg Latn Model skrip Latin
Mandinka, لغة مندنكا Mandingo man Latn Model skrip Latin
Gaelg, Gailck Manx gv Latn Model skrip Latin
Te reo Māori Maori mi Latn Model skrip Latin
Ebon Marshall mh Latn Model skrip Latin
Mɛnde yia Mende men Latn Model skrip Latin
Inggris Pertengahan Inggris Pertengahan enm Latn Model skrip Latin
Mittelhochdeutsch Jerman Hulu Pertengahan gmh Latn Model skrip Latin
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Model skrip Latin
Kanienʼkéha Mohawk moh Latn Model skrip Latin
Nkundu Mongo lol Latn Model skrip Latin
Nāhuatl Nahuatl nah Latn Model skrip Latin
Diné bizaad Navajo nv Latn Model skrip Latin
Ndonga Ndonga ng Latn Model skrip Latin
ko e vagahau Niuē Niuean niu Latn Model skrip Latin
Ndebele Zimbabwe Ndebele Utara nd Latn Model skrip Latin
Sesotho sa Leboa Sotho Utara nso Latn Model skrip Latin
Chichewa, Chinyanja Nyanja ny Latn Model skrip Latin
Runyankore Nyankole nyn Latn Model skrip Latin
Chitonga Nyasa Tonga tog Latn Model skrip Latin
Appolo Nzima nzi Latn Model skrip Latin
Occitan, lenga d'òc, provençal Occitan oc Latn Model skrip Latin
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Model skrip Latin
Ænglisc, Englisc, Anglisc Inggris Kuno ang Latn Model skrip Latin
Franceis, François, Romanz Prancis Kuno fro Latn Model skrip Latin
Diutisk, Althochdeutsch Jerman Hulu Kuno goh Latn Model skrip Latin
Dǫnsk tunga Norse Kuno non Latn Model skrip Latin
Occitan ancian Provencal Kuno pro Latn Model skrip Latin
ирон ӕвзаг Ossetic os Cyrl Model skrip Sirilik
Kapampangan Pampanga pam Latn Model skrip Latin
Salitan Pangasinan Pangasinan pag Latn Model skrip Latin
Papiamentu Papiamento pap Latn Model skrip Latin
Português (Portugal) Portugis pt-PT Latn; Eropa pt
Kechua / Runa Simi Quechua qu Latn Model skrip Latin
Rumantsch Romansh rm Latn Model skrip Latin
Romani čhib Rumania rom Latn Model skrip Latin
Ikirundi Rundi rn Latn Model skrip Latin
Sakha Sakha sah Cyrl Model skrip Sirilik
Gagana faʻa Sāmoa Samoa sm Latn Model skrip Latin
yângâ tî sängö Sango sg Latn Model skrip Latin
(Braid) Skotlandia, Lallans, Doric Skotlandia sco Latn Model skrip Latin
Gàidhlig Gaelik Skotlandia gd Latn Model skrip Latin
chiShona Shona sn Latn Model skrip Latin
Songhay Songhai son Latn Model skrip Latin
Sesotho Sotho Selatan st Latn Model skrip Latin
Español (Latinoamérica) Spanyol es-419 Latn; Amerika Latin es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sunda su Latn Model skrip Latin
siSwati Swati ss Latn Model skrip Latin
Reo Tahiti Tahiti ty Latn Model skrip Latin
тоҷикӣ Tajik tg Cyrl Model skrip Sirilik
татар теле Tatar tt Cyrl/Latn Model skrip Sirilik
KʌThemnɛ Temne tem Latn Model skrip Latin
lea faka-Tonga Tonga to Latn Model skrip Latin
Xitsonga Tsonga ts Latn Model skrip Latin
Setswana Tswana tn Latn Model skrip Latin
Türkmençe Turkmen tk Latn Model skrip Sirilik
удмурт кыл Udmurt udm Cyrl Model skrip Sirilik
Tshivenḓa Venda ve Latn Model skrip Latin
Vod Votic vot Cyrl/Latn Model skrip Sirilik
Frysk Frisia Barat fy Latn Model skrip Latin
Wolof Wolof wo Latn Model skrip Latin
isiXhosa Xhosa xh Latn Model skrip Latin
Èdè Yorùbá Yoruba yo Latn Model skrip Latin
Diidxazá Zapotec zap Latn Model skrip Latin

Skrip tulisan tangan

Bagian ini berisi skrip yang didukung untuk pengenalan tulisan tangan. Untuk mempelajari bahasa mana yang menggunakan setiap skrip, lihat tabel untuk bahasa yang didukung, eksperimental, dan dipetakan. Untuk memfilter menurut skrip, ketik skrip di kolom berikut:

Tag skrip Nama Level dukungan
Beng Bengali Eksperimental
Cyrl Sirilik Eksperimental
Deva Devanagari Eksperimental
Grek Yunani Eksperimental
Hani China Eksperimental
Jepang Jepang Didukung
Kore Korea Didukung
Latn Latin Didukung
vi Vietnam Eksperimental