Fitur pengenalan teks Google Distributed Cloud (GDC) dengan air gap mendeteksi berbagai bahasa dan dapat mendeteksi beberapa bahasa dalam satu gambar.
Anda dapat menentukan petunjuk bahasa opsional untuk permintaan Optical Character Recognition (OCR) API. Misalnya, Anda mungkin ingin memberikan petunjuk saat API mengalami masalah dalam mendeteksi bahasa yang digunakan dalam gambar.
Untuk menentukan petunjuk bahasa opsional, tambahkan ke permintaan BatchAnnotateImages
atau
BatchAnnotateFiles
di kolom image_context
sebagai daftar nilai di
kolom language_hints
.
Format language_hints
menggunakan panduan pemformatan tag bahasa BCP 47
berikut:
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
Misalnya, petunjuk bahasa en-t-i0-handwrit
menunjukkan bahwa bahasanya adalah "Inggris yang diubah dari tulisan tangan".
Fitur pengenalan teks mendukung tiga tingkat bahasa:
- Bahasa yang didukung diprioritaskan dengan evaluasi performa rutin.
- Bahasa Eksperimental sedang dalam pengembangan aktif. Mereka tidak memiliki evaluasi performa rutin.
- Bahasa yang dipetakan didukung dengan memetakannya ke kode bahasa lain atau pengenal karakter umum. Misalnya,
en-GB
didukung, tetapi tidak diperlakukan secara berbeda denganen
untuk pengenalan teks. Layanan OCR mencoba menampilkan kode bahasa yang dipetakan dengan benar di kolomentity
. Namun, bahasa yang dipetakan cenderung salah diidentifikasi daripada bahasa yang didukung sepenuhnya atau secara eksperimental.
Salah satu fitur utama layanan OCR adalah kemampuan untuk mendeteksi dan mengekstrak teks dari gambar. Gambar dapat berupa, misalnya, teks tulisan tangan. Untuk mengetahui daftar skrip tulisan tangan yang didukung untuk pengenalan tulisan tangan, lihat Skrip tulisan tangan.
Bahasa yang didukung
Fitur pengenalan teks memprioritaskan dan mengevaluasi bahasa yang didukung secara berkala. Untuk memfilter menurut bahasa, ketik bahasa di kolom berikut:
Bahasa | Bahasa (nama bahasa Inggris) | Kode petunjuk bahasa | Skrip dan catatan |
---|---|---|---|
Afrika | Afrika | af |
Latn |
shqip | Albania | sq |
Latn |
العربية | Arab | ar |
Arab; Standar Modern |
Belarusia | Belarusia | be |
Cyrl |
български | Bulgaria | bg |
Cyrl |
Català | Catalan | ca |
Latn |
普通话 | China | zh |
Hans/Hant |
Hrvatski | Kroasia | hr |
Latn |
Čeština | Ceko | cs |
Latn |
Dansk | Denmark | da |
Latn |
Nederlands | Belanda | nl |
Latn |
Inggris | Inggris | en |
Latn; Amerika |
Eesti keel | Estonia | et |
Latn |
Filipina | Filipina | fil atau tl |
Latn |
Suomi | Finlandia | fi |
Latn |
Français | Prancis | fr |
Latn; Eropa |
Deutsch | Jerman | de |
Latn |
Ελληνικά | Yunani | el |
Grek |
עברית | Ibrani | iw |
Hebr |
Hindi | Hindi | hi |
Deva |
Magyar | Hungaria | hu |
Latn |
Íslenska | Islan | is |
Latn |
Bahasa Indonesia | Indonesia | id |
Latn |
Italiano | Italia | it |
Latn |
日本語 | Jepang | ja |
Jepang |
한국어 | Korea | ko |
Kore |
Latvia | Latvia | lv |
Latn |
Lietuvių | Lituania | lt |
Latn |
Macedonian | Makedonia | mk |
Cyrl |
Bahasa Melayu | Melayu | ms |
Latn |
Malayalam | Malayalam | ml |
Mlym |
Marathi | Marathi | mr |
Deva |
Nepal | Nepal | ne |
Deva |
Norsk | Norwegia | no |
Latn; Bokmål |
فارسی | Persia | fa |
Arab |
Polski | Polandia | pl |
Latn |
Português | Portugis | pt |
Latn; Brasil |
Română | Rumania | ro |
Latn |
Русский | Rusia | ru |
Cyrl |
Русский (старая орфография) | Rusia | ru-PETR1708 |
Cyrl; Ortografi Lama |
Serbia | Serbia | sr |
Cyrl & Latn |
Српски (латиница) | Serbia | sr-Latn |
Latn |
Slovenčina | Slovakia | sk |
Latn |
Slovenščina | Slovenia | sl |
Latn |
Español | Spanyol | es |
Latn; Eropa |
Svenska | Swedia | sv |
Latn |
Tagalog | Tagalog | tl |
Latn |
Türkçe | Turki | tr |
Latn |
Українська | Ukraina | uk |
Cyrl |
Tiếng Việt | Vietnam | vi |
Latn |
Yiddish | Yiddish | yi |
Hebr |
Bahasa eksperimental
Bahasa eksperimental sedang dalam pengembangan aktif dan tidak dievaluasi. Untuk memfilter menurut bahasa, ketik bahasa di kolom berikut:
Bahasa | Bahasa (nama bahasa Inggris) | Kode petunjuk bahasa | Skrip dan catatan |
---|---|---|---|
Αρχαία ελληνικά | Yunani Kuno | grc |
Grek |
Azerbaijan | Azerbaijani | az |
Latn |
Azərbaycan (qədim yazı) | Azerbaijani | az-Cyrl |
Cyrl; ortografi lama |
Euskara | Basque | eu |
Latn |
Bosanski | Bosnia | bs |
Latn |
Cebuano | Cebuano | ceb |
Latn |
Esperanto | Esperanto | eo |
Latn |
Galego | Galisia | gl |
Latn |
ქართული | Georgia | ka |
Geor |
Kreyòl Ayisyen | Kreol Haiti | ht |
Latn |
Gaeilge | Irlandia | ga |
Latn |
Jawa | Jawa | jv |
Latn |
Kazak | Kazak | kk |
Cyrl |
Kirgiz | Kirgiz | ky |
Cyrl |
Latine | Latin | la |
Latn |
Malti | Malta | mt |
Latn |
Mongolia | Mongolia | mn |
Cyrl |
پښتو | Pashto | ps |
Arab |
संस्कृतम् | Sanskrit | sa |
Deva |
Swahili | Swahili | sw |
Latn |
اردو | Urdu | ur |
Arab |
oʻzbekcha | Uzbekistan | uz |
Latn; Latin |
oʻzbekcha | Uzbekistan | uz-Cyrl |
Cyrl; ortografi lama |
Cymraeg | Wales | cy |
Latn |
IsiZulu | Zulu | zu |
Latn |
Bahasa yang dipetakan
Bahasa yang dipetakan dikaitkan dengan kode bahasa lain atau pengenal karakter umum. Untuk memfilter menurut bahasa, ketik bahasa di kolom berikut:
Bahasa | Bahasa (nama bahasa Inggris) | Kode petunjuk bahasa | Skrip dan catatan | Dipetakan ke |
---|---|---|---|---|
بهسا اچيه | Aceh | ace |
Latn | Model skrip Latin |
Lwo | Acholi | ach |
Latn | Model skrip Latin |
Dangme | Adangme | ada |
Latn | Model skrip Latin |
Akan | Akan | ak |
Latn | Model skrip Latin |
Anicinâbemowin | Algonquinian | alg |
Latn | Model skrip Latin |
Mapudungu | Araucanian/Mapuche | arn |
Latn | Model skrip Latin |
Asturianu | Asturia | ast |
Latn | Model skrip Latin |
Dene | Athabaskan | ath |
Latn | Model skrip Latin |
Aymar aru | Aymara | ay |
Latn | Model skrip Latin |
Bhāṣa Bali | Bali | ban |
Latn | Model skrip Latin |
Bamanankan | Bambara | bm |
Latn | Model skrip Latin |
Bantu Sempit | Bantu | bnt |
Latn | Model skrip Latin |
bashҡорт теле | Bashkir | ba |
Cyrl | Model skrip Sirilik |
Toba–Batak | Batak | btk |
Latn | Model skrip Latin |
Chibemba | Bemba | bem |
Latn | Model skrip Latin |
Bikol Naga | Bikol | bik |
Latn | Model skrip Latin |
Bichelamar | Bislama | bi |
Latn | Model skrip Latin |
Brezhoneg | Breton | br |
Latn | Model skrip Latin |
нохчийн мотт / noxçiyn mott | Suku Chechen | ce |
Cyrl | Model skrip Sirilik |
汉语 | China | zh-Hans |
Hans; Sederhana; Mandarin | zh |
漢語 | China | zh-Hant |
Hant; Tradisional; Mandarin | zh |
普通話 | China | zh-Hant-HK |
Hant; Mandarin; Hong Kong | zh |
Chahta' | Choctaw | cho |
Latn | Model skrip Latin |
Чӑвашла | Chuvash | cv |
Cyrl | Model skrip Sirilik |
Cree–Montagnais–Naskapi | Cree | cr |
Latn | Model skrip Latin |
Mvskoke | Creek | mus |
Latn | Model skrip Latin |
qırımtatar tili, къырымтатар тили | Crimean Tatar | crh |
Latn | Model skrip Sirilik |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak |
Latn | Model skrip Latin |
Douala | Duala | dua |
Latn | Model skrip Latin |
Ikɔ Efik | Efik | efi |
Latn | Model skrip Latin |
Inggris (Britania Raya) | Inggris | en-GB |
Latn; British | en |
Èʋegbe | Ewe | ee |
Latn | Model skrip Latin |
føroyskt mál | Faroese | fo |
Latn | Model skrip Latin |
Na Vosa Vakaviti | Fiji | fj |
Latn | Model skrip Latin |
fɔ̀ngbè | Fon | fon |
Latn | Model skrip Latin |
Français canadien | Prancis | fr-CA |
Latn; Kanada | fr |
Fulani, Fulah, Peul | Fulah | ff |
Latn | Model skrip Latin |
Gã | Ga | gaa |
Latn | Model skrip Latin |
Luganda | Ganda | lg |
Latn | Model skrip Latin |
Basa Gayo | Gayo | gay |
Latn | Model skrip Latin |
Kiribati | Gilbert | gil |
Latn | Model skrip Latin |
Gotik | Gotik | got |
Latn | Model skrip Latin |
Guaraní | Guarani | gn |
Latn | Model skrip Latin |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Hausa | ha |
Latn | Model skrip Latin |
ʻŌlelo Hawaiʻi | Hawaii | haw |
Latn | Model skrip Latin |
Otjiherero | Herero | hz |
Latn | Model skrip Latin |
Ilonggo | Hiligaynon | hil |
Latn | Model skrip Latin |
Jaku Iban | Iban | iba |
Latn | Model skrip Latin |
Asụsụ Igbo | Igbo | ig |
Latn | Model skrip Latin |
Ilokano | Iloko | ilo |
Latn | Model skrip Latin |
Taqbaylit | Kabyle | kab |
Latn | Model skrip Latin |
Jingpho | Kachin | kac |
Latn | Model skrip Latin |
Kalaallisut | Kalaallisut | kl |
Latn | Model skrip Latin |
Kikamba | Kamba | kam |
Latn | Model skrip Latin |
Kanuri | Kanuri | kr |
Latn | Model skrip Latin |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Karakalpak | kaa |
Cyrl/Latn | Model skrip Sirilik |
Ka Ktien Khasi | Khasi | kha |
Latn | Model skrip Latin |
Gĩkũyũ | Kikuyu | ki |
Latn | Model skrip Latin |
Kinyarwanda | Kinyarwanda | rw |
Latn | Model skrip Latin |
коми кыв | Komi | kv |
Cyrl | Model skrip Sirilik |
Kikongo | Kongo | kg |
Latn | Model skrip Latin |
Kosrae | Kosrae | kos |
Latn | Model skrip Latin |
Oshikwanyama | Kuanyama | kj |
Latn | Model skrip Latin |
Ngala | Lingala | ln |
Latn | Model skrip Latin |
Plattdütsch, Plattdeutsch, Nedersaksisch | Dialek Jerman Utara | nds |
Latn | Model skrip Latin |
siLozi | Lozi | loz |
Latn | Model skrip Latin |
Kiluba | Luba-Katanga | lu |
Latn | Model skrip Latin |
Dholuo | Luo | luo |
Latn | Model skrip Latin |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madura | mad |
Latn | Model skrip Latin |
Malagasi | Malagasi | mg |
Latn | Model skrip Latin |
Mandinka, لغة مندنكا | Mandingo | man |
Latn | Model skrip Latin |
Gaelg, Gailck | Manx | gv |
Latn | Model skrip Latin |
Te reo Māori | Maori | mi |
Latn | Model skrip Latin |
Ebon | Marshall | mh |
Latn | Model skrip Latin |
Mɛnde yia | Mende | men |
Latn | Model skrip Latin |
Inggris Pertengahan | Inggris Pertengahan | enm |
Latn | Model skrip Latin |
Mittelhochdeutsch | Jerman Hulu Pertengahan | gmh |
Latn | Model skrip Latin |
Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min |
Latn | Model skrip Latin |
Kanienʼkéha | Mohawk | moh |
Latn | Model skrip Latin |
Nkundu | Mongo | lol |
Latn | Model skrip Latin |
Nāhuatl | Nahuatl | nah |
Latn | Model skrip Latin |
Diné bizaad | Navajo | nv |
Latn | Model skrip Latin |
Ndonga | Ndonga | ng |
Latn | Model skrip Latin |
ko e vagahau Niuē | Niuean | niu |
Latn | Model skrip Latin |
Ndebele Zimbabwe | Ndebele Utara | nd |
Latn | Model skrip Latin |
Sesotho sa Leboa | Sotho Utara | nso |
Latn | Model skrip Latin |
Chichewa, Chinyanja | Nyanja | ny |
Latn | Model skrip Latin |
Runyankore | Nyankole | nyn |
Latn | Model skrip Latin |
Chitonga | Nyasa Tonga | tog |
Latn | Model skrip Latin |
Appolo | Nzima | nzi |
Latn | Model skrip Latin |
Occitan, lenga d'òc, provençal | Occitan | oc |
Latn | Model skrip Latin |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj |
Latn | Model skrip Latin |
Ænglisc, Englisc, Anglisc | Inggris Kuno | ang |
Latn | Model skrip Latin |
Franceis, François, Romanz | Prancis Kuno | fro |
Latn | Model skrip Latin |
Diutisk, Althochdeutsch | Jerman Hulu Kuno | goh |
Latn | Model skrip Latin |
Dǫnsk tunga | Norse Kuno | non |
Latn | Model skrip Latin |
Occitan ancian | Provencal Kuno | pro |
Latn | Model skrip Latin |
ирон ӕвзаг | Ossetic | os |
Cyrl | Model skrip Sirilik |
Kapampangan | Pampanga | pam |
Latn | Model skrip Latin |
Salitan Pangasinan | Pangasinan | pag |
Latn | Model skrip Latin |
Papiamentu | Papiamento | pap |
Latn | Model skrip Latin |
Português (Portugal) | Portugis | pt-PT |
Latn; Eropa | pt |
Kechua / Runa Simi | Quechua | qu |
Latn | Model skrip Latin |
Rumantsch | Romansh | rm |
Latn | Model skrip Latin |
Romani čhib | Rumania | rom |
Latn | Model skrip Latin |
Ikirundi | Rundi | rn |
Latn | Model skrip Latin |
Sakha | Sakha | sah |
Cyrl | Model skrip Sirilik |
Gagana faʻa Sāmoa | Samoa | sm |
Latn | Model skrip Latin |
yângâ tî sängö | Sango | sg |
Latn | Model skrip Latin |
(Braid) Skotlandia, Lallans, Doric | Skotlandia | sco |
Latn | Model skrip Latin |
Gàidhlig | Gaelik Skotlandia | gd |
Latn | Model skrip Latin |
chiShona | Shona | sn |
Latn | Model skrip Latin |
Songhay | Songhai | son |
Latn | Model skrip Latin |
Sesotho | Sotho Selatan | st |
Latn | Model skrip Latin |
Español (Latinoamérica) | Spanyol | es-419 |
Latn; Amerika Latin | es |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sunda | su |
Latn | Model skrip Latin |
siSwati | Swati | ss |
Latn | Model skrip Latin |
Reo Tahiti | Tahiti | ty |
Latn | Model skrip Latin |
тоҷикӣ | Tajik | tg |
Cyrl | Model skrip Sirilik |
татар теле | Tatar | tt |
Cyrl/Latn | Model skrip Sirilik |
KʌThemnɛ | Temne | tem |
Latn | Model skrip Latin |
lea faka-Tonga | Tonga | to |
Latn | Model skrip Latin |
Xitsonga | Tsonga | ts |
Latn | Model skrip Latin |
Setswana | Tswana | tn |
Latn | Model skrip Latin |
Türkmençe | Turkmen | tk |
Latn | Model skrip Sirilik |
удмурт кыл | Udmurt | udm |
Cyrl | Model skrip Sirilik |
Tshivenḓa | Venda | ve |
Latn | Model skrip Latin |
Vod | Votic | vot |
Cyrl/Latn | Model skrip Sirilik |
Frysk | Frisia Barat | fy |
Latn | Model skrip Latin |
Wolof | Wolof | wo |
Latn | Model skrip Latin |
isiXhosa | Xhosa | xh |
Latn | Model skrip Latin |
Èdè Yorùbá | Yoruba | yo |
Latn | Model skrip Latin |
Diidxazá | Zapotec | zap |
Latn | Model skrip Latin |
Skrip tulisan tangan
Bagian ini berisi skrip yang didukung untuk pengenalan tulisan tangan. Untuk mempelajari bahasa mana yang menggunakan setiap skrip, lihat tabel untuk bahasa yang didukung, eksperimental, dan dipetakan. Untuk memfilter menurut skrip, ketik skrip di kolom berikut:
Tag skrip | Nama | Level dukungan |
---|---|---|
Beng | Bengali | Eksperimental |
Cyrl | Sirilik | Eksperimental |
Deva | Devanagari | Eksperimental |
Grek | Yunani | Eksperimental |
Hani | China | Eksperimental |
Jepang | Jepang | Didukung |
Kore | Korea | Didukung |
Latn | Latin | Didukung |
vi | Vietnam | Eksperimental |