OCR 語言支援

Cloud Vision API 的文字辨識功能可偵測多種語言,並在單一圖片中偵測多種語言。

不必向服務提供語言提示,但如果服務無法偵測圖片中使用的語言,則可以提供。

隨著手寫 OCR GA 的推出,使用 DOCUMENT_TEXT_DETECTION 時,含有手寫內容的圖片不再需要手寫 languageHints 標記。

選用的語言提示會在要求的 ImageContext 中指定,並以 TEXT_DETECTIONDOCUMENT_TEXT_DETECTION 要求的 languageHints 清單形式呈現。

每個語言代碼參數通常由 BCP-47 ID 組成。這個參數的格式為「語言-地區」,其中的「語言」是指主要語言,而選用的「地區」則是指特定方言的地區 (通常為國家/地區 ID)。舉例來說,中文可以表示為簡體中文 (zh-Hans) 或繁體中文 (zh-Hant)。

文字辨識功能支援三種語言:

  1. 支援的語言是指我們優先處理並定期評估成效的語言。
  2. 實驗性語言是指正在積極開發中,但未定期評估的語言。
  3. 已對應的語言是指可對應至其他語言代碼或一般字元辨識器的語言。舉例來說,系統支援「en-GB」,但在文字辨識方面,系統不會將「en-GB」與「en」區別對待。我們會盡力在實體語言代碼欄位中傳回正確的對應語言代碼,但相較於完全支援或實驗性支援的語言,對應語言更有可能被誤認為類似語言。

以下為 TEXT_DETECTIONDOCUMENT_TEXT_DETECTION 支援的語言清單 (含相關 languageHint 代碼)。

如果語言提示留空,系統會嘗試自動偵測最合適的語言。TEXT_DETECTION 端點只會自動偵測部分支援的語言,而 DOCUMENT_TEXT_DETECTION 端點則會自動偵測所有支援的語言。

支援的語言

我們會優先處理下列語言,並定期評估這些語言。

如要依功能篩選,請輸入或直接從下拉式選單中選取所需語言:

語言 語言 (英文名稱) languageHints 代碼 指令碼 附註
Afrikaans 南非荷蘭文 af Latn
shqip 阿爾巴尼亞文 sq Latn
العربية 阿拉伯文 ar Arab 現代標準
Հայ 亞美尼亞文 hy Armn
беларуская 白俄羅斯語 be Cyrl
বাংলা 孟加拉文 bn Beng
български 保加利亞文 bg Cyrl
Català 加泰隆尼亞文 ca Latn
普通话 中文 zh Hans/Hant
Hrvatski 克羅埃西亞文 hr Latn
Čeština 捷克文 cs Latn
Dansk 丹麥文 da Latn
Nederlands 荷蘭文 nl Latn
English 英文 en Latn 美國
Eesti keel 愛沙尼亞 et Latn
Filipino 菲律賓文 fil Latn
Suomi 芬蘭文 fi Latn
Français 法文 fr Latn 歐洲人
Deutsch 德文 de Latn
Ελληνικά 希臘文 el Grek
ગુજરાતી 古吉拉特文 gu Gujr
עברית 希伯來文 iw Hebr
हिन्दी 北印度文 hi Deva
Magyar 匈牙利文 hu Latn
Íslenska 冰島文 is Latn
Bahasa Indonesia 印尼文 id Latn
Italiano 義大利文 it Latn
日本語 日文 ja Jpan
ಕನ್ನಡ 卡納達文 kn Knda
ភាសាខ្មែរ 高棉文 km Khmr
한국어 韓文 ko Kore
ລາວ 寮文 lo Laoo
Latviešu 拉脫維亞文 lv Latn
Lietuvių 立陶宛文 lt Latn
Македонски 馬其頓文 mk Cyrl
Bahasa Melayu 馬來文 ms Latn
മലയാളം 馬拉雅拉姆文 ml Mlym
मराठी 馬拉地文 mr Deva
नेपाली 尼泊爾文 ne Deva
Norsk 挪威文 no Latn 博克馬爾文
فارسی 波斯文 fa Arab
Polski 波蘭文 pl Latn
Português 葡萄牙文 pt Latn 巴西文
ਪੰਜਾਬੀ 旁遮普文 pa Guru 古爾穆基文
Română 羅馬尼亞文 ro Latn
Русский 俄文 ru Cyrl
Русский (старая орфография) 俄文 ru-PETR1708 Cyrl 舊正字法
Српски 塞爾維亞文 sr Cyrl
Српски (латиница) 塞爾維亞文 sr-Latn Latn
Slovenčina 斯洛伐克文 sk Latn
Slovenščina 斯洛維尼亞文 sl Latn
Español 西班牙文 es Latn 歐洲人
Svenska 瑞典文 sv Latn
Tagalog 塔加路文 tl Latn
தமிழ் 泰米爾文 ta Taml
తెలుగు 泰盧固文 te Telu
ไทย 泰文 th Thai
Türkçe 土耳其文 tr Latn
Українська 烏克蘭語 uk Cyrl
Tiếng Việt 越南文 vi Latn
Yiddish 意第緒語 yi Hebr

實驗語言

下列語言仍在開發中,尚未定期評估。

語言 語言 (英文名稱) languageHints 代碼 指令碼 附註
አማርኛ 阿姆哈拉文 am Ethi
Αρχαία ελληνικά 古希臘文 grc Grek
অসমীয়া 阿薩姆文 as Beng
Azərbaycan 阿塞拜疆語 az Latn
Azərbaycan (qədim yazı) 阿塞拜疆語 az-Cyrl Cyrl 舊正字法
Euskara 巴斯克文 eu Latn
Bosanski 波士尼亞文 bs Latn
မြန်မာ 緬甸文 my Mymr
Cebuano 宿霧文 ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ 切羅基文 chr Cher
dhivehi, dhivehi-bas 迪維希文 dv Thaa
རྫོང་ཁ 宗喀語 dz Tibt
Esperanto 世界文 eo Latn
Galego 加里西亞文 gl Latn
ქართული 喬治亞文 ka Geor
Kreyòl Ayisyen 海地克里奧爾文 ht Latn
Gaeilge 愛爾蘭文 ga Latn
Jawa 爪哇文 jv Latn
Қазақ 哈薩克文 kk Cyrl
Kirghiz 吉爾吉斯文 ky Cyrl
Latine 拉丁文 la Latn
Malti 馬耳他文 mt Latn
Монгол 蒙古文 mn Cyrl
ଓଡ଼ିଆ 奧里雅語 or Orya
پښتو 普什圖文 ps Arab
संस्कृतम् 梵文 sa Deva
සිංහල 錫蘭文 si Sinh
Swahili 斯瓦希里文 sw Latn
leššānā Suryāyā 敘利亞文 syr Syriac
བོད་སྐད་ 藏文 bo Tibt
ትግርኛ 提格里尼亞語 ti Ethi
اردو 烏都文 ur Arab
oʻzbekcha 烏茲別克文 uz Latn 拉丁文
oʻzbekcha 烏茲別克文 uz-Cyrl Cyrl 舊正字法
Cymraeg 威爾斯文 cy Latn
IsiZulu 祖魯語 zu Latn

對應語言

以下語言會對應至其他語言代碼,或對應至一般字元辨識器。

語言 語言 (英文名稱) languageHints 代碼 指令碼 附註
بهسا اچيه 亞齊語 ace Latn 拉丁文模式
Lwo 阿喬利語 ach Latn 拉丁文模式
Dangme 阿當莫 ada Latn 拉丁文模式
Akan 阿肯文 ak Latn 拉丁文模式
Anicinâbemowin Algonquinian alg Latn 拉丁文模式
Mapudungu 阿勞卡尼亞/馬普切 arn Latn 拉丁文模式
Asturianu 阿斯圖里亞斯文 ast Latn 拉丁文模式
Dene Athabaskan ath Latn 拉丁文模式
Aymar aru 艾馬拉文 ay Latn 拉丁文模式
Bhāṣa Bali 峇里文 ban Latn 拉丁文模式
Bamanankan 班巴拉文 bm Latn 拉丁文模式
Narrow Bantu 班圖 bnt Latn 拉丁文模式
башҡорт теле 巴什噶爾語 ba Cyrl 斯拉夫文模型
Toba–Batak 巴塔克文 btk Latn 拉丁文模式
Chibemba 本巴語 bem Latn 拉丁文模式
Bikol Naga 比科爾語 bik Latn 拉丁文模式
Bichelamar 碧斯拉瑪文 bi Latn 拉丁文模式
Brezhoneg 布列塔尼語 br Latn 拉丁文模式
нохчийн мотт / noxçiyn mott 車臣文 ce Cyrl 斯拉夫文模型
汉语 中文 (簡體) zh-Hans Hans 中文模式
漢語 中文 (國語,繁體) zh-Hant Hant 中文模式
普通話 中文 (繁體,香港) zh-Hant-HK Hant 中文模式
Chahta' 查克托文 cho Latn 拉丁文模式
Чӑвашла 楚瓦什語 cv Cyrl 斯拉夫文模型
Cree–Montagnais–Naskapi 克里文 cr Latn 拉丁文模式
Mvskoke Creek mus Latn 拉丁文模式
qırımtatar tili, къырымтатар тили 克里米亞韃靼語 crh Latn 斯拉夫文模型
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn 拉丁文模式
Douala Duala dua Latn 拉丁文模式
Ikɔ Efik 埃菲克文 efi Latn 拉丁文模式
English (British) 英文 (英國) en-GB Latn 拉丁文模式
Èʋegbe 埃維文 ee Latn 拉丁文模式
føroyskt mál 法羅語 fo Latn 拉丁文模式
Na Vosa Vakaviti 斐濟語 fj Latn 拉丁文模式
fɔ̀ngbè 豐文 fon Latn 拉丁文模式
Français canadien 法語 (加拿大) fr-CA Latn 拉丁文模式
Fulani, Fulah, Peul 富拉文 ff Latn 拉丁文模式
加語 gaa Latn 拉丁文模式
Luganda 干達文 lg Latn 拉丁文模式
Basa Gayo 嘉佑文 gay Latn 拉丁文模式
Kiribati 吉里巴斯 gil Latn 拉丁文模式
Gothic 歌德文 got Latn 拉丁文模式
Guaraní 瓜拉尼語 gn Latn 拉丁文模式
Harshen/Halshen Hausa هَرْشَن هَوْسَ 豪薩文 ha Latn 拉丁文模式
ʻŌlelo Hawaiʻi 夏威夷文 haw Latn 拉丁文模式
Otjiherero Herero hz Latn 拉丁文模式
Ilonggo 希里蓋農語 hil Latn 拉丁文模式
Jaku Iban 伊邦文 iba Latn 拉丁文模式
Asụsụ Igbo 伊博文 ig Latn 拉丁文模式
Ilokano 伊洛果語 ilo Latn 拉丁文模式
Taqbaylit 卡比爾 kab Latn 拉丁文模式
Jingpho 克欽 kac Latn 拉丁文模式
Kalaallisut 克拉蘇特文 kl Latn 拉丁文模式
Kikamba 坎巴文 kam Latn 拉丁文模式
Kanuri 卡努里文 kr Latn 拉丁文模式
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى 卡拉卡爾帕克文 kaa Cyrl/Latn 斯拉夫文模型
Ka Ktien Khasi 卡西文 kha Latn 拉丁文模式
Gĩkũyũ 基庫猶文 ki Latn 拉丁文模式
Kinyarwanda 盧安達文 rw Latn 拉丁文模式
коми кыв 科米文 kv Cyrl 斯拉夫文模型
Kikongo 剛果文 kg Latn 拉丁文模式
Kosraean Kosraean kos Latn 拉丁文模式
Oshikwanyama 庫安亞瑪 kj Latn 拉丁文模式
Ngala 林格拉文 ln Latn 拉丁文模式
Plattdütsch, Plattdeutsch, Nedersaksisch 低地德語 nds Latn 拉丁文模式
siLozi 洛齊文 loz Latn 拉丁文模式
Kiluba 盧巴卡坦加文 lu Latn 拉丁文模式
Dholuo 盧歐語 luo Latn 拉丁文模式
Madhura, Basa Mathura, بَهاسَ مَدورا 馬都拉文 mad Latn 拉丁文模式
Malagasy 馬達加斯加文 mg Latn 拉丁文模式
Mandinka, لغة مندنكا 曼丁哥 man Latn 拉丁文模式
Gaelg, Gailck 曼島文 gv Latn 拉丁文模式
Te reo Māori 毛利文 mi Latn 拉丁文模式
Ebon 馬紹爾文 mh Latn 拉丁文模式
Mɛnde yia 曼德族文 men Latn 拉丁文模式
Middle English 中古英語 enm Latn 拉丁文模式
Mittelhochdeutsch 中古高地德語 gmh Latn 拉丁文模式
Baso Minangkabau, باسو مينڠكاباو 米南佳保文 min Latn 拉丁文模式
Kanienʼkéha Mohawk moh Latn 拉丁文模式
Nkundu Mongo lol Latn 拉丁文模式
Nāhuatl 納瓦特爾文 nah Latn 拉丁文模式
Diné bizaad 納瓦伙文 nv Latn 拉丁文模式
Ndonga 恩東佳文 ng Latn 拉丁文模式
ko e vagahau Niuē 紐埃文 niu Latn 拉丁文模式
Zimbabwe Ndebele 北恩德貝萊文 nd Latn 拉丁文模式
Sesotho sa Leboa 北索托文 nso Latn 拉丁文模式
Chichewa, Chinyanja 尼揚賈文 ny Latn 拉丁文模式
Runyankore 尼揚科勒文 nyn Latn 拉丁文模式
Chitonga Nyasa Tonga tog Latn 拉丁文模式
Appolo Nzima nzi Latn 拉丁文模式
Occitan, lenga d'òc, provençal 奧克語 oc Latn 拉丁文模式
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ 歐及布威文 oj Latn 拉丁文模式
Ænglisc, Englisc, Anglisc 古英文 ang Latn 拉丁文模式
Franceis, François, Romanz 古法文 fro Latn 拉丁文模式
Diutisk, Althochdeutsch 古高地德語 goh Latn 拉丁文模式
Dǫnsk tunga 古諾爾斯語 non Latn 拉丁文模式
Occitan ancian 古普羅旺斯 pro Latn 拉丁文模式
ирон ӕвзаг Ossetic os Cyrl 斯拉夫文模型
Kapampangan 邦板牙 pam Latn 拉丁文模式
Salitan Pangasinan 邦阿西楠語 pag Latn 拉丁文模式
Papiamentu 帕皮阿門多語 pap Latn 拉丁文模式
Português (Portugal) 葡萄牙文 (歐洲) pt-PT Latn 拉丁文模式
Kechua / Runa Simi 克丘亞文 qu Latn 拉丁文模式
Rumantsch 羅曼斯文 rm Latn 拉丁文模式
Romani čhib 吉普賽文 rom Latn 拉丁文模式
Ikirundi 基隆迪語 rn Latn 拉丁文模式
Sakha 薩哈文 sah Cyrl 斯拉夫文模型
Gagana faʻa Sāmoa 薩摩亞文 sm Latn 拉丁文模式
yângâ tî sängö 桑戈語 sg Latn 拉丁文模式
(Braid) Scots, Lallans, Doric 低地蘇格蘭文 sco Latn 拉丁文模式
Gàidhlig 蘇格蘭蓋爾文 gd Latn 拉丁文模式
chiShona 修納文 sn Latn 拉丁文模式
Songhay 松蓋 son Latn 拉丁文模式
Sesotho 塞索托文 st Latn 拉丁文模式
Español (Latinoamérica) 西班牙文 (拉丁美洲) es-419 Latn 拉丁文模式
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda 巽他文 su Latn 拉丁文模式
siSwati 史瓦濟語 ss Latn 拉丁文模式
Reo Tahiti 塔希提文 ty Latn 拉丁文模式
тоҷикӣ 塔吉克文 tg Cyrl 斯拉夫文模型
татар теле 韃靼文 tt Cyrl/Latn 斯拉夫文模型
KʌThemnɛ 譚姆恩族文 tem Latn 拉丁文模式
lea faka-Tonga 東加文 to Latn 拉丁文模式
Xitsonga 宗卡文 ts Latn 拉丁文模式
Setswana 札那語 tn Latn 拉丁文模式
Türkmençe 土庫曼語 tk Latn 斯拉夫文模型
удмурт кыл 烏德穆爾特文 udm Cyrl 斯拉夫文模型
Tshivenḓa 溫達文 ve Latn 拉丁文模式
Vod Votic vot Cyrl/Latn 斯拉夫文模型
Frysk 西弗里西亞文 fy Latn 拉丁文模式
Wolof 沃洛夫文 wo Latn 拉丁文模式
isiXhosa 科薩文 xh Latn 拉丁文模式
Èdè Yorùbá 約魯巴文 yo Latn 拉丁文模式
Diidxazá Zapotec zap Latn 拉丁文模式

手寫指令碼

系統支援下列手寫辨識語系,請參閱上方的語言表格,瞭解各個文字系統所使用的語言。

指令碼 名稱 支援等級
Beng 孟加拉文 實驗功能
Cyrl 斯拉夫文 實驗功能
Deva 梵文 實驗功能
Grek 希臘文 實驗功能
Hani 中文 實驗功能
Jpan 日文 支援
Kore 韓文 支援
Latn 拉丁文 支援
vi 越南文 實驗功能