OCR 语言支持

Cloud Vision API 的文本识别功能可以检测多种语言,还可以检测单张图片中的多种语言。

无需为该服务提供语言提示,不过,如果该服务难以检测您的图片中所用的语言,则可以提供语言提示。

随着手写 OCR 正式版 (GA) 的发布,使用 DOCUMENT_TEXT_DETECTION 时包含手写内容的图片不再需要手写 languageHints 标志。

可选语言提示在请求的 ImageContext 中指定,作为 TEXT_DETECTIONDOCUMENT_TEXT_DETECTION 请求的一系列 languageHints

每个语言代码参数通常都包含一个 BCP-47 标识符。此参数可以采用“language-region”的格式,其中“language”是指主要语言,“region”(可选)是指特定方言的地区(通常是国家/地区标识符)。例如,中文可以表示为中华人民共和国的简体中文 (zh-Hans) 或台湾地区的繁体中文 (zh-Hant)。

文本识别功能支持三种级别的语言:

  1. 受支持语言,我们会优先考虑这些语言,并定期进行性能评估。
  2. 实验性语言,这些语言正处于开发阶段,但不会定期评估。
  3. 映射语言,这些语言可通过映射到其他语言代码或常规字符识别器而获得支持。例如,“en-GB”受支持,但出于识别文本的目的,系统不会将其与“en”区分对待。我们会尽力在“实体”语言区域字段中返回正确的映射语言代码,但是与完全受支持的语言或用实验方法支持的语言相比,映射语言更有可能被误识别为相似的语言。

下面显示了 TEXT_DETECTIONDOCUMENT_TEXT_DETECTION 支持的语言列表(包含关联的 languageHint 代码)。

如果语言提示留为空白,我们将尝试自动检测最合适的语言。TEXT_DETECTION 端点将仅会自动检测部分受支持的语言,而 DOCUMENT_TEXT_DETECTION 端点将自动检测全部受支持的语言。

支持的语言

以下语言会得到优先考虑并会定期进行评估。

如需按功能过滤,请从下拉菜单中输入或直接选择所需的语言:

语言 语言(中文名称) languageHints 代码 脚本 备注
Afrikaans 南非荷兰语 af Latn
shqip 阿尔巴尼亚语 sq Latn
العربية 阿拉伯语 ar Arab 现代标准
Հայ 亚美尼亚文 hy Armn
беларуская 白俄罗斯语 be Cyrl
বাংলা 孟加拉文 bn Beng
български 保加利亚语 bg Cyrl
Català 加泰罗尼亚语 ca Latn
普通话 中文 zh Hans/Hant
Hrvatski 克罗地亚语 hr Latn
Čeština 捷克语 cs Latn
Dansk 丹麦语 da Latn
Nederlands 荷兰语 nl Latn
English 英语 en Latn 美国
Eesti keel 爱沙尼亚语 et Latn
Filipino 菲律宾语 fil Latn
Suomi 芬兰语 fi Latn
Français 法语 fr Latn 欧洲
Deutsch 德语 de Latn
Ελληνικά 希腊语 el Grek
ગુજરાતી 古吉拉特语 gu Gujr
עברית 希伯来语 iw Hebr
हिन्दी 印地语 hi Deva
Magyar 匈牙利语 hu Latn
Íslenska 冰岛语 is Latn
Bahasa Indonesia 印度尼西亚语 id Latn
Italiano 意大利语 it Latn
日本語 日语 ja Jpan
ಕನ್ನಡ 卡纳达文 kn Knda
ភាសាខ្មែរ 高棉文 km Khmr
한국어 韩语 ko Kore
ລາວ 老挝文 lo Laoo
Latviešu 拉脱维亚语 lv Latn
Lietuvių 立陶宛语 lt Latn
Македонски 马其顿语 mk Cyrl
Bahasa Melayu 马来语 ms Latn
മലയാളം 马拉雅拉姆语 ml Mlym
मराठी 马拉地语 mr Deva
नेपाली 尼泊尔语 ne Deva
Norsk 挪威语 no Latn 博克马尔语
فارسی 波斯语 fa Arab
Polski 波兰语 pl Latn
Português 葡萄牙语 pt Latn 巴西
ਪੰਜਾਬੀ 旁遮普语 pa Guru 果鲁穆奇文
Română 罗马尼亚语 ro Latn
Русский 俄语 ru Cyrl
Русский (старая орфография) 俄语 ru-PETR1708 Cyrl 古正字法
Српски 塞尔维亚语 sr Cyrl
Српски (латиница) 塞尔维亚语 sr-Latn Latn
Slovenčina 斯洛伐克语 sk Latn
Slovenščina 斯洛文尼亚语 sl Latn
Español 西班牙语 es Latn 欧洲
Svenska 瑞典语 sv Latn
Tagalog 塔加路文 tl Latn
தமிழ் 泰米尔文 ta Taml
తెలుగు 泰卢固语 te Telu
ไทย 泰语 th Thai
Türkçe 土耳其语 tr Latn
Українська 乌克兰语 uk Cyrl
Tiếng Việt 越南语 vi Latn
Yiddish 意第绪语 yi Hebr

实验性语言

以下语言正处于开发阶段,但不会定期评估。

语言 语言(中文名称) languageHints 代码 脚本 备注
አማርኛ 阿姆哈拉语 am Ethi
Αρχαία ελληνικά 古希腊语 grc Grek
অসমীয়া 阿萨姆语 as Beng
Azərbaycan 阿塞拜疆语 az Latn
Azərbaycan (qədim yazı) 阿塞拜疆语 az-Cyrl Cyrl 古正字法
Euskara 巴斯克语 eu Latn
Bosanski 波斯尼亚语 bs Latn
မြန်မာ 缅甸语 my Mymr
Cebuano 宿务语 ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ 切罗基文 chr Cher
dhivehi, dhivehi-bas 迪维希语 dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto 世界语 eo Latn
Galego 加利西亚语 gl Latn
ქართული 格鲁吉亚语 ka Geor
Kreyòl Ayisyen 海地克里奥尔语 ht Latn
Gaeilge 爱尔兰语 ga Latn
Jawa 爪哇语 jv Latn
Қазақ 哈萨克语 kk Cyrl
Kirghiz 吉尔吉斯语 ky Cyrl
Latine 拉丁语 la Latn
Malti 马耳他语 mt Latn
Монгол 蒙古文 mn Cyrl
ଓଡ଼ିଆ 奥里亚语 or Orya
پښتو 普什图语 ps Arab
संस्कृतम् 梵语 sa Deva
සිංහල 僧伽罗文 si Sinh
Swahili 斯瓦希里语 sw Latn
leššānā Suryāyā 叙利亚文 syr Syriac
བོད་སྐད་ 藏文 bo Tibt
ትግርኛ Tigirinya ti Ethi
اردو 乌尔都语 ur Arab
oʻzbekcha 乌兹别克语 uz Latn 拉丁语
oʻzbekcha 乌兹别克语 uz-Cyrl Cyrl 古正字法
Cymraeg 威尔士语 cy Latn
IsiZulu 祖鲁语 zu Latn

映射语言

以下语言会映射到其他语言代码或映射到常规字符识别器。

语言 语言(中文名称) languageHints 代码 脚本 备注
بهسا اچيه 亚齐语 ace Latn 拉丁模型
Lwo 阿乔利语 ach Latn 拉丁模型
Dangme Adangme ada Latn 拉丁模型
Akan 阿坎语 ak Latn 拉丁模型
Anicinâbemowin 阿尔贡金语 alg Latn 拉丁模型
Mapudungu 阿洛柯语/马普切语 arn Latn 拉丁模型
Asturianu 阿斯图里亚斯语 ast Latn 拉丁模型
Dene 阿萨巴斯卡语 ath Latn 拉丁模型
Aymar aru 艾马拉语 ay Latn 拉丁模型
Bhāṣa Bali 巴厘文 ban Latn 拉丁模型
Bamanankan 班巴拉语 bm Latn 拉丁模型
Narrow Bantu 班图语 bnt Latn 拉丁模型
башҡорт теле 巴什基尔语 ba Cyrl 西里尔语模式
Toba–Batak 巴塔克文 btk Latn 拉丁模型
Chibemba 奔巴语 bem Latn 拉丁模型
Bikol Naga 比考尔语 bik Latn 拉丁模型
Bichelamar 比斯拉马语 bi Latn 拉丁模型
Brezhoneg 布列塔尼语 br Latn 拉丁模型
нохчийн мотт / noxçiyn mott 车臣语 ce Cyrl 西里尔语模式
汉语 中文(普通话,简体) zh-Hans Hans 中国模式
漢語 中文(普通话,繁体) zh-Hant Hant 中国模式
普通話 中文(普通话,香港) zh-Hant-HK Hant 中国模式
Chahta' 乔克托语 cho Latn 拉丁模型
Чӑвашла 楚瓦什语 cv Cyrl 西里尔语模式
Cree–Montagnais–Naskapi 克里语 cr Latn 拉丁模型
Mvskoke Creek mus Latn 拉丁模型
qırımtatar tili, къырымтатар тили 克里米亚鞑靼语 crh Latn 西里尔语模式
Dakhótiyapi, Dakȟótiyapi 达科他语 dak Latn 拉丁模型
Douala Duala dua Latn 拉丁模型
Ikɔ Efik 埃菲克语 efi Latn 拉丁模型
English (British) 英语(英国) en-GB Latn 拉丁模型
Èʋegbe 埃维语 ee Latn 拉丁模型
føroyskt mál 法罗语 fo Latn 拉丁模型
Na Vosa Vakaviti 斐济语 fj Latn 拉丁模型
fɔ̀ngbè 丰族语 fon Latn 拉丁模型
Français canadien 法语(加拿大) fr-CA Latn 拉丁模型
Fulani, Fulah, Peul Fulah ff Latn 拉丁模型
加 (Ga) 语 gaa Latn 拉丁模型
Luganda 干达语 lg Latn 拉丁模型
Basa Gayo 卡约语 gay Latn 拉丁模型
Kiribati 吉尔伯特语 gil Latn 拉丁模型
Gothic 哥特文 got Latn 拉丁模型
Guaraní 瓜拉尼人 gn Latn 拉丁模型
Harshen/Halshen Hausa هَرْشَن هَوْسَ 豪萨语 ha Latn 拉丁模型
ʻŌlelo Hawaiʻi 夏威夷语 haw Latn 拉丁模型
Otjiherero 赫雷罗语 hz Latn 拉丁模型
Ilonggo 希利盖农语 hil Latn 拉丁模型
Jaku Iban 伊班语 iba Latn 拉丁模型
Asụsụ Igbo 伊博语 ig Latn 拉丁模型
Ilokano Iloko ilo Latn 拉丁模型
Taqbaylit 卡拜尔语 kab Latn 拉丁模型
Jingpho 克钦语 kac Latn 拉丁模型
Kalaallisut 格陵兰语 kl Latn 拉丁模型
Kikamba 卡姆巴语 kam Latn 拉丁模型
Kanuri 卡努里语 kr Latn 拉丁模型
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى 卡拉卡尔帕克语 kaa Cyrl/Latn 西里尔语模式
Ka Ktien Khasi 卡西语 kha Latn 拉丁模型
Gĩkũyũ 吉库尤语 ki Latn 拉丁模型
Kinyarwanda 卢旺达语 rw Latn 拉丁模型
коми кыв 科米语 kv Cyrl 西里尔语模式
Kikongo 刚果语 kg Latn 拉丁模型
Kosraean 科斯拉伊语 kos Latn 拉丁模型
Oshikwanyama 宽尼亚玛语 kj Latn 拉丁模型
Ngala 林格拉语 ln Latn 拉丁模型
Plattdütsch, Plattdeutsch, Nedersaksisch 低地德语 nds Latn 拉丁模型
siLozi 罗兹 (Lozi) 语 loz Latn 拉丁模型
Kiluba 卢巴加丹加语 lu Latn 拉丁模型
Dholuo 卢奥语 luo Latn 拉丁模型
Madhura, Basa Mathura, بَهاسَ مَدورا 马都拉语 mad Latn 拉丁模型
Malagasy 马尔加什语 mg Latn 拉丁模型
Mandinka, لغة مندنكا 曼丁果语 man Latn 拉丁模型
Gaelg, Gailck 马恩岛语 gv Latn 拉丁模型
Te reo Māori 毛利语 mi Latn 拉丁模型
Ebon 马绍尔语 mh Latn 拉丁模型
Mɛnde yia 门德语 men Latn 拉丁模型
Middle English 中古英语 enm Latn 拉丁模型
Mittelhochdeutsch 中古高地德语 gmh Latn 拉丁模型
Baso Minangkabau, باسو مينڠكاباو 米南佳保语 min Latn 拉丁模型
Kanienʼkéha 莫霍克语 moh Latn 拉丁模型
Nkundu 蒙戈语 lol Latn 拉丁模型
Nāhuatl 纳瓦特尔语 nah Latn 拉丁模型
Diné bizaad Navajo nv Latn 拉丁模型
Ndonga 恩东加语 ng Latn 拉丁模型
ko e vagahau Niuē 纽埃语 niu Latn 拉丁模型
Zimbabwe Ndebele 北恩德贝勒语 nd Latn 拉丁模型
Sesotho sa Leboa 北索托语 nso Latn 拉丁模型
Chichewa, Chinyanja 尼扬贾语 ny Latn 拉丁模型
Runyankore 尼扬科莱语 nyn Latn 拉丁模型
Chitonga 汤加语(尼亚萨地区) tog Latn 拉丁模型
Appolo 恩济马语 nzi Latn 拉丁模型
Occitan, lenga d'òc, provençal 奥克斯坦语 oc Latn 拉丁模型
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ 奥杰布瓦语 oj Latn 拉丁模型
Ænglisc, Englisc, Anglisc 古英语 ang Latn 拉丁模型
Franceis, François, Romanz 古法语 fro Latn 拉丁模型
Diutisk, Althochdeutsch 古高地德语 goh Latn 拉丁模型
Dǫnsk tunga 古诺斯语 non Latn 拉丁模型
Occitan ancian 古普罗文斯语 pro Latn 拉丁模型
ирон ӕвзаг 奥塞特语 os Cyrl 西里尔语模式
Kapampangan 邦板牙语 pam Latn 拉丁模型
Salitan Pangasinan 邦阿西楠语 pag Latn 拉丁模型
Papiamentu 帕皮亚内托语 pap Latn 拉丁模型
Português (Portugal) 葡萄牙语(欧洲) pt-PT Latn 拉丁模型
Kechua / Runa Simi 克丘亚语 qu Latn 拉丁模型
Rumantsch 罗曼什语 rm Latn 拉丁模型
Romani čhib 吉普赛语 rom Latn 拉丁模型
Ikirundi 隆迪语 rn Latn 拉丁模型
Sakha 萨哈语 sah Cyrl 西里尔语模式
Gagana faʻa Sāmoa 萨摩亚语 sm Latn 拉丁模型
yângâ tî sängö 桑戈语 sg Latn 拉丁模型
(Braid) Scots, Lallans, Doric 苏格兰语 sco Latn 拉丁模型
Gàidhlig 苏格兰盖尔语 gd Latn 拉丁模型
chiShona 修纳语 sn Latn 拉丁模型
Songhay Songhai son Latn 拉丁模型
Sesotho 南索托文 st Latn 拉丁模型
Español (Latinoamérica) 西班牙语(拉丁美洲) es-419 Latn 拉丁模型
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda 巽他文 su Latn 拉丁模型
siSwati 斯瓦特语 ss Latn 拉丁模型
Reo Tahiti 塔希提语 ty Latn 拉丁模型
тоҷикӣ 塔吉克语 tg Cyrl 西里尔语模式
татар теле 鞑靼语 tt Cyrl/Latn 西里尔语模式
KʌThemnɛ 提姆语 tem Latn 拉丁模型
lea faka-Tonga 汤加语 to Latn 拉丁模型
Xitsonga 宗加语 ts Latn 拉丁模型
Setswana 茨瓦纳语 tn Latn 拉丁模型
Türkmençe 土库曼语 tk Latn 西里尔语模式
удмурт кыл 乌德穆尔特人 udm Cyrl 西里尔语模式
Tshivenḓa 文达语 ve Latn 拉丁模型
Vod 沃提克语 vot Cyrl/Latn 西里尔语模式
Frysk 西弗里西亚语 fy Latn 拉丁模型
Wolof 沃洛夫语 wo Latn 拉丁模型
isiXhosa 科萨语 xh Latn 拉丁模型
Èdè Yorùbá 约鲁巴语 yo Latn 拉丁模型
Diidxazá 萨波特克语 zap Latn 拉丁模型

手写文字

以下文字支持手写识别。请查看上述语言表,了解使用每种文字的语言。

脚本 名称 支持级别
Beng 孟加拉文 实验性
Cyrl 西里尔文 实验性
Deva 梵文 实验性
Grek 希腊文 实验性
Hani 中文 实验性
Jpan 日语 支持
Kore 韩语 支持
Latn 拉丁语 支持
vi 越南语 实验性