Google Distributed Cloud (GDC) air-gapped 的文字辨識功能可偵測多種語言,並在單一圖片中偵測多種語言。
您可以為光學字元辨識 (OCR) API 要求指定選用的語言提示。舉例來說,如果 API 無法偵測圖片中使用的語言,您可能需要提供提示。
如要指定選用的語言提示,請在 BatchAnnotateImages 或 BatchAnnotateFiles 要求的 image_context 欄位中,以 language_hints 欄位中的值清單形式新增提示。
language_hints 格式採用下列 BCP 47 語言代碼格式設定規範:
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
舉例來說,語言提示 en-t-i0-handwrit 表示語言為「從手寫轉換的英文」。
文字辨識功能支援三種語言層級:
- 我們會定期評估成效,優先支援支援的語言。
- 實驗語言仍處於積極開發階段。他們沒有定期進行績效評估。
- 對應的語言可透過對應至其他語言代碼或一般字元辨識器來支援。舉例來說,en-GB支援文字辨識,但系統不會以不同方式處理en。OCR 服務會嘗試在entity欄位中傳回正確的對應語言代碼。不過,相應語言比完全或實驗性支援的語言更容易誤判。
OCR 服務的主要功能之一是偵測及擷取圖片中的文字。例如手寫文字。如需手寫辨識功能支援的手寫文字清單,請參閱「手寫文字」。
支援的語言
文字辨識功能會優先處理支援的語言,並定期評估。如要依語言篩選,請在下列欄位中輸入語言:
| 語言 | 語言 (英文名稱) | 語言提示代碼 | 腳本和附註 | 
|---|---|---|---|
| 南非荷蘭文 | 南非荷蘭文 | af | Latn | 
| shqip | 阿爾巴尼亞文 | sq | Latn | 
| العربية | 阿拉伯文 | ar | 阿拉伯文;現代標準 | 
| беларуская | 白俄羅斯語 | be | Cyrl | 
| български | 保加利亞文 | bg | Cyrl | 
| Català | 加泰隆尼亞文 | ca | Latn | 
| 普通話 | 中文 | zh | 漢斯/漢特 | 
| Hrvatski | 克羅埃西亞文 | hr | Latn | 
| Čeština | 捷克文 | cs | Latn | 
| Dansk | 丹麥文 | da | Latn | 
| Nederlands | 荷蘭文 | nl | Latn | 
| 英文 | 英文 | en | Latn; American | 
| Eesti keel | 愛沙尼亞 | et | Latn | 
| 菲律賓文 | 菲律賓文 | fil或tl | Latn | 
| Suomi | 芬蘭文 | fi | Latn | 
| Français | 法文 | fr | Latn; European | 
| Deutsch | 德文 | de | Latn | 
| Ελληνικά | 希臘文 | el | Grek | 
| עברית | 希伯來文 | iw | Hebr | 
| हिन्दी | 北印度文 | hi | 戴瓦 | 
| Magyar | 匈牙利文 | hu | Latn | 
| Íslenska | 冰島文 | is | Latn | 
| Bahasa Indonesia | 印尼文 | id | Latn | 
| Italiano | 義大利文 | it | Latn | 
| 日本語 | 日文 | ja | 日本 | 
| 한국어 | 韓文 | ko | Kore | 
| Latviešu | 拉脫維亞文 | lv | Latn | 
| Lietuvių | 立陶宛文 | lt | Latn | 
| Македонски | 馬其頓文 | mk | Cyrl | 
| 馬來文 | 馬來文 | ms | Latn | 
| മലയാളം | 馬拉雅拉姆文 | ml | Mlym | 
| मराठी | 馬拉地文 | mr | 戴瓦 | 
| नेपाली | 尼泊爾文 | ne | 戴瓦 | 
| Norsk | 挪威文 | no | Latn; Bokmål | 
| فارسی | 波斯文 | fa | 阿拉伯 | 
| Polski | 波蘭文 | pl | Latn | 
| Português | 葡萄牙文 | pt | Latn;巴西 | 
| Română | 羅馬尼亞文 | ro | Latn | 
| Русский | 俄文 | ru | Cyrl | 
| Русский (старая орфография) | 俄文 | ru-PETR1708 | Cyrl; Old Orthography | 
| Српски | 塞爾維亞文 | sr | Cyrl & Latn | 
| Српски (латиница) | 塞爾維亞文 | sr-Latn | Latn | 
| Slovenčina | 斯洛伐克文 | sk | Latn | 
| Slovenščina | 斯洛維尼亞文 | sl | Latn | 
| Español | 西班牙文 | es | Latn; European | 
| Svenska | 瑞典文 | sv | Latn | 
| 塔加路文 | 塔加路文 | tl | Latn | 
| Türkçe | 土耳其文 | tr | Latn | 
| Українська | 烏克蘭文 | uk | Cyrl | 
| Tiếng Việt | 越南文 | vi | Latn | 
| 意第緒語 | 意第緒語 | yi | Hebr | 
實驗語言
實驗語言仍在積極開發中,尚未經過評估。如要依語言篩選,請在下列欄位中輸入語言:
| 語言 | 語言 (英文名稱) | 語言提示代碼 | 腳本和附註 | 
|---|---|---|---|
| Αρχαία ελληνικά | 古希臘文 | grc | Grek | 
| Azərbaycan | 阿塞拜疆語 | az | Latn | 
| Azərbaycan (qədim yazı) | 阿塞拜疆語 | az-Cyrl | Cyrl; old orthography | 
| Euskara | 巴斯克文 | eu | Latn | 
| Bosanski | 波士尼亞文 | bs | Latn | 
| 宿霧文 | 宿霧文 | ceb | Latn | 
| 世界文 | 世界文 | eo | Latn | 
| Galego | 加里西亞文 | gl | Latn | 
| ქართული | 喬治亞文 | ka | Geor | 
| Kreyòl Ayisyen | 海地克里奧爾文 | ht | Latn | 
| Gaeilge | 愛爾蘭文 | ga | Latn | 
| Jawa | 爪哇文 | jv | Latn | 
| Қазақ | 哈薩克文 | kk | Cyrl | 
| 吉爾吉斯文 | 吉爾吉斯文 | ky | Cyrl | 
| Latine | 拉丁文 | la | Latn | 
| Malti | 馬耳他文 | mt | Latn | 
| Монгол | 蒙古文 | mn | Cyrl | 
| پښتو | 普什圖文 | ps | 阿拉伯 | 
| संस्कृतम् | 梵文 | sa | 戴瓦 | 
| 斯瓦希里文 | 斯瓦希里文 | sw | Latn | 
| اردو | 烏都文 | ur | 阿拉伯 | 
| oʻzbekcha | 烏茲別克文 | uz | Latn;拉丁文 | 
| oʻzbekcha | 烏茲別克文 | uz-Cyrl | Cyrl; old orthography | 
| Cymraeg | 威爾斯文 | cy | Latn | 
| IsiZulu | 祖魯語 | zu | Latn | 
對應的語言
對應語言會與其他語言代碼或一般字元辨識器建立關聯。如要依語言篩選,請在下列欄位中輸入語言:
| 語言 | 語言 (英文名稱) | 語言提示代碼 | 腳本和附註 | 對應至 | 
|---|---|---|---|---|
| بهسا اچيه | 亞齊語 | ace | Latn | 拉丁字母模型 | 
| Lwo | 阿喬利語 | ach | Latn | 拉丁字母模型 | 
| 丹格貝文 | 阿當莫文 | ada | Latn | 拉丁字母模型 | 
| 阿肯文 | 阿肯文 | ak | Latn | 拉丁字母模型 | 
| Anicinâbemowin | 阿爾岡昆語 | alg | Latn | 拉丁字母模型 | 
| 馬普切文 | Araucanian/Mapuche | arn | Latn | 拉丁字母模型 | 
| 阿斯圖里亞斯文 | 阿斯圖里亞斯文 | ast | Latn | 拉丁字母模型 | 
| Dene | Athabaskan | ath | Latn | 拉丁字母模型 | 
| Aymar aru | 艾馬拉文 | ay | Latn | 拉丁字母模型 | 
| Bhāṣa Bali | 峇里文 | ban | Latn | 拉丁字母模型 | 
| Bamanankan | 班巴拉文 | bm | Latn | 拉丁字母模型 | 
| 窄幅班圖語 | 班圖 | bnt | Latn | 拉丁字母模型 | 
| башҡорт теле | 巴什噶爾語 | ba | Cyrl | 西里爾字母模型 | 
| 多巴巴塔克語 | 巴塔克文 | btk | Latn | 拉丁字母模型 | 
| 奇本巴文 | 本巴語 | bem | Latn | 拉丁字母模型 | 
| 比科爾文納加 | 比科爾語 | bik | Latn | 拉丁字母模型 | 
| 比切拉馬爾語 | 碧斯拉瑪文 | bi | Latn | 拉丁字母模型 | 
| Brezhoneg | 布列塔尼語 | br | Latn | 拉丁字母模型 | 
| нохчийн мотт / noxçiyn mott | 車臣文 | ce | Cyrl | 西里爾字母模型 | 
| 汉语 | 中文 | zh-Hans | 簡體中文;華語 | zh | 
| 漢語 | 中文 | zh-Hant | Hant; Traditional; Mandarin | zh | 
| 普通話 | 中文 | zh-Hant-HK | Hant; Mandarin; Hong Kong | zh | 
| Chahta' | 查克托文 | cho | Latn | 拉丁字母模型 | 
| Чӑвашла | 楚瓦什語 | cv | Cyrl | 西里爾字母模型 | 
| 克里文 - 蒙塔奈斯文 - 納斯卡皮文 | 克里文 | cr | Latn | 拉丁字母模型 | 
| Mvskoke | 小溪 | mus | Latn | 拉丁字母模型 | 
| qırımtatar tili, къырымтатар тили | 克里米亞韃靼語 | crh | Latn | 西里爾字母模型 | 
| Dakhótiyapi、Dakȟótiyapi | Dakota | dak | Latn | 拉丁字母模型 | 
| 杜阿拉 | Duala | dua | Latn | 拉丁字母模型 | 
| Ikɔ Efik | 埃菲克文 | efi | Latn | 拉丁字母模型 | 
| 英文 (英國) | 英文 | en-GB | Latn; British | en | 
| Èʋegbe | 埃維文 | ee | Latn | 拉丁字母模型 | 
| føroyskt mál | 法羅語 | fo | Latn | 拉丁字母模型 | 
| Na Vosa Vakaviti | 斐濟語 | fj | Latn | 拉丁字母模型 | 
| fɔ̀ngbè | 豐文 | fon | Latn | 拉丁字母模型 | 
| Français canadien | 法文 | fr-CA | Latn; Canadian | fr | 
| 富拉尼文、富拉文、富爾文 | 富拉文 | ff | Latn | 拉丁字母模型 | 
| Gã | 加語 | gaa | Latn | 拉丁字母模型 | 
| 盧干達文 | 干達文 | lg | Latn | 拉丁字母模型 | 
| 嘉佑文 | 嘉佑文 | gay | Latn | 拉丁字母模型 | 
| 吉里巴斯 | 吉里巴斯文 | gil | Latn | 拉丁字母模型 | 
| 歌德文 | 歌德文 | got | Latn | 拉丁字母模型 | 
| 瓜拉尼語 | 瓜拉尼語 | gn | Latn | 拉丁字母模型 | 
| Harshen/Halshen Hausa هَرْشَن هَوْسَ | 豪薩文 | ha | Latn | 拉丁字母模型 | 
| ʻŌlelo Hawaiʻi | 夏威夷文 | haw | Latn | 拉丁字母模型 | 
| Otjiherero | Herero | hz | Latn | 拉丁字母模型 | 
| Ilonggo | 希里蓋農語 | hil | Latn | 拉丁字母模型 | 
| Jaku Iban | 伊邦文 | iba | Latn | 拉丁字母模型 | 
| Asụsụ Igbo | 伊博文 | ig | Latn | 拉丁字母模型 | 
| 伊洛卡諾文 | 伊洛果語 | ilo | Latn | 拉丁字母模型 | 
| Taqbaylit | Kabyle | kab | Latn | 拉丁字母模型 | 
| 景頗文 | 克欽文 | kac | Latn | 拉丁字母模型 | 
| 克拉蘇特文 | 克拉蘇特文 | kl | Latn | 拉丁字母模型 | 
| 基坎巴文 | 坎巴文 | kam | Latn | 拉丁字母模型 | 
| 卡努里文 | 卡努里文 | kr | Latn | 拉丁字母模型 | 
| Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | 卡拉卡爾帕克文 | kaa | Cyrl/Latn | 西里爾字母模型 | 
| Ka Ktien Khasi | 卡西文 | kha | Latn | 拉丁字母模型 | 
| Gĩkũyũ | 基庫猶文 | ki | Latn | 拉丁字母模型 | 
| 盧安達文 | 盧安達文 | rw | Latn | 拉丁字母模型 | 
| коми кыв | 科米文 | kv | Cyrl | 西里爾字母模型 | 
| 剛果文 | 剛果文 | kg | Latn | 拉丁字母模型 | 
| 科斯雷文 | 科斯雷文 | kos | Latn | 拉丁字母模型 | 
| Oshikwanyama | Kuanyama | kj | Latn | 拉丁字母模型 | 
| Ngala | 林格拉文 | ln | Latn | 拉丁字母模型 | 
| Plattdütsch、Plattdeutsch、Nedersaksisch | 低地德語 | nds | Latn | 拉丁字母模型 | 
| siLozi | 洛齊文 | loz | Latn | 拉丁字母模型 | 
| Kiluba | 盧巴卡坦加文 | lu | Latn | 拉丁字母模型 | 
| 盧歐文 | 盧歐語 | luo | Latn | 拉丁字母模型 | 
| Madhura、Basa Mathura、بَهاسَ مَدورا | 馬都拉文 | mad | Latn | 拉丁字母模型 | 
| 馬達加斯加文 | 馬達加斯加文 | mg | Latn | 拉丁字母模型 | 
| 曼丁卡文,لغة مندنكا | 曼丁哥文 | man | Latn | 拉丁字母模型 | 
| Gaelg、Gailck | 曼島文 | gv | Latn | 拉丁字母模型 | 
| Te reo Māori | 毛利文 | mi | Latn | 拉丁字母模型 | 
| Ebon | 馬紹爾文 | mh | Latn | 拉丁字母模型 | 
| Mɛnde yia | 曼德族文 | men | Latn | 拉丁字母模型 | 
| 中古英語 | 中古英語 | enm | Latn | 拉丁字母模型 | 
| Mittelhochdeutsch | 中古高地德語 | gmh | Latn | 拉丁字母模型 | 
| Baso Minangkabau, باسو مينڠكاباو | 米南佳保文 | min | Latn | 拉丁字母模型 | 
| 卡尼恩凱哈文 | Mohawk | moh | Latn | 拉丁字母模型 | 
| Nkundu | Mongo | lol | Latn | 拉丁字母模型 | 
| 納瓦特爾文 | 納瓦特爾文 | nah | Latn | 拉丁字母模型 | 
| Diné bizaad | 納瓦伙文 | nv | Latn | 拉丁字母模型 | 
| 恩東佳文 | 恩東佳文 | ng | Latn | 拉丁字母模型 | 
| ko e vagahau Niuē | 紐埃文 | niu | Latn | 拉丁字母模型 | 
| 辛巴威恩德貝萊文 | 北恩德貝萊文 | nd | Latn | 拉丁字母模型 | 
| Sesotho sa Leboa | 北索托文 | nso | Latn | 拉丁字母模型 | 
| 齊切瓦文、奇尼安賈文 | 尼揚賈文 | ny | Latn | 拉丁字母模型 | 
| Runyankore | 尼揚科勒文 | nyn | Latn | 拉丁字母模型 | 
| 東加文 | 尼亞薩東加文 | tog | Latn | 拉丁字母模型 | 
| Appolo | Nzima | nzi | Latn | 拉丁字母模型 | 
| 奧克文、朗格多克文、普羅旺斯文 | 奧克語 | oc | Latn | 拉丁字母模型 | 
| Anishinaabemowin (ᐊᓂᔑᓈᐯᒧᐎᓐ) | 歐及布威文 | oj | Latn | 拉丁字母模型 | 
| Ænglisc、Englisc、Anglisc | 古英語 | ang | Latn | 拉丁字母模型 | 
| Franceis、François、Romanz | 古法文 | fro | Latn | 拉丁字母模型 | 
| Diutisk、Althochdeutsch | 古高地德語 | goh | Latn | 拉丁字母模型 | 
| Dǫnsk tunga | 古諾斯文 | non | Latn | 拉丁字母模型 | 
| Occitan ancian | 古普羅旺斯文 | pro | Latn | 拉丁字母模型 | 
| ирон ӕвзаг | 奧塞提文 | os | Cyrl | 西里爾字母模型 | 
| 邦板牙語 | 邦板牙 | pam | Latn | 拉丁字母模型 | 
| Salitan Pangasinan | 邦阿西楠語 | pag | Latn | 拉丁字母模型 | 
| Papiamentu | 帕皮阿門多語 | pap | Latn | 拉丁字母模型 | 
| Português (Portugal) | 葡萄牙文 | pt-PT | Latn; European | pt | 
| 克丘亞語 / Runa Simi | 克丘亞文 | qu | Latn | 拉丁字母模型 | 
| 羅曼斯文 | 羅曼斯文 | rm | Latn | 拉丁字母模型 | 
| 羅姆文 | 吉普賽文 | rom | Latn | 拉丁字母模型 | 
| Ikirundi | 基隆迪語 | rn | Latn | 拉丁字母模型 | 
| 薩哈文 | 薩哈文 | sah | Cyrl | 西里爾字母模型 | 
| Gagana faʻa Sāmoa | 薩摩亞文 | sm | Latn | 拉丁字母模型 | 
| yângâ tî sängö | 桑戈語 | sg | Latn | 拉丁字母模型 | 
| (Braid) Scots、Lallans、Doric | 低地蘇格蘭文 | sco | Latn | 拉丁字母模型 | 
| Gàidhlig | 蘇格蘭蓋爾文 | gd | Latn | 拉丁字母模型 | 
| chiShona | 修納文 | sn | Latn | 拉丁字母模型 | 
| 桑海 | 宋海 | son | Latn | 拉丁字母模型 | 
| 塞索托文 | 塞索托文 | st | Latn | 拉丁字母模型 | 
| Español (Latinoamérica) | 西班牙文 | es-419 | Latn;拉丁美洲 | es | 
| ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | 巽他文 | su | Latn | 拉丁字母模型 | 
| siSwati | 史瓦濟語 | ss | Latn | 拉丁字母模型 | 
| Reo Tahiti | 塔希提文 | ty | Latn | 拉丁字母模型 | 
| тоҷикӣ | 塔吉克文 | tg | Cyrl | 西里爾字母模型 | 
| татар теле | 韃靼文 | tt | Cyrl/Latn | 西里爾字母模型 | 
| KʌThemnɛ | 譚姆恩族文 | tem | Latn | 拉丁字母模型 | 
| lea faka-Tonga | 東加文 | to | Latn | 拉丁字母模型 | 
| 尚加文 | 宗卡文 | ts | Latn | 拉丁字母模型 | 
| 塞茲瓦那文 | 札那語 | tn | Latn | 拉丁字母模型 | 
| Türkmençe | 土庫曼語 | tk | Latn | 西里爾字母模型 | 
| удмурт кыл | 烏德穆爾特文 | udm | Cyrl | 西里爾字母模型 | 
| Tshivenḓa | 溫達文 | ve | Latn | 拉丁字母模型 | 
| 隨選影片 | 沃特語 | vot | Cyrl/Latn | 西里爾字母模型 | 
| Frysk | 西弗里西亞文 | fy | Latn | 拉丁字母模型 | 
| 沃洛夫文 | 沃洛夫文 | wo | Latn | 拉丁字母模型 | 
| isiXhosa | 科薩文 | xh | Latn | 拉丁字母模型 | 
| Èdè Yorùbá | 約魯巴文 | yo | Latn | 拉丁字母模型 | 
| Diidxazá | Zapotec | zap | Latn | 拉丁字母模型 | 
手寫指令碼
這個部分包含手寫辨識功能支援的文字。如要瞭解每種文字使用的語言,請參閱支援、實驗性和對應語言的表格。如要依指令碼篩選,請在下列欄位中輸入指令碼:
| 指令碼標記 | 名稱 | 支援級別 | 
|---|---|---|
| Beng | 孟加拉文 | 實驗功能 | 
| Cyrl | 斯拉夫文 | 實驗功能 | 
| 戴瓦 | 梵文 | 實驗功能 | 
| Grek | 希臘文 | 實驗功能 | 
| 哈尼文 | 中文 | 實驗功能 | 
| 日本 | 日文 | 支援 | 
| Kore | 韓文 | 支援 | 
| Latn | 拉丁文 | 支援 | 
| vi | 越南文 | 實驗功能 |