サポートされている言語

Google Distributed Cloud(GDC)エアギャップのテキスト認識機能は、さまざまな言語を検出し、1 つの画像内の複数の言語を検出できます。

光学式文字認識(OCR)API リクエストで、オプションの言語ヒントを指定できます。たとえば、API で画像に使用されている言語の検出が困難な場合に、ヒントを提供できます。

オプションの言語ヒントを指定するには、image_context フィールドの BatchAnnotateImages または BatchAnnotateFiles リクエストに、language_hints フィールドの値のリストとして追加します。

language_hints 形式では、次の BCP 47 言語タグの形式設定ガイドラインを使用します。

language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]

たとえば、言語ヒント en-t-i0-handwrit は、言語が「手書きから変換された英語」であることを示します。

テキスト認識機能では、次の 3 段階の言語がサポートされています。

  1. サポート対象言語は、定期的なパフォーマンス評価で優先されます。
  2. 試験運用版の言語は開発が積極的に進められています。定期的なパフォーマンス評価がない。
  3. マッピング言語は、別の言語コードまたは一般的な文字認識ツールにマッピングすることでサポートされます。たとえば、en-GB はサポートされていますが、テキスト認識においては en と同様に扱われます。OCR サービスは、entity フィールドで正しいマッピング言語コードを返すよう試みます。ただし、マッピング言語は完全にサポートされている言語や試験運用でサポートされている言語よりも、誤って認識される可能性が高くなります。

OCR サービスの主な機能の一つは、画像からテキストを検出して抽出する機能です。画像は、たとえば手書きのテキストなどです。手書き入力認識でサポートされている手書き文字の一覧については、手書き文字をご覧ください。

サポートされている言語

テキスト認識機能は、サポートされている言語を優先して定期的に評価します。言語でフィルタするには、次のフィールドに言語を入力します。

言語 言語(日本語名) 言語ヒントコード スクリプトとメモ
アフリカーンス語 アフリカーンス語 af Latn
shqip アルバニア語 sq Latn
العربية アラビア語 ar Arab(現代標準)
беларуская ベラルーシ語 be Cyrl
български ブルガリア語 bg Cyrl
Català カタルーニャ語 ca Latn
普通话 中国語 zh Hans / Hant
Hrvatski クロアチア語 hr Latn
Čeština チェコ語 cs Latn
Dansk デンマーク語 da Latn
Nederlands オランダ語 nl Latn
英語 英語 en Latn(アメリカ)
Eesti keel エストニア語 et Latn
フィリピン語 フィリピン語 fil または tl Latn
Suomi フィンランド語 fi Latn
Français フランス語 fr Latn(ヨーロッパ)
Deutsch ドイツ語 de Latn
Ελληνικά ギリシャ語 el Grek
עברית ヘブライ語 iw Hebr
हिन्दी ヒンディー語 hi Deva
Magyar ハンガリー語 hu Latn
Íslenska アイスランド語 is Latn
Bahasa Indonesia インドネシア語 id Latn
Italiano イタリア語 it Latn
日本語 日本語 ja Jpan
한국어 韓国語 ko Kore
Latviešu ラトビア語 lv Latn
Lietuvių リトアニア語 lt Latn
Македонски マケドニア語 mk Cyrl
Bahasa Melayu マレー語 ms Latn
മലയാളം マラヤーラム語 ml Mlym
मराठी マラーティー語 mr Deva
नेपाली ネパール語 ne Deva
Norsk ノルウェー語 no Latn(Bokmål)
فارسی ペルシャ語 fa Arab
Polski ポーランド語 pl Latn
Português ポルトガル語 pt Latn(ブラジル)
Română ルーマニア語 ro Latn
Русский ロシア語 ru Cyrl
Русский(старая орфография) ロシア語 ru-PETR1708 Cyrl(旧正書法)
Српски セルビア語 sr Cyrl と Latn
Српски(латиница) セルビア語 sr-Latn Latn
Slovenčina スロバキア語 sk Latn
Slovenščina スロベニア語 sl Latn
Español スペイン語 es Latn(ヨーロッパ)
Svenska スウェーデン語 sv Latn
タガログ語 タガログ語 tl Latn
Türkçe トルコ語 tr Latn
Українська ウクライナ語 uk Cyrl
Tiếng Việt ベトナム語 vi Latn
イディッシュ語 イディッシュ語 yi Hebr

試験運用版の言語

試験運用版の言語は開発が積極的に進められていますが、評価されていません。言語でフィルタするには、次のフィールドに言語を入力します。

言語 言語(日本語名) 言語ヒントコード スクリプトとメモ
Αρχαία ελληνικά 古代ギリシャ語 grc Grek
Azərbaycan アゼルバイジャン語 az Latn
Azərbaycan(qədim yazı) アゼルバイジャン語 az-Cyrl Cyrl(旧正書法)
Euskara バスク語 eu Latn
Bosanski ボスニア語 bs Latn
セブ語 セブアノ語 ceb Latn
エスペラント語 エスペラント語 eo Latn
Galego ガリシア語 gl Latn
ქართული ジョージア語 ka Geor
Kreyòl Ayisyen クレオール語(ハイチ) ht Latn
Gaeilge アイルランド語 ga Latn
Jawa ジャワ語 jv Latn
Қазақ カザフ語 kk Cyrl
キルギス語 キルギス語 ky Cyrl
Latine ラテン語 la Latn
Malti マルタ語 mt Latn
Монгол モンゴル語 mn Cyrl
پښتو パシュト語 ps Arab
संस्कृतम् サンスクリット語 sa Deva
スワヒリ語 スワヒリ語 sw Latn
اردو ウルドゥー語 ur Arab
oʻzbekcha ウズベク語 uz Latn(Latin)
oʻzbekcha ウズベク語 uz-Cyrl Cyrl(旧正書法)
Cymraeg ウェールズ語 cy Latn
IsiZulu ズールー語 zu Latn

マッピング言語

マッピングされた言語は、別の言語コードまたは一般的な文字認識ツールに関連付けられます。言語でフィルタするには、次のフィールドに言語を入力します。

言語 言語(日本語名) 言語ヒントコード スクリプトとメモ マッピング先
بهسا اچيه アチェ語 ace Latn ラテン文字モデル
Lwo アチョリ語 ach Latn ラテン文字モデル
ダンメ語 アダングメ語 ada Latn ラテン文字モデル
アカン語 アカン語 ak Latn ラテン文字モデル
Anicinâbemowin アルゴンキン語 alg Latn ラテン文字モデル
Mapudungu アラウカニア語 / マプチェ語 arn Latn ラテン文字モデル
Asturianu アストゥリアス語 ast Latn ラテン文字モデル
Dene アサバスカ語 ath Latn ラテン文字モデル
Aymar aru アイマラ語 ay Latn ラテン文字モデル
Bhāṣa Bali バリ語 ban Latn ラテン文字モデル
Bamanankan バンバラ語 bm Latn ラテン文字モデル
Narrow Bantu バントゥー語 bnt Latn ラテン文字モデル
башҡорт теле バシキール語 ba Cyrl キリル文字モデル
Toba–Batak バタク文字 btk Latn ラテン文字モデル
Chibemba ベンバ語 bem Latn ラテン文字モデル
Bikol Naga ビコール語 bik Latn ラテン文字モデル
Bichelamar ビスラマ語 bi Latn ラテン文字モデル
Brezhoneg ブルトン語 br Latn ラテン文字モデル
нохчийн мотт / noxçiyn mott チェチェン語 ce Cyrl キリル文字モデル
汉语 中国語 zh-Hans Hans(簡体、標準中国語) zh
漢語 中国語 zh-Hant Hant(繁体、標準中国語) zh
普通話 中国語 zh-Hant-HK Hant(標準中国語、香港) zh
Chahta' チョクトー語 cho Latn ラテン文字モデル
Чӑвашла チュヴァシ語 cv Cyrl キリル文字モデル
Cree–Montagnais–Naskapi クリー語 cr Latn ラテン文字モデル
Mvskoke クリーク語 mus Latn ラテン文字モデル
qırımtatar tili、къырымтатар тили クリミア タタール語 crh Latn キリル文字モデル
Dakhótiyapi、Dakȟótiyapi ダコタ語 dak Latn ラテン文字モデル
ドゥアラ ドゥアラ語 dua Latn ラテン文字モデル
Ikɔ Efik エフィク語 efi Latn ラテン文字モデル
English(イギリス) 英語 en-GB Latn(イギリス) en
Èʋegbe エウェ語 ee Latn ラテン文字モデル
føroyskt mál フェロー語 fo Latn ラテン文字モデル
Na Vosa Vakaviti フィジー語 fj Latn ラテン文字モデル
fɔ̀ngbè フォン語 fon Latn ラテン文字モデル
Français canadien フランス語 fr-CA Latn(カナダ) fr
Fulani、Fulah、Peul フラニ語 ff Latn ラテン文字モデル
ガ語 gaa Latn ラテン文字モデル
ルガンダ語 ガンダ語 lg Latn ラテン文字モデル
Basa Gayo ガヨ語 gay Latn ラテン文字モデル
キリバス キリバス語 gil Latn ラテン文字モデル
ゴート文字 ゴート文字 got Latn ラテン文字モデル
Guaraní グアラニ語 gn Latn ラテン文字モデル
Harshen/Halshen Hausa هَرْشَن هَوْسَ ハウサ語 ha Latn ラテン文字モデル
ʻŌlelo Hawaiʻi ハワイ語 haw Latn ラテン文字モデル
Otjiherero ヘレロ語 hz Latn ラテン文字モデル
Ilonggo ヒリガイノン語 hil Latn ラテン文字モデル
Jaku Iban イバン語 iba Latn ラテン文字モデル
Asụsụ Igbo イボ語 ig Latn ラテン文字モデル
Ilokano イロカノ語 ilo Latn ラテン文字モデル
Taqbaylit カビル語 kab Latn ラテン文字モデル
ジンポー語 カチン kac Latn ラテン文字モデル
カラーリット語 カラーリット語 kl Latn ラテン文字モデル
Kikamba カンバ語 kam Latn ラテン文字モデル
カヌリ語 カヌリ語 kr Latn ラテン文字モデル
Qaraqalpaq tili、Қарақалпақ тили、قاراقالپاق تىلى カラカルパク語 kaa Cyrl / Latn キリル文字モデル
Ka Ktien Khasi カーシ語 kha Latn ラテン文字モデル
Gĩkũyũ キクユ語 ki Latn ラテン文字モデル
キニヤルワンダ語 キニヤルワンダ語 rw Latn ラテン文字モデル
коми кыв コミ語 kv Cyrl キリル文字モデル
Kikongo コンゴ語 kg Latn ラテン文字モデル
Kosraean コスラエ語 kos Latn ラテン文字モデル
Oshikwanyama クワニャマ語 kj Latn ラテン文字モデル
Ngala リンガラ語 ln Latn ラテン文字モデル
Plattdütsch、Plattdeutsch、Nedersaksisch 低地ドイツ語 nds Latn ラテン文字モデル
siLozi ロジ語 loz Latn ラテン文字モデル
Kiluba ルバカタンガ語 lu Latn ラテン文字モデル
Dholuo ルオ語 luo Latn ラテン文字モデル
Madhura、Basa Mathura、بَهاسَ مَدورا マドゥラ語 mad Latn ラテン文字モデル
マラガシ語 マラガシ語 mg Latn ラテン文字モデル
Mandinka、لغة مندنكا マンディンゴ語 man Latn ラテン文字モデル
Gaelg、Gailck マン島語 gv Latn ラテン文字モデル
Te reo Māori マオリ語 mi Latn ラテン文字モデル
Ebon マーシャル語 mh Latn ラテン文字モデル
Mɛnde yia メンデ語 men Latn ラテン文字モデル
Middle English 中英語 enm Latn ラテン文字モデル
Mittelhochdeutsch 中高ドイツ語 gmh Latn ラテン文字モデル
Baso Minangkabau、باسو مينڠكاباو ミナンカバウ語 min Latn ラテン文字モデル
Kanienʼkéha モホーク語 moh Latn ラテン文字モデル
Nkundu Mongo lol Latn ラテン文字モデル
Nāhuatl ナワトル語 nah Latn ラテン文字モデル
Diné bizaad ナヴァホ語 nv Latn ラテン文字モデル
ンドンガ語 ンドンガ語 ng Latn ラテン文字モデル
ko e vagahau Niuē ニウエ語 niu Latn ラテン文字モデル
Zimbabwe Ndebele 北ンデベレ語 nd Latn ラテン文字モデル
Sesotho sa Leboa 北ソト語 nso Latn ラテン文字モデル
Chichewa、Chinyanja ニャンジャ語 ny Latn ラテン文字モデル
Runyankore ニャンコレ語 nyn Latn ラテン文字モデル
Chitonga トンガ語(ニアサ) tog Latn ラテン文字モデル
Appolo ンジマ語 nzi Latn ラテン文字モデル
Occitan、lenga d'òc、provençal オック語 oc Latn ラテン文字モデル
Anishinaabemowin、ᐊᓂᔑᓈᐯᒧᐎᓐ オジブワ語 oj Latn ラテン文字モデル
Ænglisc、Englisc、Anglisc 古英語 ang Latn ラテン文字モデル
Franceis、François、Romanz 古フランス語 fro Latn ラテン文字モデル
Diutisk、Althochdeutsch 古高ドイツ語 goh Latn ラテン文字モデル
Dǫnsk tunga 古ノルド語 non Latn ラテン文字モデル
Occitan ancian 古プロヴァンス語 pro Latn ラテン文字モデル
ирон ӕвзаг オセット語 os Cyrl キリル文字モデル
パンパンガ語 パンパンガ pam Latn ラテン文字モデル
Salitan Pangasinan パンガシナン語 pag Latn ラテン文字モデル
Papiamentu パピアメント語 pap Latn ラテン文字モデル
Português (Portugal) ポルトガル語 pt-PT Latn(ヨーロッパ) pt
Kechua / Runa Simi ケチュア語 qu Latn ラテン文字モデル
Rumantsch ロマンシュ語 rm Latn ラテン文字モデル
Romani čhib ロマ語 rom Latn ラテン文字モデル
Ikirundi ルンディ語 rn Latn ラテン文字モデル
サカ語 サカ語 sah Cyrl キリル文字モデル
Gagana faʻa Sāmoa サモア語 sm Latn ラテン文字モデル
yângâ tî sängö サンゴ語 sg Latn ラテン文字モデル
(Braid)Scots、Lallans、Doric スコットランド語 sco Latn ラテン文字モデル
Gàidhlig スコットランド ゲール語 gd Latn ラテン文字モデル
chiShona ショナ語 sn Latn ラテン文字モデル
Songhay ソンガイ語 son Latn ラテン文字モデル
セソト語 南ソト語 st Latn ラテン文字モデル
Español(Latinoamérica) スペイン語 es-419 Latn(ラテンアメリカ) es
ᮘᮞ ᮞᮥᮔ᮪ᮓ、Basa Sunda スンダ語 su Latn ラテン文字モデル
siSwati スワート語 ss Latn ラテン文字モデル
Reo Tahiti タヒチ語 ty Latn ラテン文字モデル
тоҷикӣ タジク語 tg Cyrl キリル文字モデル
татар теле タタール語 tt Cyrl / Latn キリル文字モデル
KʌThemnɛ テムネ語 tem Latn ラテン文字モデル
lea faka-Tonga トンガ語 to Latn ラテン文字モデル
Xitsonga ツォンガ語 ts Latn ラテン文字モデル
Setswana ツワナ語 tn Latn ラテン文字モデル
Türkmençe トルクメン語 tk Latn キリル文字モデル
удмурт кыл ウドムルト語 udm Cyrl キリル文字モデル
Tshivenḓa ヴェンダ語 ve Latn ラテン文字モデル
Vod ヴォート語 vot Cyrl / Latn キリル文字モデル
Frysk 西フリジア語 fy Latn ラテン文字モデル
ウォロフ語 ウォロフ語 wo Latn ラテン文字モデル
isiXhosa コーサ語 xh Latn ラテン文字モデル
Èdè Yorùbá ヨルバ語 yo Latn ラテン文字モデル
Diidxazá サポテカ語 zap Latn ラテン文字モデル

手書き文字のスクリプト

このセクションでは、手書き入力認識でサポートされているスクリプトについて説明します。各スクリプトを使用する言語については、サポートされている言語、試験運用版の言語、マッピングされている言語の表を参照してください。スクリプトでフィルタするには、次のフィールドにスクリプトを入力します。

スクリプトタグ 名前 サポートレベル
Beng ベンガル語 試験運用版
Cyrl キリル文字 試験運用版
Deva デバナーガリ文字 試験運用版
Grek ギリシャ語 試験運用版
ハニ語 中国語 試験運用版
Jpan 日本語 サポート対象
Kore 韓国語 サポート対象
Latn ラテン語 サポート対象
vi ベトナム語 試験運用版