Google Distributed Cloud(GDC)エアギャップのテキスト認識機能は、さまざまな言語を検出し、1 つの画像内の複数の言語を検出できます。
光学式文字認識(OCR)API リクエストで、オプションの言語ヒントを指定できます。たとえば、API で画像に使用されている言語の検出が困難な場合に、ヒントを提供できます。
オプションの言語ヒントを指定するには、image_context
フィールドの BatchAnnotateImages
または BatchAnnotateFiles
リクエストに、language_hints
フィールドの値のリストとして追加します。
language_hints
形式では、次の BCP 47
言語タグの形式設定ガイドラインを使用します。
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
たとえば、言語ヒント en-t-i0-handwrit
は、言語が「手書きから変換された英語」であることを示します。
テキスト認識機能では、次の 3 段階の言語がサポートされています。
- サポート対象言語は、定期的なパフォーマンス評価で優先されます。
- 試験運用版の言語は開発が積極的に進められています。定期的なパフォーマンス評価がない。
- マッピング言語は、別の言語コードまたは一般的な文字認識ツールにマッピングすることでサポートされます。たとえば、
en-GB
はサポートされていますが、テキスト認識においてはen
と同様に扱われます。OCR サービスは、entity
フィールドで正しいマッピング言語コードを返すよう試みます。ただし、マッピング言語は完全にサポートされている言語や試験運用でサポートされている言語よりも、誤って認識される可能性が高くなります。
OCR サービスの主な機能の一つは、画像からテキストを検出して抽出する機能です。画像は、たとえば手書きのテキストなどです。手書き入力認識でサポートされている手書き文字の一覧については、手書き文字をご覧ください。
サポートされている言語
テキスト認識機能は、サポートされている言語を優先して定期的に評価します。言語でフィルタするには、次のフィールドに言語を入力します。
言語 | 言語(日本語名) | 言語ヒントコード | スクリプトとメモ |
---|---|---|---|
アフリカーンス語 | アフリカーンス語 | af |
Latn |
shqip | アルバニア語 | sq |
Latn |
العربية | アラビア語 | ar |
Arab(現代標準) |
беларуская | ベラルーシ語 | be |
Cyrl |
български | ブルガリア語 | bg |
Cyrl |
Català | カタルーニャ語 | ca |
Latn |
普通话 | 中国語 | zh |
Hans / Hant |
Hrvatski | クロアチア語 | hr |
Latn |
Čeština | チェコ語 | cs |
Latn |
Dansk | デンマーク語 | da |
Latn |
Nederlands | オランダ語 | nl |
Latn |
英語 | 英語 | en |
Latn(アメリカ) |
Eesti keel | エストニア語 | et |
Latn |
フィリピン語 | フィリピン語 | fil または tl |
Latn |
Suomi | フィンランド語 | fi |
Latn |
Français | フランス語 | fr |
Latn(ヨーロッパ) |
Deutsch | ドイツ語 | de |
Latn |
Ελληνικά | ギリシャ語 | el |
Grek |
עברית | ヘブライ語 | iw |
Hebr |
हिन्दी | ヒンディー語 | hi |
Deva |
Magyar | ハンガリー語 | hu |
Latn |
Íslenska | アイスランド語 | is |
Latn |
Bahasa Indonesia | インドネシア語 | id |
Latn |
Italiano | イタリア語 | it |
Latn |
日本語 | 日本語 | ja |
Jpan |
한국어 | 韓国語 | ko |
Kore |
Latviešu | ラトビア語 | lv |
Latn |
Lietuvių | リトアニア語 | lt |
Latn |
Македонски | マケドニア語 | mk |
Cyrl |
Bahasa Melayu | マレー語 | ms |
Latn |
മലയാളം | マラヤーラム語 | ml |
Mlym |
मराठी | マラーティー語 | mr |
Deva |
नेपाली | ネパール語 | ne |
Deva |
Norsk | ノルウェー語 | no |
Latn(Bokmål) |
فارسی | ペルシャ語 | fa |
Arab |
Polski | ポーランド語 | pl |
Latn |
Português | ポルトガル語 | pt |
Latn(ブラジル) |
Română | ルーマニア語 | ro |
Latn |
Русский | ロシア語 | ru |
Cyrl |
Русский(старая орфография) | ロシア語 | ru-PETR1708 |
Cyrl(旧正書法) |
Српски | セルビア語 | sr |
Cyrl と Latn |
Српски(латиница) | セルビア語 | sr-Latn |
Latn |
Slovenčina | スロバキア語 | sk |
Latn |
Slovenščina | スロベニア語 | sl |
Latn |
Español | スペイン語 | es |
Latn(ヨーロッパ) |
Svenska | スウェーデン語 | sv |
Latn |
タガログ語 | タガログ語 | tl |
Latn |
Türkçe | トルコ語 | tr |
Latn |
Українська | ウクライナ語 | uk |
Cyrl |
Tiếng Việt | ベトナム語 | vi |
Latn |
イディッシュ語 | イディッシュ語 | yi |
Hebr |
試験運用版の言語
試験運用版の言語は開発が積極的に進められていますが、評価されていません。言語でフィルタするには、次のフィールドに言語を入力します。
言語 | 言語(日本語名) | 言語ヒントコード | スクリプトとメモ |
---|---|---|---|
Αρχαία ελληνικά | 古代ギリシャ語 | grc |
Grek |
Azərbaycan | アゼルバイジャン語 | az |
Latn |
Azərbaycan(qədim yazı) | アゼルバイジャン語 | az-Cyrl |
Cyrl(旧正書法) |
Euskara | バスク語 | eu |
Latn |
Bosanski | ボスニア語 | bs |
Latn |
セブ語 | セブアノ語 | ceb |
Latn |
エスペラント語 | エスペラント語 | eo |
Latn |
Galego | ガリシア語 | gl |
Latn |
ქართული | ジョージア語 | ka |
Geor |
Kreyòl Ayisyen | クレオール語(ハイチ) | ht |
Latn |
Gaeilge | アイルランド語 | ga |
Latn |
Jawa | ジャワ語 | jv |
Latn |
Қазақ | カザフ語 | kk |
Cyrl |
キルギス語 | キルギス語 | ky |
Cyrl |
Latine | ラテン語 | la |
Latn |
Malti | マルタ語 | mt |
Latn |
Монгол | モンゴル語 | mn |
Cyrl |
پښتو | パシュト語 | ps |
Arab |
संस्कृतम् | サンスクリット語 | sa |
Deva |
スワヒリ語 | スワヒリ語 | sw |
Latn |
اردو | ウルドゥー語 | ur |
Arab |
oʻzbekcha | ウズベク語 | uz |
Latn(Latin) |
oʻzbekcha | ウズベク語 | uz-Cyrl |
Cyrl(旧正書法) |
Cymraeg | ウェールズ語 | cy |
Latn |
IsiZulu | ズールー語 | zu |
Latn |
マッピング言語
マッピングされた言語は、別の言語コードまたは一般的な文字認識ツールに関連付けられます。言語でフィルタするには、次のフィールドに言語を入力します。
言語 | 言語(日本語名) | 言語ヒントコード | スクリプトとメモ | マッピング先 |
---|---|---|---|---|
بهسا اچيه | アチェ語 | ace |
Latn | ラテン文字モデル |
Lwo | アチョリ語 | ach |
Latn | ラテン文字モデル |
ダンメ語 | アダングメ語 | ada |
Latn | ラテン文字モデル |
アカン語 | アカン語 | ak |
Latn | ラテン文字モデル |
Anicinâbemowin | アルゴンキン語 | alg |
Latn | ラテン文字モデル |
Mapudungu | アラウカニア語 / マプチェ語 | arn |
Latn | ラテン文字モデル |
Asturianu | アストゥリアス語 | ast |
Latn | ラテン文字モデル |
Dene | アサバスカ語 | ath |
Latn | ラテン文字モデル |
Aymar aru | アイマラ語 | ay |
Latn | ラテン文字モデル |
Bhāṣa Bali | バリ語 | ban |
Latn | ラテン文字モデル |
Bamanankan | バンバラ語 | bm |
Latn | ラテン文字モデル |
Narrow Bantu | バントゥー語 | bnt |
Latn | ラテン文字モデル |
башҡорт теле | バシキール語 | ba |
Cyrl | キリル文字モデル |
Toba–Batak | バタク文字 | btk |
Latn | ラテン文字モデル |
Chibemba | ベンバ語 | bem |
Latn | ラテン文字モデル |
Bikol Naga | ビコール語 | bik |
Latn | ラテン文字モデル |
Bichelamar | ビスラマ語 | bi |
Latn | ラテン文字モデル |
Brezhoneg | ブルトン語 | br |
Latn | ラテン文字モデル |
нохчийн мотт / noxçiyn mott | チェチェン語 | ce |
Cyrl | キリル文字モデル |
汉语 | 中国語 | zh-Hans |
Hans(簡体、標準中国語) | zh |
漢語 | 中国語 | zh-Hant |
Hant(繁体、標準中国語) | zh |
普通話 | 中国語 | zh-Hant-HK |
Hant(標準中国語、香港) | zh |
Chahta' | チョクトー語 | cho |
Latn | ラテン文字モデル |
Чӑвашла | チュヴァシ語 | cv |
Cyrl | キリル文字モデル |
Cree–Montagnais–Naskapi | クリー語 | cr |
Latn | ラテン文字モデル |
Mvskoke | クリーク語 | mus |
Latn | ラテン文字モデル |
qırımtatar tili、къырымтатар тили | クリミア タタール語 | crh |
Latn | キリル文字モデル |
Dakhótiyapi、Dakȟótiyapi | ダコタ語 | dak |
Latn | ラテン文字モデル |
ドゥアラ | ドゥアラ語 | dua |
Latn | ラテン文字モデル |
Ikɔ Efik | エフィク語 | efi |
Latn | ラテン文字モデル |
English(イギリス) | 英語 | en-GB |
Latn(イギリス) | en |
Èʋegbe | エウェ語 | ee |
Latn | ラテン文字モデル |
føroyskt mál | フェロー語 | fo |
Latn | ラテン文字モデル |
Na Vosa Vakaviti | フィジー語 | fj |
Latn | ラテン文字モデル |
fɔ̀ngbè | フォン語 | fon |
Latn | ラテン文字モデル |
Français canadien | フランス語 | fr-CA |
Latn(カナダ) | fr |
Fulani、Fulah、Peul | フラニ語 | ff |
Latn | ラテン文字モデル |
Gã | ガ語 | gaa |
Latn | ラテン文字モデル |
ルガンダ語 | ガンダ語 | lg |
Latn | ラテン文字モデル |
Basa Gayo | ガヨ語 | gay |
Latn | ラテン文字モデル |
キリバス | キリバス語 | gil |
Latn | ラテン文字モデル |
ゴート文字 | ゴート文字 | got |
Latn | ラテン文字モデル |
Guaraní | グアラニ語 | gn |
Latn | ラテン文字モデル |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | ハウサ語 | ha |
Latn | ラテン文字モデル |
ʻŌlelo Hawaiʻi | ハワイ語 | haw |
Latn | ラテン文字モデル |
Otjiherero | ヘレロ語 | hz |
Latn | ラテン文字モデル |
Ilonggo | ヒリガイノン語 | hil |
Latn | ラテン文字モデル |
Jaku Iban | イバン語 | iba |
Latn | ラテン文字モデル |
Asụsụ Igbo | イボ語 | ig |
Latn | ラテン文字モデル |
Ilokano | イロカノ語 | ilo |
Latn | ラテン文字モデル |
Taqbaylit | カビル語 | kab |
Latn | ラテン文字モデル |
ジンポー語 | カチン | kac |
Latn | ラテン文字モデル |
カラーリット語 | カラーリット語 | kl |
Latn | ラテン文字モデル |
Kikamba | カンバ語 | kam |
Latn | ラテン文字モデル |
カヌリ語 | カヌリ語 | kr |
Latn | ラテン文字モデル |
Qaraqalpaq tili、Қарақалпақ тили、قاراقالپاق تىلى | カラカルパク語 | kaa |
Cyrl / Latn | キリル文字モデル |
Ka Ktien Khasi | カーシ語 | kha |
Latn | ラテン文字モデル |
Gĩkũyũ | キクユ語 | ki |
Latn | ラテン文字モデル |
キニヤルワンダ語 | キニヤルワンダ語 | rw |
Latn | ラテン文字モデル |
коми кыв | コミ語 | kv |
Cyrl | キリル文字モデル |
Kikongo | コンゴ語 | kg |
Latn | ラテン文字モデル |
Kosraean | コスラエ語 | kos |
Latn | ラテン文字モデル |
Oshikwanyama | クワニャマ語 | kj |
Latn | ラテン文字モデル |
Ngala | リンガラ語 | ln |
Latn | ラテン文字モデル |
Plattdütsch、Plattdeutsch、Nedersaksisch | 低地ドイツ語 | nds |
Latn | ラテン文字モデル |
siLozi | ロジ語 | loz |
Latn | ラテン文字モデル |
Kiluba | ルバカタンガ語 | lu |
Latn | ラテン文字モデル |
Dholuo | ルオ語 | luo |
Latn | ラテン文字モデル |
Madhura、Basa Mathura、بَهاسَ مَدورا | マドゥラ語 | mad |
Latn | ラテン文字モデル |
マラガシ語 | マラガシ語 | mg |
Latn | ラテン文字モデル |
Mandinka、لغة مندنكا | マンディンゴ語 | man |
Latn | ラテン文字モデル |
Gaelg、Gailck | マン島語 | gv |
Latn | ラテン文字モデル |
Te reo Māori | マオリ語 | mi |
Latn | ラテン文字モデル |
Ebon | マーシャル語 | mh |
Latn | ラテン文字モデル |
Mɛnde yia | メンデ語 | men |
Latn | ラテン文字モデル |
Middle English | 中英語 | enm |
Latn | ラテン文字モデル |
Mittelhochdeutsch | 中高ドイツ語 | gmh |
Latn | ラテン文字モデル |
Baso Minangkabau、باسو مينڠكاباو | ミナンカバウ語 | min |
Latn | ラテン文字モデル |
Kanienʼkéha | モホーク語 | moh |
Latn | ラテン文字モデル |
Nkundu | Mongo | lol |
Latn | ラテン文字モデル |
Nāhuatl | ナワトル語 | nah |
Latn | ラテン文字モデル |
Diné bizaad | ナヴァホ語 | nv |
Latn | ラテン文字モデル |
ンドンガ語 | ンドンガ語 | ng |
Latn | ラテン文字モデル |
ko e vagahau Niuē | ニウエ語 | niu |
Latn | ラテン文字モデル |
Zimbabwe Ndebele | 北ンデベレ語 | nd |
Latn | ラテン文字モデル |
Sesotho sa Leboa | 北ソト語 | nso |
Latn | ラテン文字モデル |
Chichewa、Chinyanja | ニャンジャ語 | ny |
Latn | ラテン文字モデル |
Runyankore | ニャンコレ語 | nyn |
Latn | ラテン文字モデル |
Chitonga | トンガ語(ニアサ) | tog |
Latn | ラテン文字モデル |
Appolo | ンジマ語 | nzi |
Latn | ラテン文字モデル |
Occitan、lenga d'òc、provençal | オック語 | oc |
Latn | ラテン文字モデル |
Anishinaabemowin、ᐊᓂᔑᓈᐯᒧᐎᓐ | オジブワ語 | oj |
Latn | ラテン文字モデル |
Ænglisc、Englisc、Anglisc | 古英語 | ang |
Latn | ラテン文字モデル |
Franceis、François、Romanz | 古フランス語 | fro |
Latn | ラテン文字モデル |
Diutisk、Althochdeutsch | 古高ドイツ語 | goh |
Latn | ラテン文字モデル |
Dǫnsk tunga | 古ノルド語 | non |
Latn | ラテン文字モデル |
Occitan ancian | 古プロヴァンス語 | pro |
Latn | ラテン文字モデル |
ирон ӕвзаг | オセット語 | os |
Cyrl | キリル文字モデル |
パンパンガ語 | パンパンガ | pam |
Latn | ラテン文字モデル |
Salitan Pangasinan | パンガシナン語 | pag |
Latn | ラテン文字モデル |
Papiamentu | パピアメント語 | pap |
Latn | ラテン文字モデル |
Português (Portugal) | ポルトガル語 | pt-PT |
Latn(ヨーロッパ) | pt |
Kechua / Runa Simi | ケチュア語 | qu |
Latn | ラテン文字モデル |
Rumantsch | ロマンシュ語 | rm |
Latn | ラテン文字モデル |
Romani čhib | ロマ語 | rom |
Latn | ラテン文字モデル |
Ikirundi | ルンディ語 | rn |
Latn | ラテン文字モデル |
サカ語 | サカ語 | sah |
Cyrl | キリル文字モデル |
Gagana faʻa Sāmoa | サモア語 | sm |
Latn | ラテン文字モデル |
yângâ tî sängö | サンゴ語 | sg |
Latn | ラテン文字モデル |
(Braid)Scots、Lallans、Doric | スコットランド語 | sco |
Latn | ラテン文字モデル |
Gàidhlig | スコットランド ゲール語 | gd |
Latn | ラテン文字モデル |
chiShona | ショナ語 | sn |
Latn | ラテン文字モデル |
Songhay | ソンガイ語 | son |
Latn | ラテン文字モデル |
セソト語 | 南ソト語 | st |
Latn | ラテン文字モデル |
Español(Latinoamérica) | スペイン語 | es-419 |
Latn(ラテンアメリカ) | es |
ᮘᮞ ᮞᮥᮔ᮪ᮓ、Basa Sunda | スンダ語 | su |
Latn | ラテン文字モデル |
siSwati | スワート語 | ss |
Latn | ラテン文字モデル |
Reo Tahiti | タヒチ語 | ty |
Latn | ラテン文字モデル |
тоҷикӣ | タジク語 | tg |
Cyrl | キリル文字モデル |
татар теле | タタール語 | tt |
Cyrl / Latn | キリル文字モデル |
KʌThemnɛ | テムネ語 | tem |
Latn | ラテン文字モデル |
lea faka-Tonga | トンガ語 | to |
Latn | ラテン文字モデル |
Xitsonga | ツォンガ語 | ts |
Latn | ラテン文字モデル |
Setswana | ツワナ語 | tn |
Latn | ラテン文字モデル |
Türkmençe | トルクメン語 | tk |
Latn | キリル文字モデル |
удмурт кыл | ウドムルト語 | udm |
Cyrl | キリル文字モデル |
Tshivenḓa | ヴェンダ語 | ve |
Latn | ラテン文字モデル |
Vod | ヴォート語 | vot |
Cyrl / Latn | キリル文字モデル |
Frysk | 西フリジア語 | fy |
Latn | ラテン文字モデル |
ウォロフ語 | ウォロフ語 | wo |
Latn | ラテン文字モデル |
isiXhosa | コーサ語 | xh |
Latn | ラテン文字モデル |
Èdè Yorùbá | ヨルバ語 | yo |
Latn | ラテン文字モデル |
Diidxazá | サポテカ語 | zap |
Latn | ラテン文字モデル |
手書き文字のスクリプト
このセクションでは、手書き入力認識でサポートされているスクリプトについて説明します。各スクリプトを使用する言語については、サポートされている言語、試験運用版の言語、マッピングされている言語の表を参照してください。スクリプトでフィルタするには、次のフィールドにスクリプトを入力します。
スクリプトタグ | 名前 | サポートレベル |
---|---|---|
Beng | ベンガル語 | 試験運用版 |
Cyrl | キリル文字 | 試験運用版 |
Deva | デバナーガリ文字 | 試験運用版 |
Grek | ギリシャ語 | 試験運用版 |
ハニ語 | 中国語 | 試験運用版 |
Jpan | 日本語 | サポート対象 |
Kore | 韓国語 | サポート対象 |
Latn | ラテン語 | サポート対象 |
vi | ベトナム語 | 試験運用版 |