出力を処理するために呼び出し側が使用する文字エンコーディングを表します。API はトークンや言及などのさまざまな出力の開始オフセットを指定し、異なるテキスト エンコードをネイティブで使用する言語によってオフセットへのアクセス方法が異なる可能性があることから、EncodingType
を指定することをおすすめします。
列挙型 | |
---|---|
NONE |
EncodingType が指定されていない場合、エンコードに依存する情報(beginOffset など)は -1 に設定されます。 |
UTF8 |
エンコードに依存する情報(beginOffset など)は、入力の UTF-8 エンコードに基づいて計算されます。C++ と Go は、このエンコードをネイティブに使用する言語の例です。 |
UTF16 |
エンコードに依存する情報(beginOffset など)は、入力の UTF-16 エンコードに基づいて計算されます。Java と JavaScript は、このエンコードをネイティブに使用する言語の例です。 |
UTF32 |
エンコードに依存する情報(beginOffset など)は、入力の UTF-32 エンコードに基づいて計算されます。Python は、このエンコードをネイティブに使用する言語の例です。 |