Stellt die Textcodierung dar, die der Aufrufer zum Verarbeiten der Ausgabe verwendet. Es wird empfohlen, ein EncodingType
anzugeben, da die API die Anfangsoffsets für verschiedene Ausgaben wie Tokens und Erwähnungen bereitstellt. Sprachen, die standardmäßig unterschiedliche Textcodierungen verwenden, können auf Offsetwerte unterschiedlich zugreifen.
Enums | |
---|---|
NONE |
Wenn EncodingType nicht angegeben ist, werden codierungsabhängige Informationen wie beginOffset auf -1 gesetzt. |
UTF8 |
Codierungsabhängige Informationen wie beginOffset werden anhand der UTF-8-Codierung der Eingabe berechnet. C++ und Go sind Beispiele für Sprachen, die diese Codierung nativ verwenden. |
UTF16 |
Codierungsabhängige Informationen (z. B. beginOffset ) werden basierend auf der UTF-16-Codierung der Eingabe berechnet. Java und JavaScript sind Beispiele für Sprachen, die diese Codierung nativ verwenden. |
UTF32 |
Codierungsabhängige Informationen (z. B. beginOffset ) werden anhand der UTF-32-Codierung der Eingabe berechnet. Python ist ein Beispiel für eine Sprache, die diese Codierung nativ verwendet. |