Token

代表文字最小的語法構成要素。

JSON 表示法
{
  "text": {
    object (TextSpan)
  },
  "partOfSpeech": {
    object (PartOfSpeech)
  },
  "dependencyEdge": {
    object (DependencyEdge)
  },
  "lemma": string
}
欄位
text

object (TextSpan)

符記文字。

partOfSpeech

object (PartOfSpeech)

這個符號的詞性標記。

dependencyEdge

object (DependencyEdge)

這個符記的相依性剖析樹狀結構。

lemma

string

符號的詞根

PartOfSpeech

代表符號的詞性資訊。詞性定義請參閱 http://www.lrec-conf.org/proceedings/lrec2012/pdf/274_Paper.pdf

JSON 表示法
{
  "tag": enum (Tag),
  "aspect": enum (Aspect),
  "case": enum (Case),
  "form": enum (Form),
  "gender": enum (Gender),
  "mood": enum (Mood),
  "number": enum (Number),
  "person": enum (Person),
  "proper": enum (Proper),
  "reciprocity": enum (Reciprocity),
  "tense": enum (Tense),
  "voice": enum (Voice)
}
欄位
tag

enum (Tag)

詞性標記。

aspect

enum (Aspect)

語法體。

case

enum (Case)

語法格式。

form

enum (Form)

語法形式。

gender

enum (Gender)

語法性別。

mood

enum (Mood)

語法語氣。

number

enum (Number)

語法數量。

person

enum (Person)

語法人稱。

proper

enum (Proper)

文法正確性。

reciprocity

enum (Reciprocity)

文法上的互惠關係。

tense

enum (Tense)

文法時態。

voice

enum (Voice)

語法語氣。

標記

詞性標記列舉。

列舉
UNKNOWN 不明
ADJ 形容詞
ADP 廣告位置 (前置和後置)
ADV 副詞
CONJ 連結詞
DET 限定詞
NOUN 名詞 (一般和專有名詞)
NUM 基數
PRON 人稱代名詞
PRT 助詞或其他虛詞
PUNCT 標點符號
VERB 動詞 (所有時態和語態)
X 其他:外來語、錯字、縮寫
AFFIX Affix

切面

動詞的特性,用於表示事件發生期間的時間流動。

列舉
ASPECT_UNKNOWN 在所分析的語言中,系統無法使用或預測特徵。
PERFECTIVE 完成式
IMPERFECTIVE 不定式
PROGRESSIVE 漸進式

案件

在片語、子句或句子中,名詞或代名詞所執行的文法功能。在某些語言中,形容詞和限定詞等其他詞性會根據名詞的變化而變化。

列舉
CASE_UNKNOWN 在所分析的語言中不支援大小寫,或系統未預測大小寫。
ACCUSATIVE 受格
ADVERBIAL Adverbial
COMPLEMENTIVE 互補
DATIVE 與格
GENITIVE 所有格
INSTRUMENTAL 演奏
LOCATIVE 方位
NOMINATIVE 主格
OBLIQUE Oblique
PARTITIVE 分詞
PREPOSITIONAL 介系詞
REFLEXIVE_CASE 反射
RELATIVE_CASE 相對時間
VOCATIVE 呼格

表單

視語言而定,Form 可將動詞、形容詞、副詞等不同形式分類。舉例來說,可將動詞和形容詞的變化結尾分類,或區分形容詞和分詞的長短形式。

列舉
FORM_UNKNOWN 表單不適用於所分析的語言,或未進行預測。
ADNOMIAL Adnomial
AUXILIARY 輔助
COMPLEMENTIZER 補語詞
FINAL_ENDING 最終結局
GERUND 動名詞
REALIS Realis
IRREALIS Irrealis
SHORT 短篇影片
LONG 長篇影片
ORDER 訂單表單
SPECIFIC 特定表單

性別

名詞的性別類別會反映在相關字詞的行為中。

列舉
GENDER_UNKNOWN 在所分析的語言中,性別不相干或無法預測。
FEMININE 陰性
MASCULINE 陽性
NEUTER 中性

情境

動詞的語法特徵,用於表示語氣和態度。

列舉
MOOD_UNKNOWN 在所分析的語言中,情緒不相應或未預測。
CONDITIONAL_MOOD 條件式
IMPERATIVE 命令式
INDICATIVE 陳述語氣
INTERROGATIVE 疑問
JUSSIVE Jussive
SUBJUNCTIVE 假設語氣

數字

計算獎項。

列舉
NUMBER_UNKNOWN 數字在分析的語言中不適用,或未進行預測。
SINGULAR 單數
PLURAL 複數
DUAL 雙通道

人物

區分說話者、第二人稱、第三人稱等。

列舉
PERSON_UNKNOWN 系統無法在所分析的語言中使用人物,或未預測人物。
FIRST 名字
SECOND
THIRD 第三週
REFLEXIVE_PERSON 反射

正確

這個類別會顯示符記是否為專有名詞的一部分。

列舉
PROPER_UNKNOWN 在分析的語言中,Proper 不適用或未預測。
PROPER 正確
NOT_PROPER 不正確

互惠

代名詞的互文特徵。

列舉
RECIPROCITY_UNKNOWN 對分析的語言不相應或未預測。
RECIPROCAL 互惠
NON_RECIPROCAL 非對稱

時態

時間參照。

列舉
TENSE_UNKNOWN 在所分析的語言中,時態不適用或無法預測。
CONDITIONAL_TENSE 條件式
FUTURE 後續
PAST 過去
PRESENT 展示
IMPERFECT Imperfect
PLUPERFECT Pluperfect

語音

動詞所表達的動作與其引數所識別的參與者之間的關係。

列舉
VOICE_UNKNOWN 語音不適用於所分析的語言,或系統無法預測語音。
ACTIVE 有效
CAUSATIVE 致病
PASSIVE 被動

DependencyEdge

代表符記的相依性剖析樹狀結構資訊。(如要進一步瞭解依附標籤,請參閱 http://www.aclweb.org/anthology/P13-2017

JSON 表示法
{
  "headTokenIndex": integer,
  "label": enum (Label)
}
欄位
headTokenIndex

integer

代表依附元件樹狀結構中這個符記的頭部。這是符記的索引,該符記具有指向此符記的曲線。索引是權杖在 API 方法傳回的權杖陣列中的位置。如果這個符記是根權杖,則 headTokenIndex 就是自己的索引。

label

enum (Label)

符記的剖析標籤。

標籤

符記的剖析標籤列舉。

列舉
UNKNOWN 不明
ABBREV 縮寫修飾符
ACOMP 形容詞補語
ADVCL 副詞子句修飾符
ADVMOD 副詞修飾符
AMOD NP 的形容詞修飾詞
APPOS NP 的介詞修飾符
ATTR 依附於連繫動詞的屬性
AUX 助動詞 (非主要動詞)
AUXPASS 被動輔助
CC 並列連字詞
CCOMP 動詞或形容詞的子句補語
CONJ 連接詞
CSUBJ 子句主詞
CSUBJPASS 從句被動主詞
DEP 依附元件 (無法判斷)
DET 限定詞
DISCOURSE Discourse
DOBJ 直接受詞
EXPL 咒罵語
GOESWITH 與「文字中某個字詞的部分未經過妥善編輯」相關
IOBJ 間接物件
MARK 標記 (引入從句的字詞)
MWE 多字詞運算式
MWV 多字詞語音表達
NEG 否定修飾符
NN 名詞複合修飾符
NPADVMOD 用作副詞修飾詞的名詞片語
NSUBJ 名詞主詞
NSUBJPASS 被動名詞主詞
NUM 名詞的數字修飾符
NUMBER 複合數字的元素
P 標點符號
PARATAXIS 並列關係
PARTMOD 分詞修飾語
PCOMP 介系詞的補語是子句
POBJ 介係詞的受詞
POSS 控球修飾符
POSTNEG 動詞後否定助詞
PRECOMP 謂語補語
PRECONJ Preconjunt
PREDET 預設值
PREF 前置字串
PREP 介系詞修飾符
PRONL 動詞與動詞詞素之間的關係
PRT 助詞
PS 聯想或所有格標記
QUANTMOD 量詞片語修飾詞
RCMOD 相對子句修飾符
RCMODREL 在相關子句中使用補語
RDROP 沒有前置述詞的省略號
REF 參照
REMNANT 剩餘
REPARANDUM Reparandum
ROOT
SNUM 表示一組數字的字尾
SUFF 字尾
TMOD 時間修飾符
TOPIC 主題標記
VMOD 由動詞的非限定式所領導的子句,用於修飾名詞
VOCATIVE 呼格
XCOMP 開啟子句補語
SUFFIX 稱謂
TITLE 頭銜
ADVPHMOD 副詞片語調節係數
AUXCAUS 使役助詞
AUXVV 輔助說明
DTMOD 連體詞 (名詞前修飾語)
FOREIGN 外來語
KW 關鍵字
LIST 可比較的項目鏈結清單
NOMC 名詞化子句
NOMCSUBJ 名詞化子句式主詞
NOMCSUBJPASS 名詞化子句式被動語態
NUMC 數字修飾符的複合
COP 耦合
DISLOCATED 錯位關係 (前移/主題化元素)
ASP 體態標記
GMOD 屬格修飾語
GOBJ 屬格受詞
INFMOD 不定詞修飾語
MES 量測
NCOMP 名詞的名詞補語