索引
LanguageService
(接口)AnalyzeEntitiesRequest
(消息)AnalyzeEntitiesResponse
(消息)AnalyzeEntitySentimentRequest
(消息)AnalyzeEntitySentimentResponse
(消息)AnalyzeSentimentRequest
(消息)AnalyzeSentimentResponse
(消息)AnalyzeSyntaxRequest
(消息)AnalyzeSyntaxResponse
(消息)AnnotateTextRequest
(消息)AnnotateTextRequest.Features
(消息)AnnotateTextResponse
(消息)ClassificationCategory
(消息)ClassificationModelOptions
(消息)ClassificationModelOptions.V1Model
(消息)ClassificationModelOptions.V2Model
(消息)ClassificationModelOptions.V2Model.ContentCategoriesVersion
(枚举)ClassifyTextRequest
(消息)ClassifyTextResponse
(消息)DependencyEdge
(消息)DependencyEdge.Label
(枚举)Document
(消息)Document.BoilerplateHandling
(枚举)Document.Type
(枚举)EncodingType
(枚举)Entity
(消息)Entity.Type
(枚举)EntityMention
(消息)EntityMention.Type
(枚举)ModerateTextRequest
(消息)ModerateTextResponse
(消息)PartOfSpeech
(消息)PartOfSpeech.Aspect
(枚举)PartOfSpeech.Case
(枚举)PartOfSpeech.Form
(枚举)PartOfSpeech.Gender
(枚举)PartOfSpeech.Mood
(枚举)PartOfSpeech.Number
(枚举)PartOfSpeech.Person
(枚举)PartOfSpeech.Proper
(枚举)PartOfSpeech.Reciprocity
(枚举)PartOfSpeech.Tag
(枚举)PartOfSpeech.Tense
(枚举)PartOfSpeech.Voice
(枚举)Sentence
(消息)Sentiment
(消息)TextSpan
(消息)Token
(消息)
LanguageService
提供文本分析操作,例如情感分析和实体识别。
AnalyzeEntities |
---|
查找文本中的命名实体(当前为专有名词和普通名词),以及实体类型、显著性、每个实体的提及和其他属性。
|
AnalyzeEntitySentiment |
---|
查找文本中与
|
AnalyzeSentiment |
---|
分析所提供的文本的情感。
|
AnalyzeSyntax |
---|
分析文本的语法,提供句子边界和词法单元以及词性标记、依存关系树和其他属性。
|
AnnotateText |
---|
在一次调用中提供所有语法、情感、实体和分类功能的便捷方法。
|
ClassifyText |
---|
将文档进行分类。
|
ModerateText |
---|
审核文档是否包含有害和敏感内容。
|
AnalyzeEntitiesRequest
实体分析请求消息。
字段 | |
---|---|
document |
必需。输入文档。 |
encoding_ |
API 用于计算偏移的编码类型。 |
AnalyzeEntitiesResponse
实体分析响应消息。
字段 | |
---|---|
entities[] |
输入文档中已识别的实体。 |
language |
文本的语言,与请求中指定的语言相同;如果未指定,则与自动检测到的语言相同。如需了解详情,请参阅 |
AnalyzeEntitySentimentRequest
实体级情感分析请求消息。
字段 | |
---|---|
document |
必需。输入文档。 |
encoding_ |
API 用于计算偏移的编码类型。 |
AnalyzeEntitySentimentResponse
实体级情感分析响应消息。
字段 | |
---|---|
entities[] |
输入文档中已识别的实体及其关联情感。 |
language |
文本的语言,与请求中指定的语言相同;如果未指定,则与自动检测到的语言相同。如需了解详情,请参阅 |
AnalyzeSentimentRequest
情感分析请求消息。
字段 | |
---|---|
document |
必需。输入文档。 |
encoding_ |
API 用于计算句子情感的句子偏移量的编码类型。 |
AnalyzeSentimentResponse
情感分析响应消息。
字段 | |
---|---|
document_ |
输入文档的整体情感。 |
language |
文本的语言,与请求中指定的语言相同;如果未指定,则与自动检测到的语言相同。如需了解详情,请参阅 |
sentences[] |
文档中所有句子的情感。 |
AnalyzeSyntaxRequest
语法分析请求消息。
字段 | |
---|---|
document |
必需。输入文档。 |
encoding_ |
API 用于计算偏移的编码类型。 |
AnalyzeSyntaxResponse
语法分析响应消息。
字段 | |
---|---|
sentences[] |
输入文档中的句子。 |
tokens[] |
输入文档中的词法单元及其语法信息。 |
language |
文本的语言,与请求中指定的语言相同;如果未指定,则与自动检测到的语言相同。如需了解详情,请参阅 |
AnnotateTextRequest
文本注释 API 的请求消息,此 API 可以在一次调用中执行多种分析类型(情感、实体和语法)。
字段 | |
---|---|
document |
必需。输入文档。 |
features |
必需。已启用的功能。 |
encoding_ |
API 用于计算偏移的编码类型。 |
特性
所有适用于情感、语法和语义分析的特性。将每个特性设为 true 可对输入启用特定的分析。
字段 | |
---|---|
extract_ |
提取语法信息。 |
extract_ |
提取实体, |
extract_ |
提取文档级情感。 |
extract_ |
提取实体及其关联的情感。 |
classify_ |
将整个文档分类。如果该值为 true,则 API 将使用归类为预定义分类的默认模型。 |
moderate_ |
审核文档是否包含有害和敏感内容。 |
classification_ |
可选。用于分类的模型选项。如果未指定,则默认为 v1 选项。仅当 |
AnnotateTextResponse
文本注释响应消息。
字段 | |
---|---|
sentences[] |
输入文档中的句子。当用户启用 |
tokens[] |
输入文档中的词法单元及其语法信息。当用户启用 |
entities[] |
输入文档中的实体及其语义信息。当用户启用 |
document_ |
文档的整体情感。当用户启用 |
language |
文本的语言,与请求中指定的语言相同;如果未指定,则与自动检测到的语言相同。如需了解详情,请参阅 |
categories[] |
输入文档中识别的类别。 |
moderation_ |
输入文档中识别的有害和敏感类别。 |
ClassificationCategory
表示从文本分类器返回的类别。
字段 | |
---|---|
name |
表示文档的类别名称。 |
confidence |
分类器的类别置信度。数字表示分类器对该类别表示给定文本的确定程度。 |
ClassificationModelOptions
分类请求可用的模型选项。
字段 | |
---|---|
联合字段 model_type 。如果未设置此字段,则系统将默认使用 v1_model 。model_type 只能是下列其中一项: |
|
v1_ |
设置此字段将使用 V1 模型和 V1 内容类别版本。V1 模型是旧版模型;我们日后将不再支持此模型。 |
v2_ |
设置此字段后,系统将使用具有适当内容类别版本的 V2 模型。V2 模型的效果更好。 |
V1Model
此类型没有字段。
V1 模型的选项。
V2Model
V2 模型的选项。
字段 | |
---|---|
content_ |
用于分类的内容类别。 |
ContentCategoriesVersion
用于分类的内容类别。
枚举 | |
---|---|
CONTENT_CATEGORIES_VERSION_UNSPECIFIED |
如果未指定 ContentCategoriesVersion ,此选项将默认为 V1 。 |
V1 |
我们在 2017 年首次推出的旧版内容类别。 |
V2 |
2022 年更新了内容类别。 |
ClassifyTextRequest
文档分类请求消息。
字段 | |
---|---|
document |
必需。输入文档。 |
classification_ |
可选。用于分类的模型选项。如果未指定,则默认为 v1 选项。 |
ClassifyTextResponse
文档分类响应消息。
字段 | |
---|---|
categories[] |
表示输入文档的类别。 |
DependencyEdge
表示词法单元的依存关系解析树信息。
字段 | |
---|---|
head_ |
表示依存关系树中此词法单元的头。这是词法单元的索引,它包含指向该词法单元的有向边。索引是 API 方法返回的词法单元数组中词法单元的位置。如果此令牌是根令牌,则 |
label |
词法单元的解析标签。 |
标签
词法单元的解析标签枚举。
枚举 | |
---|---|
UNKNOWN |
未知 |
ABBREV |
缩写 |
ACOMP |
形容词补语 |
ADVCL |
状语从句修饰语 |
ADVMOD |
状语 |
AMOD |
名词短语的形容词修饰 |
APPOS |
名词短语的同位词修饰 |
ATTR |
与系动词相关的属性 |
AUX |
助(非主)动词 |
AUXPASS |
被动式助动词 |
CC |
并列连接词 |
CCOMP |
动词或形容词的从句补语 |
CONJ |
连接性副词 |
CSUBJ |
从主关系 |
CSUBJPASS |
主从被动关系 |
DEP |
依赖关系(无法确定) |
DET |
限定词 |
DISCOURSE |
话语 |
DOBJ |
直接宾语 |
EXPL |
虚词 |
GOESWITH |
伴随(文本中未经修改的字词的一部分) |
IOBJ |
间接宾语 |
MARK |
标志词(引导从句的字词) |
MWE |
多字词表达 |
MWV |
多字词口头表达 |
NEG |
否定词修饰 |
NN |
复合名词修饰语 |
NPADVMOD |
用作状语的名词短语 |
NSUBJ |
名词性主语 |
NSUBJPASS |
被动型名词性主语 |
NUM |
名词的数量修饰 |
NUMBER |
复名数 |
P |
标点符号 |
PARATAXIS |
并列关系 |
PARTMOD |
分词修饰语 |
PCOMP |
介词的补语是从句 |
POBJ |
介词宾语 |
POSS |
所有格修饰语 |
POSTNEG |
动词后否定助词 |
PRECOMP |
谓词补语 |
PRECONJ |
前置连接词 |
PREDET |
前置限定词 |
PREF |
前缀 |
PREP |
介词修饰语 |
PRONL |
动词和动语素之间的关系 |
PRT |
小品词 |
PS |
关联或所有格标志词 |
QUANTMOD |
量词短语修饰语 |
RCMOD |
关系从句修饰语 |
RCMODREL |
关系从句中的补语化成分 |
RDROP |
前面无谓词的省略号 |
REF |
指代 |
REMNANT |
补余 |
REPARANDUM |
修正 |
ROOT |
词根 |
SNUM |
指定数字单位的后缀 |
SUFF |
后缀 |
TMOD |
时间修饰语 |
TOPIC |
主题标志词 |
VMOD |
以修饰名词的动词不定式开头的从句 |
VOCATIVE |
呼格 |
XCOMP |
开放式从句补语 |
SUFFIX |
名称后缀 |
TITLE |
职位名称 |
ADVPHMOD |
副词短语修饰 |
AUXCAUS |
使役助动词 |
AUXVV |
助动词 |
DTMOD |
Rentaishi(名词前修饰语) |
FOREIGN |
外来词 |
KW |
关键字 |
LIST |
一系列可比项目列表 |
NOMC |
名词性从句 |
NOMCSUBJ |
名词性从句主语 |
NOMCSUBJPASS |
名词性从句被动语态 |
NUMC |
数字修饰词组合 |
COP |
系动词 |
DISLOCATED |
错位关系(针对前移/主题化元素) |
ASP |
式标记 |
GMOD |
所有格修饰语 |
GOBJ |
所有格宾语 |
INFMOD |
不定式修饰语 |
MES |
衡量 |
NCOMP |
名词的名词性补语 |
文档
表示 API 方法的输入。
字段 | |
---|---|
type |
必需。如果类型未设置或为 |
language |
文档的语言(如果未指定,系统会自动检测语言)。接受 ISO 和 BCP-47 语言代码。 |
reference_ |
文档的来源网络 URI。此 URI 不用于提取内容,而是作为分析文档的提示。 |
boilerplate_ |
指明应如何处理此文档中检测到的样本内容(例如广告、版权声明、横幅)。如果未指定,系统会将样本内容与内容视为同等。 |
联合字段 source 。文档的来源:包含内容或 Google Cloud Storage URI 的字符串。source 只能是下列其中一项: |
|
content |
输入的内容(字符串格式)。 Cloud Audit Logging 基于用户数据,因此无需满足此要求。 |
gcs_ |
文件内容所在的 Google Cloud Storage URI。 此 URI 必须为如下形式:gs://bucket_name/object_name。如需了解详情,请参阅 https://cloud.google.com/storage/docs/reference-uris。注意:不支持 Cloud Storage 对象版本控制。 |
BoilerplateHandling
处理文档中检测到的样本文本的方法
枚举 | |
---|---|
BOILERPLATE_HANDLING_UNSPECIFIED |
未指定样板处理。 |
SKIP_BOILERPLATE |
不分析检测到的样板内容。必须提供参考网页 URI 才能检测样本代码。 |
KEEP_BOILERPLATE |
将样本内容视为内容。 |
类型
文档类型枚举。
枚举 | |
---|---|
TYPE_UNSPECIFIED |
未指定内容类型。 |
PLAIN_TEXT |
纯文本 |
HTML |
HTML |
EncodingType
表示调用方用于处理输出的文本编码。建议提供 EncodingType
,因为 API 为各种输出(例如词法单元和提及)提供起始偏移量,而且以原生方式使用不同文本编码的语言可能以不同方式访问偏移量。
枚举 | |
---|---|
NONE |
如果未指定 EncodingType ,则依赖于编码的信息(例如 begin_offset )将设置为 -1 。 |
UTF8 |
依赖于编码的信息(例如 begin_offset )基于输入的 UTF-8 编码计算得出。例如,C++ 和 Go 就是以原生方式使用此编码的语言。 |
UTF16 |
依赖于编码的信息(例如 begin_offset )基于输入的 UTF-16 编码计算得出。例如,Java 和 JavaScript 就是以原生方式使用此编码的语言。 |
UTF32 |
依赖于编码的信息(例如 begin_offset )基于输入的 UTF-32 编码计算得出。Python 是以原生方式使用此编码的语言示例。 |
实体
表示文本中已知实体(例如用户、组织或位置)的短语。API 会将显著性和提及等信息与实体关联。
字段 | |
---|---|
name |
实体的代表性名称。 |
type |
实体类型。 |
metadata |
与实体关联的元数据。 对于大多数实体类型,元数据是维基百科网址 ( |
salience |
在 [0, 1.0] 范围内的与实体关联的显著性得分。 通过实体的显著性得分,可了解该实体在整个文档文本中的重要性或向心性。分数接近 0 表示不太显著,而接近 1.0 则表示非常显著。 |
mentions[] |
输入文档中此实体的提及。API 目前支持专有名词提及。 |
sentiment |
对于对 |
类型
实体的类型。对于大多数实体类型,关联的元数据是维基百科网址 (wikipedia_url
) 和知识图谱 MID (mid
)。下表列出了具有不同元数据的实体的关联字段。
枚举 | |
---|---|
UNKNOWN |
未知 |
PERSON |
用户 |
LOCATION |
位置 |
ORGANIZATION |
组织 |
EVENT |
事件 |
WORK_OF_ART |
艺术作品 |
CONSUMER_GOOD |
消费类商品 |
OTHER |
其他类型的实体 |
PHONE_NUMBER |
电话号码 元数据列出根据当地惯例设置格式的电话号码,以及文本中出现的任何其他元素:
|
ADDRESS |
地址 元数据标识门牌号和市行政区,以及文本中出现的任何其他元素:
|
DATE |
日期 元数据标识日期的组成部分:
|
NUMBER |
数字 元数据本身就是数字。 |
PRICE |
价格 元数据标识 |
EntityMention
表示文本中实体的提及。目前支持专有名词提及。
字段 | |
---|---|
text |
提及文本。 |
type |
实体提及的类型。 |
sentiment |
对于对 |
类型
支持的提及类型。
枚举 | |
---|---|
TYPE_UNKNOWN |
未知 |
PROPER |
专有名词 |
COMMON |
普通名词(或复合名词) |
ModerateTextRequest
文档审核请求消息。
字段 | |
---|---|
document |
必需。输入文档。 |
ModerateTextResponse
文档审核响应消息。
字段 | |
---|---|
moderation_ |
表示输入文档的有害和敏感类别。 |
PartOfSpeech
表示词法单元的词性信息。
字段 | |
---|---|
tag |
词性标记。 |
aspect |
语法式。 |
case |
语法格。 |
form |
语法形式。 |
gender |
语法性别。 |
mood |
语法语气。 |
number |
语法数量。 |
person |
语法人称。 |
proper |
语法专有性。 |
reciprocity |
语法互指性。 |
tense |
语法时态。 |
voice |
语法语态。 |
方面
在事件中表现时间流的动词特征。
枚举 | |
---|---|
ASPECT_UNKNOWN |
式不适用于分析后的语言,也无法预测。 |
PERFECTIVE |
完成式 |
IMPERFECTIVE |
未完成式 |
PROGRESSIVE |
进行式 |
格
名词或代词在短语、从句或句子中所起的语法作用。在某些语言中,其他词性(如形容词和限定词)都会发生与名词一致的格变化。
枚举 | |
---|---|
CASE_UNKNOWN |
格不适用于分析后的语言,也无法预测。 |
ACCUSATIVE |
宾格 |
ADVERBIAL |
副词格 |
COMPLEMENTIVE |
补充格 |
DATIVE |
与格 |
GENITIVE |
所有格 |
INSTRUMENTAL |
工具格 |
LOCATIVE |
位置格 |
NOMINATIVE |
主格 |
OBLIQUE |
从格 |
PARTITIVE |
部分格 |
PREPOSITIONAL |
前置格 |
REFLEXIVE_CASE |
反身代词 |
RELATIVE_CASE |
关系格 |
VOCATIVE |
呼格 |
形式
根据语言的不同,形式可以分为动词、形容词、副词等不同形式。例如,对动词和形容词的变形词尾进行分类,或者对形容词和分词的短形式和长形式进行区分
枚举 | |
---|---|
FORM_UNKNOWN |
形式不适用于分析后的语言,也无法预测。 |
ADNOMIAL |
名词修饰语 |
AUXILIARY |
辅助词 |
COMPLEMENTIZER |
补语成分 |
FINAL_ENDING |
词尾 |
GERUND |
动名词 |
REALIS |
已然形 |
IRREALIS |
未然形 |
SHORT |
短形式 |
LONG |
长形式 |
ORDER |
命令形式 |
SPECIFIC |
特殊形式 |
性别
关联词的行为反映的名词性别类别。
枚举 | |
---|---|
GENDER_UNKNOWN |
性别不适用于分析后的语言,也无法预测。 |
FEMININE |
阴性词 |
MASCULINE |
阳性词 |
NEUTER |
中性词 |
语气
动词的语法功能,用于表示情态和态度。
枚举 | |
---|---|
MOOD_UNKNOWN |
语气不适用于分析后的语言,也无法预测。 |
CONDITIONAL_MOOD |
条件语气 |
IMPERATIVE |
祈使语气 |
INDICATIVE |
陈述语气 |
INTERROGATIVE |
疑问语气 |
JUSSIVE |
弱祈使语气 |
SUBJUNCTIVE |
虚拟语气 |
数字
数的区分。
枚举 | |
---|---|
NUMBER_UNKNOWN |
数字不适用于分析后的语言,也无法预测。 |
SINGULAR |
单数 |
PLURAL |
复数 |
DUAL |
双数 |
人称
说话人、第二人称、第三人称等之间的区别。
枚举 | |
---|---|
PERSON_UNKNOWN |
人称不适用于分析后的语言,也无法预测。 |
FIRST |
第一人称 |
SECOND |
第二人称 |
THIRD |
第三人称 |
REFLEXIVE_PERSON |
反身代词 |
专有
此类别显示词法单元是否属于专有名称的一部分。
枚举 | |
---|---|
PROPER_UNKNOWN |
专有性不适用于分析后的语言,也无法预测。 |
PROPER |
专有 |
NOT_PROPER |
非专有 |
互指性
代词的互指特征。
枚举 | |
---|---|
RECIPROCITY_UNKNOWN |
互指性不适用于分析后的语言,也无法预测。 |
RECIPROCAL |
互指 |
NON_RECIPROCAL |
非互指 |
标记
词性标记枚举。
枚举 | |
---|---|
UNKNOWN |
未知 |
ADJ |
形容词 |
ADP |
介词(前置词和后置词) |
ADV |
副词 |
CONJ |
连词 |
DET |
限定词 |
NOUN |
名词(普通和专有) |
NUM |
基数词 |
PRON |
代词 |
PRT |
助词或其他虚词 |
PUNCT |
标点符号 |
VERB |
动词(所有时态和模式) |
X |
其他:外来词、拼写错误的词、缩写 |
AFFIX |
词缀 |
时态
时间参考。
枚举 | |
---|---|
TENSE_UNKNOWN |
时态不适用于分析后的语言,也无法预测。 |
CONDITIONAL_TENSE |
条件 |
FUTURE |
将来时 |
PAST |
过去时 |
PRESENT |
现在时 |
IMPERFECT |
未完成时 |
PLUPERFECT |
过去完成时 |
语态
动词表达的动作与由其主词确定的参与者之间的关系。
枚举 | |
---|---|
VOICE_UNKNOWN |
语态不适用于分析后的语言,也无法预测。 |
ACTIVE |
主动 |
CAUSATIVE |
使动 |
PASSIVE |
被动 |
句子
表示输入文档中的一个句子。
字段 | |
---|---|
text |
句子文本。 |
sentiment |
对于对 |
情感
表示与整个文本或文本中的实体相关联的感受。
字段 | |
---|---|
magnitude |
[0, +inf] 范围内的非负数,表示情感的绝对量级,与具体分数(正数或负数)无关。 |
score |
情感得分介于 -1.0(负面情绪)与 1.0(正面情绪)之间。 |
TextSpan
表示输入文档中的文本片段。
字段 | |
---|---|
content |
文本片段的内容,即文档的子字符串。 |
begin_ |
API 根据 API 请求中指定的 |
令牌
表示文本的最小语法构建块。
字段 | |
---|---|
text |
令牌文本。 |
part_ |
此词法单元的词性标记。 |
dependency_ |
此词法单元的依存关系树解析。 |
lemma |
词法单元的词元。 |