索引
LanguageService
(接口)AnalyzeEntitiesRequest
(消息)AnalyzeEntitiesResponse
(消息)AnalyzeSentimentRequest
(消息)AnalyzeSentimentResponse
(消息)AnnotateTextRequest
(消息)AnnotateTextRequest.Features
(消息)AnnotateTextResponse
(消息)ClassificationCategory
(消息)ClassifyTextRequest
(消息)ClassifyTextResponse
(消息)Document
(消息)Document.Type
(枚举)EncodingType
(枚举)Entity
(消息)Entity.Type
(枚举)EntityMention
(消息)EntityMention.Type
(枚举)ModerateTextRequest
(消息)ModerateTextRequest.ModelVersion
(枚举)ModerateTextResponse
(消息)Sentence
(消息)Sentiment
(消息)TextSpan
(消息)
LanguageService
提供文本分析操作,例如情感分析和实体识别。
AnalyzeEntities |
---|
查找文本中的命名实体(当前为专有名词和普通名词),以及实体类型、概率、每个实体的提及和其他属性。
|
AnalyzeSentiment |
---|
分析所提供的文本的情感。
|
AnnotateText |
---|
一种便捷方法,用于在一次调用中提供所有功能。
|
ClassifyText |
---|
将文档进行分类。
|
ModerateText |
---|
审核文档是否包含有害内容和敏感内容。
|
AnalyzeEntitiesRequest
实体分析请求消息。
字段 | |
---|---|
document |
必需。输入文档。 |
encoding_ |
API 用于计算偏移的编码类型。 |
AnalyzeEntitiesResponse
实体分析响应消息。
字段 | |
---|---|
entities[] |
输入文档中已识别的实体。 |
language_ |
文本的语言,与请求中指定的语言相同;如果未指定,则与自动检测到的语言相同。如需了解详情,请参阅 [Document.language][] 字段。 |
language_ |
相应语言是否受官方支持。在语言不受支持的情况下,API 可能仍会返回响应,但只能尽力而为。 |
AnalyzeSentimentRequest
情感分析请求消息。
字段 | |
---|---|
document |
必需。输入文档。 |
encoding_ |
API 用于计算句子偏移的编码类型。 |
AnalyzeSentimentResponse
情感分析响应消息。
字段 | |
---|---|
document_ |
输入文档的整体情感。 |
language_ |
文本的语言,与请求中指定的语言相同;如果未指定,则与自动检测到的语言相同。如需了解详情,请参阅 [Document.language][] 字段。 |
sentences[] |
文档中所有句子的情感。 |
language_ |
相应语言是否受官方支持。在语言不受支持的情况下,API 可能仍会返回响应,但只能尽力而为。 |
AnnotateTextRequest
文本注释 API 的请求消息,此 API 可以在一次调用中执行多种分析类型。
字段 | |
---|---|
document |
必需。输入文档。 |
features |
必需。已启用的功能。 |
encoding_ |
API 用于计算偏移的编码类型。 |
特性
所有可用功能。将每个特性设为 true 可对输入启用特定的分析。
字段 | |
---|---|
extract_ |
可选。提取实体, |
extract_ |
可选。提取文档级情感。 |
classify_ |
可选。将整个文档分类。 |
moderate_ |
可选。审核文档是否包含有害和敏感内容。 |
AnnotateTextResponse
文本注释响应消息。
字段 | |
---|---|
sentences[] |
输入文档中的句子。当用户启用 |
entities[] |
输入文档中的实体及其语义信息。如果用户启用 |
document_ |
文档的整体情感。当用户启用 |
language_ |
文本的语言,与请求中指定的语言相同;如果未指定,则与自动检测到的语言相同。如需了解详情,请参阅 [Document.language][] 字段。 |
categories[] |
输入文档中识别的类别。 |
moderation_ |
输入文档中识别的有害和敏感类别。 |
language_ |
所有请求的功能是否都正式支持相应语言。在语言不受支持的情况下,API 可能仍会返回响应,但只能尽力而为。 |
ClassificationCategory
表示从文本分类器返回的类别。
字段 | |
---|---|
name |
表示文档的类别名称。 |
confidence |
分类器的类别置信度。数字表示分类器对该类别表示给定文本的确定程度。 |
severity |
可选。分类器对相应类别的严重程度。只有在 ModerateTextRequest.ModelVersion 设置为 MODEL_VERSION_2 且相应类别具有严重程度得分时,此字段才会出现。 |
ClassifyTextRequest
文档分类请求消息。
字段 | |
---|---|
document |
必需。输入文档。 |
ClassifyTextResponse
文档分类响应消息。
字段 | |
---|---|
categories[] |
表示输入文档的类别。 |
language_ |
文本的语言,与请求中指定的语言相同;如果未指定,则与自动检测到的语言相同。如需了解详情,请参阅 [Document.language][] 字段。 |
language_ |
相应语言是否受官方支持。在语言不受支持的情况下,API 可能仍会返回响应,但只能尽力而为。 |
文档
表示 API 方法的输入。
字段 | |
---|---|
type |
必需。如果类型未设置或为 |
language_ |
可选。文档的语言(如果未指定,系统会自动检测语言)。接受 ISO 和 BCP-47 语言代码。 |
联合字段 source 。文档的来源:包含内容或 Google Cloud Storage URI 的字符串。source 只能是下列其中一项: |
|
content |
输入的内容(字符串格式)。 Cloud Audit Logging 基于用户数据,因此无需满足此要求。 |
gcs_ |
文件内容所在的 Google Cloud Storage URI。 此 URI 必须为如下形式:gs://bucket_name/object_name。如需了解详情,请参阅 https://cloud.google.com/storage/docs/reference-uris。注意:不支持 Cloud Storage 对象版本控制。 |
类型
文档类型枚举。
枚举 | |
---|---|
TYPE_UNSPECIFIED |
未指定内容类型。 |
PLAIN_TEXT |
纯文本 |
HTML |
HTML |
EncodingType
表示调用方用于处理输出的文本编码。建议提供 EncodingType
,因为 API 为各种输出(例如词法单元和提及)提供起始偏移量,而且以原生方式使用不同文本编码的语言可能以不同方式访问偏移量。
枚举 | |
---|---|
NONE |
如果未指定 EncodingType ,则依赖于编码的信息(例如 begin_offset )将设置为 -1 。 |
UTF8 |
依赖于编码的信息(例如 begin_offset )基于输入的 UTF-8 编码计算得出。例如,C++ 和 Go 就是以原生方式使用此编码的语言。 |
UTF16 |
依赖于编码的信息(例如 begin_offset )基于输入的 UTF-16 编码计算得出。例如,Java 和 JavaScript 就是以原生方式使用此编码的语言。 |
UTF32 |
依赖于编码的信息(例如 begin_offset )基于输入的 UTF-32 编码计算得出。Python 是以原生方式使用此编码的语言示例。 |
实体
表示文本中已知实体(例如用户、组织或位置)的短语。API 会将概率和提及等信息与实体关联。
字段 | |
---|---|
name |
实体的代表性名称。 |
type |
实体类型。 |
metadata |
与实体关联的元数据。 对于与其他实体类型关联的元数据,请参阅下面的“类型”表。 |
mentions[] |
输入文档中此实体的提及。API 目前支持专有名词提及。 |
sentiment |
对于对 |
类型
实体的类型。下表列出了具有不同元数据的实体的关联字段。
枚举 | |
---|---|
UNKNOWN |
未知 |
PERSON |
用户 |
LOCATION |
位置 |
ORGANIZATION |
组织 |
EVENT |
事件 |
WORK_OF_ART |
艺术作品 |
CONSUMER_GOOD |
消费类商品 |
OTHER |
其他类型的实体 |
PHONE_NUMBER |
电话号码 元数据列出根据当地惯例设置格式的电话号码,以及文本中出现的任何其他元素:
|
ADDRESS |
地址 元数据标识门牌号和市行政区,以及文本中出现的任何其他元素:
|
DATE |
日期 元数据标识日期的组成部分:
|
NUMBER |
数字 元数据本身就是数字。 |
PRICE |
价格 元数据标识 |
EntityMention
表示文本中实体的提及。目前支持专有名词提及。
字段 | |
---|---|
text |
提及文本。 |
type |
实体提及的类型。 |
sentiment |
对于对 |
probability |
与实体关联的概率得分。 该分数表示实体提及属于相应实体类型的概率。得分介于 (0, 1] 范围内。 |
类型
支持的提及类型。
枚举 | |
---|---|
TYPE_UNKNOWN |
未知 |
PROPER |
专有名词 |
COMMON |
普通名词(或复合名词) |
ModerateTextRequest
文档审核请求消息。
字段 | |
---|---|
document |
必需。输入文档。 |
model_ |
可选。用于 ModerateText 的模型版本。 |
ModelVersion
用于 ModerateText 的模型版本。
枚举 | |
---|---|
MODEL_VERSION_UNSPECIFIED |
默认模型版本。 |
MODEL_VERSION_1 |
使用 v1 模型,如果未提供,系统会默认使用此模型。v1 模型仅会为每个类别返回概率(置信度)分数。 |
MODEL_VERSION_2 |
使用 v2 模型。v2 模型仅会为每个类别返回概率(置信度)分数,并会为部分类别返回严重程度分数。 |
ModerateTextResponse
文档审核响应消息。
字段 | |
---|---|
moderation_ |
表示输入文档的有害和敏感类别。 |
language_ |
文本的语言,与请求中指定的语言相同;如果未指定,则与自动检测到的语言相同。如需了解详情,请参阅 [Document.language][] 字段。 |
language_ |
相应语言是否受官方支持。在语言不受支持的情况下,API 可能仍会返回响应,但只能尽力而为。 |
句子
表示输入文档中的一个句子。
字段 | |
---|---|
text |
句子文本。 |
sentiment |
对于对 |
情感
表示与整个文本或文本中的实体相关联的感受。
字段 | |
---|---|
magnitude |
[0, +inf] 范围内的非负数,表示情感的绝对量级,与具体分数(正数或负数)无关。 |
score |
情感得分介于 -1.0(负面情绪)与 1.0(正面情绪)之间。 |
TextSpan
表示输入文档中的文本片段。
字段 | |
---|---|
content |
文本片段的内容,即文档的子字符串。 |
begin_ |
API 根据 API 请求中指定的 |