Package google.cloud.language.v2

색인

LanguageService

감정 분석, 항목 인식과 같은 텍스트 분석 작업을 제공합니다.

AnalyzeEntities

rpc AnalyzeEntities(AnalyzeEntitiesRequest) returns (AnalyzeEntitiesResponse)

텍스트에서 이름이 지정된 항목 (현재는 고유한 이름 및 일반 명사)과 함께 항목 유형, 확률, 각 항목의 멘션, 기타 속성을 찾습니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

AnalyzeSentiment

rpc AnalyzeSentiment(AnalyzeSentimentRequest) returns (AnalyzeSentimentResponse)

제공된 텍스트의 감정을 분석합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

AnnotateText

rpc AnnotateText(AnnotateTextRequest) returns (AnnotateTextResponse)

한 번의 호출로 모든 기능을 제공하는 편의 메서드입니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

ClassifyText

rpc ClassifyText(ClassifyTextRequest) returns (ClassifyTextResponse)

문서를 카테고리로 분류합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

ModerateText

rpc ModerateText(ModerateTextRequest) returns (ModerateTextResponse)

유해하고 민감한 카테고리의 문서를 검토합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

AnalyzeEntitiesRequest

항목 분석 요청 메시지입니다.

필드
document

Document

필수 입력란입니다. 문서를 입력합니다.

encoding_type

EncodingType

API에서 오프셋을 계산하는 데 사용하는 인코딩 유형입니다.

AnalyzeEntitiesResponse

항목 분석 응답 메시지입니다.

필드
entities[]

Entity

입력 문서에서 인식된 항목입니다.

language_code

string

텍스트의 언어입니다. 요청에 지정된 언어와 동일하거나 지정되지 않은 경우에는 자동 감지된 언어입니다. 자세한 내용은 [Document.language][] 필드를 참고하세요.

language_supported

bool

언어가 공식적으로 지원되는지 여부 언어가 지원되지 않는 경우에도 API가 응답을 반환할 수 있지만 최선의 방식으로 제공됩니다.

AnalyzeSentimentRequest

감정 분석 요청 메시지입니다.

필드
document

Document

필수 입력란입니다. 문서를 입력합니다.

encoding_type

EncodingType

API에서 문장 오프셋을 계산하는 데 사용하는 인코딩 유형입니다.

AnalyzeSentimentResponse

감정 분석 응답 메시지입니다.

필드
document_sentiment

Sentiment

입력 문서의 전반적인 감정입니다.

language_code

string

텍스트의 언어입니다. 요청에 지정된 언어와 동일하거나 지정되지 않은 경우에는 자동 감지된 언어와 동일합니다. 자세한 내용은 [Document.language][] 필드를 참고하세요.

sentences[]

Sentence

문서의 모든 문장에 대한 감정입니다.

language_supported

bool

언어가 공식적으로 지원되는지 여부 언어가 지원되지 않는 경우에도 API가 응답을 반환할 수 있지만 최선의 방식으로 제공됩니다.

AnnotateTextRequest

한 번의 호출로 여러 분석 유형을 실행할 수 있는 텍스트 주석 API의 요청 메시지입니다.

필드
document

Document

필수 입력란입니다. 문서를 입력합니다.

features

Features

필수 입력란입니다. 사용 설정된 기능

encoding_type

EncodingType

API에서 오프셋을 계산하는 데 사용하는 인코딩 유형입니다.

기능

사용 가능한 모든 기능 각각을 true로 설정하면 입력에 대해 해당 분석이 사용 설정됩니다.

필드
extract_entities

bool

선택사항입니다. 항목 추출

extract_document_sentiment

bool

선택사항입니다. 문서 수준 감정을 추출합니다.

classify_text

bool

선택사항입니다. 전체 문서를 카테고리로 분류합니다.

moderate_text

bool

선택사항입니다. 유해하고 민감한 카테고리의 문서를 검토합니다.

AnnotateTextResponse

텍스트 주석 응답 메시지입니다.

필드
sentences[]

Sentence

입력 문서의 문장입니다. 사용자가 AnnotateTextRequest.Features.extract_document_sentiment를 사용 설정하면 채워집니다.

entities[]

Entity

입력 문서의 항목과 시맨틱 정보 사용자가 AnnotateTextRequest.Features.extract_entities 또는 AnnotateTextRequest.Features.extract_entity_sentiment를 사용 설정하면 채워집니다.

document_sentiment

Sentiment

문서의 전반적인 감정입니다. 사용자가 AnnotateTextRequest.Features.extract_document_sentiment를 사용 설정하면 채워집니다.

language_code

string

텍스트의 언어입니다. 요청에 지정된 언어와 동일하거나 지정되지 않은 경우에는 자동 감지된 언어입니다. 자세한 내용은 [Document.language][] 필드를 참고하세요.

categories[]

ClassificationCategory

입력 문서에서 식별된 카테고리입니다.

moderation_categories[]

ClassificationCategory

입력 문서에서 확인된 유해하고 민감한 카테고리입니다.

language_supported

bool

요청된 모든 기능에서 언어가 공식적으로 지원되는지 여부입니다. 언어가 지원되지 않는 경우에도 API가 응답을 반환할 수 있지만 최선의 방식으로 제공됩니다.

ClassificationCategory

텍스트 분류기에서 반환된 카테고리를 나타냅니다.

필드
name

string

문서를 나타내는 카테고리의 이름입니다.

confidence

float

분류자의 카테고리 신뢰도입니다. 숫자는 이 카테고리가 주어진 텍스트를 나타낸다고 분류기가 얼마나 확신하는지를 나타냅니다.

severity

float

선택사항입니다. 분류 기준의 카테고리 심각도입니다. ModerateTextRequest.ModelVersion이 MODEL_VERSION_2로 설정되어 있고 해당 카테고리에 심각도 점수가 있는 경우에만 표시됩니다.

ClassifyTextRequest

문서 분류 요청 메시지입니다.

필드
document

Document

필수 입력란입니다. 문서를 입력합니다.

ClassifyTextResponse

문서 분류 응답 메시지입니다.

필드
categories[]

ClassificationCategory

입력 문서를 나타내는 카테고리입니다.

language_code

string

텍스트의 언어입니다. 요청에 지정된 언어와 동일하거나 지정되지 않은 경우에는 자동 감지된 언어와 동일합니다. 자세한 내용은 [Document.language][] 필드를 참고하세요.

language_supported

bool

언어가 공식적으로 지원되는지 여부 언어가 지원되지 않는 경우에도 API가 응답을 반환할 수 있지만 최선의 방식으로 제공됩니다.

문서

API 메서드의 입력을 나타냅니다.

필드
type

Type

필수 입력란입니다. 유형이 설정되지 않았거나 TYPE_UNSPECIFIED인 경우 INVALID_ARGUMENT 오류를 반환합니다.

language_code

string

선택사항입니다. 문서의 언어입니다. 지정하지 않으면 언어가 자동으로 감지됩니다. ISO 및 BCP-47 언어 코드 모두 허용됩니다.
Language Support에는 현재 각 API 메서드에 지원되는 언어가 나열됩니다. 호출자가 지정했거나 자동으로 감지된 언어가 호출된 API 메서드에서 지원되지 않으면 INVALID_ARGUMENT 오류가 반환됩니다.

통합 필드 source. 문서의 소스: 콘텐츠 또는 Google Cloud Storage URI가 포함된 문자열입니다. source은 다음 중 하나여야 합니다.
content

string

문자열 형식의 입력 콘텐츠입니다. Cloud 감사 로깅은 사용자 데이터를 기반으로 하므로 예외입니다.

gcs_content_uri

string

파일 콘텐츠가 위치한 Google Cloud Storage URI입니다. 이 URI는 gs://bucket_name/object_name 형식이어야 합니다. 자세한 내용은 https://cloud.google.com/storage/docs/reference-uris를 참고하세요. 참고: Cloud Storage 객체 버전 관리는 지원되지 않습니다.

유형

문서 유형 enum입니다.

열거형
TYPE_UNSPECIFIED 콘텐츠 유형이 지정되지 않았습니다.
PLAIN_TEXT 일반 텍스트
HTML HTML

EncodingType

호출자가 출력을 처리하는 데 사용하는 텍스트 인코딩을 나타냅니다. API는 토큰 및 멘션과 같은 다양한 출력의 시작 오프셋을 제공하며, 기본적으로 다른 텍스트 인코딩을 사용하는 언어는 오프셋에 다르게 액세스할 수 있으므로 EncodingType를 제공하는 것이 좋습니다.

열거형
NONE EncodingType가 지정되지 않으면 인코딩 종속 정보 (예: begin_offset)가 -1로 설정됩니다.
UTF8 인코딩에 종속된 정보 (예: begin_offset)는 입력의 UTF-8 인코딩을 기반으로 계산됩니다. C++와 Go는 이 인코딩을 기본적으로 사용하는 언어의 예입니다.
UTF16 인코딩에 종속된 정보 (예: begin_offset)는 입력의 UTF-16 인코딩을 기반으로 계산됩니다. Java와 JavaScript는 이 인코딩을 기본적으로 사용하는 언어의 예입니다.
UTF32 인코딩에 종속된 정보 (예: begin_offset)는 입력의 UTF-32 인코딩을 기반으로 계산됩니다. Python은 이 인코딩을 기본적으로 사용하는 언어의 예입니다.

항목

텍스트에서 사람, 조직, 장소와 같이 알려진 항목인 문구를 나타냅니다. API는 확률 및 멘션과 같은 정보를 항목과 연결합니다.

필드
name

string

항목의 대표 이름입니다.

type

Type

항목 유형입니다.

metadata

map<string, string>

항목과 연결된 메타데이터입니다.

다른 항목 유형과 연결된 메타데이터는 아래의 유형 표를 참고하세요.

mentions[]

EntityMention

입력 문서에서 이 항목을 언급한 부분입니다. 이 API는 현재 고유명사 언급을 지원합니다.

sentiment

Sentiment

AnalyzeEntitySentimentRequest 호출의 경우 또는 AnnotateTextRequest.Features.extract_entity_sentiment가 true로 설정된 경우 이 필드에는 제공된 문서에서 이 항목에 대해 표현된 집계된 감정이 포함됩니다.

유형

항목의 유형입니다. 아래 표에는 메타데이터가 다른 항목의 연결된 필드가 나와 있습니다.

열거형
UNKNOWN 알 수 없음
PERSON 사람
LOCATION 위치
ORGANIZATION 조직
EVENT 이벤트
WORK_OF_ART 예술작품
CONSUMER_GOOD 소비자 제품
OTHER 기타 항목 유형
PHONE_NUMBER

전화번호

메타데이터에는 현지 관례에 따라 형식이 지정된 전화번호와 텍스트에 표시되는 추가 요소가 나열됩니다.

  • number - 현지 관례에 따라 섹션으로 분류된 실제 수
  • national_prefix - 국가 코드(감지된 경우)
  • area_code - 지역 또는 지역 코드(감지된 경우)
  • extension - 전화번호 (연결 후 전화 걸기) - 감지된 경우
ADDRESS

주소

메타데이터는 도로 번호와 지역을 식별하고 텍스트에 표시되는 추가 요소를 식별합니다.

  • street_number - 번지수
  • locality - 도시 또는 마을
  • street_name - 감지된 경우 도로/경로 이름
  • postal_code - 우편번호(감지된 경우)
  • country - 감지된 경우 국가
  • broad_region - 행정 구역(예: 주) - 감지된 경우
  • narrow_region - 감지된 경우 카운티와 같은 소규모 행정 구역
  • sublocality - 아시아 주소에서 도시 내 구역을 구분하는 데 사용됩니다(감지되는 경우).
DATE

날짜

메타데이터는 날짜의 구성요소를 식별합니다.

  • year - 감지된 경우 4자리 연도
  • month - 감지된 경우 두 자리 월 번호
  • day - 감지된 경우 2자리 일 수
NUMBER

숫자

메타데이터는 숫자 자체입니다.

PRICE

가격

메타데이터는 valuecurrency를 식별합니다.

EntityMention

텍스트에서 항목의 멘션을 나타냅니다. 현재는 고유명사 멘션이 지원됩니다.

필드
text

TextSpan

멘션 텍스트입니다.

type

Type

항목 멘션의 유형입니다.

sentiment

Sentiment

AnalyzeEntitySentimentRequest 호출의 경우 또는 AnnotateTextRequest.Features.extract_entity_sentiment가 true로 설정된 경우 이 필드에는 제공된 문서에서 이 항목에 대해 표현된 감정이 포함됩니다.

probability

float

항목과 연결된 확률 점수입니다.

점수는 항목 멘션이 항목 유형일 가능성을 나타냅니다. 점수는 (0, 1] 범위에 속합니다.

유형

지원되는 멘션 유형

열거형
TYPE_UNKNOWN 알 수 없음
PROPER 고유명사
COMMON 일반 명사 (또는 명사 복합어)

ModerateTextRequest

문서 검토 요청 메시지입니다.

필드
document

Document

필수 입력란입니다. 문서를 입력합니다.

model_version

ModelVersion

선택사항입니다. ModerateText에 사용할 모델 버전입니다.

ModelVersion

ModerateText에 사용할 모델 버전입니다.

열거형
MODEL_VERSION_UNSPECIFIED 기본 모델 버전입니다.
MODEL_VERSION_1 v1 모델을 사용합니다. 이 모델은 제공되지 않을 때 기본적으로 사용됩니다. v1 모델은 각 카테고리의 확률 (신뢰도) 점수만 반환합니다.
MODEL_VERSION_2 v2 모델을 사용합니다. v2 모델은 각 카테고리의 확률 (신뢰도) 점수만 반환하고 카테고리의 하위 집합에 대한 심각도 점수를 반환합니다.

ModerateTextResponse

문서 검토 응답 메시지입니다.

필드
moderation_categories[]

ClassificationCategory

입력 문서를 나타내는 유해 및 민감한 카테고리입니다.

language_code

string

텍스트의 언어입니다. 요청에 지정된 언어와 동일하거나 지정되지 않은 경우에는 자동 감지된 언어와 동일합니다. 자세한 내용은 [Document.language][] 필드를 참고하세요.

language_supported

bool

언어가 공식적으로 지원되는지 여부 언어가 지원되지 않는 경우에도 API가 응답을 반환할 수 있지만 최선의 방식으로 제공됩니다.

문장

입력 문서의 문장을 나타냅니다.

필드
text

TextSpan

문장 텍스트입니다.

sentiment

Sentiment

AnalyzeSentimentRequest 호출의 경우 또는 AnnotateTextRequest.Features.extract_document_sentiment가 true로 설정된 경우 이 필드에 문장의 감정이 포함됩니다.

감정

텍스트 전체 또는 텍스트의 항목과 관련된 감정을 나타냅니다.

필드
magnitude

float

[0, +inf] 범위의 음수가 아닌 숫자로, 점수 (긍정 또는 부정)와 관계없이 감정의 절대 크기를 나타냅니다.

score

float

감정 점수로, -1.0(부정적인 감정)부터 1.0(긍정적인 감정)까지입니다.

TextSpan

입력 문서의 텍스트 스팬을 나타냅니다.

필드
content

string

문서의 하위 문자열인 텍스트 스팬의 콘텐츠입니다.

begin_offset

int32

API는 API 요청에 지정된 EncodingType에 따라 원본 문서의 콘텐츠 시작 오프셋을 계산합니다.