Package google.cloud.language.v2

Indeks

LanguageService

Menyediakan operasi analisis teks seperti analisis sentimen dan pengenalan entity.

AnalyzeEntities

rpc AnalyzeEntities(AnalyzeEntitiesRequest) returns (AnalyzeEntitiesResponse)

Menemukan entity bernama (saat ini nama diri dan kata benda umum) dalam teks beserta jenis entity, probabilitas, sebutan untuk setiap entity, dan properti lainnya.

Cakupan otorisasi

Memerlukan salah satu cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Autentikasi.

AnalyzeSentiment

rpc AnalyzeSentiment(AnalyzeSentimentRequest) returns (AnalyzeSentimentResponse)

Menganalisis sentimen teks yang diberikan.

Cakupan otorisasi

Memerlukan salah satu cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Autentikasi.

AnnotateText

rpc AnnotateText(AnnotateTextRequest) returns (AnnotateTextResponse)

Metode praktis yang menyediakan semua fitur dalam satu panggilan.

Cakupan otorisasi

Memerlukan salah satu cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Autentikasi.

ClassifyText

rpc ClassifyText(ClassifyTextRequest) returns (ClassifyTextResponse)

Mengklasifikasikan dokumen ke dalam kategori.

Cakupan otorisasi

Memerlukan salah satu cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Autentikasi.

ModerateText

rpc ModerateText(ModerateTextRequest) returns (ModerateTextResponse)

Memoderasi dokumen untuk kategori berbahaya dan sensitif.

Cakupan otorisasi

Memerlukan salah satu cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Autentikasi.

AnalyzeEntitiesRequest

Pesan permintaan analisis entity.

Kolom
document

Document

Wajib. Masukkan dokumen.

encoding_type

EncodingType

Jenis encoding yang digunakan oleh API untuk menghitung offset.

AnalyzeEntitiesResponse

Pesan respons analisis entity.

Kolom
entities[]

Entity

Entitas yang dikenali dalam dokumen input.

language_code

string

Bahasa teks, yang akan sama dengan bahasa yang ditentukan dalam permintaan atau, jika tidak ditentukan, bahasa yang terdeteksi secara otomatis. Lihat kolom [Document.language][] untuk mengetahui detail selengkapnya.

language_supported

bool

Apakah bahasa tersebut didukung secara resmi. API mungkin masih menampilkan respons jika bahasa tidak didukung, tetapi berdasarkan upaya terbaik.

AnalyzeSentimentRequest

Pesan permintaan analisis sentimen.

Kolom
document

Document

Wajib. Dokumen input.

encoding_type

EncodingType

Jenis encoding yang digunakan oleh API untuk menghitung offset kalimat.

AnalyzeSentimentResponse

Pesan respons analisis sentimen.

Kolom
document_sentiment

Sentiment

Keseluruhan sentimen dokumen input.

language_code

string

Bahasa teks, yang akan sama dengan bahasa yang ditentukan dalam permintaan atau, jika tidak ditentukan, bahasa yang terdeteksi secara otomatis. Lihat kolom [Document.language][] untuk mengetahui detail selengkapnya.

sentences[]

Sentence

Sentimen untuk semua kalimat dalam dokumen.

language_supported

bool

Apakah bahasa tersebut didukung secara resmi. API mungkin masih menampilkan respons jika bahasa tidak didukung, tetapi berdasarkan upaya terbaik.

AnnotateTextRequest

Pesan permintaan untuk API anotasi teks, yang dapat melakukan beberapa jenis analisis dalam satu panggilan.

Kolom
document

Document

Wajib. Masukkan dokumen.

features

Features

Wajib. Fitur yang diaktifkan.

encoding_type

EncodingType

Jenis encoding yang digunakan oleh API untuk menghitung offset.

Fitur

Semua fitur yang tersedia. Menetapkan setiap setelan ke benar akan mengaktifkan analisis spesifik tersebut untuk input.

Kolom
extract_entities

bool

Opsional. mengekstrak entity,

extract_document_sentiment

bool

Opsional. Mengekstrak sentimen tingkat dokumen.

classify_text

bool

Opsional. Klasifikasikan dokumen lengkap ke dalam kategori.

moderate_text

bool

Opsional. Moderasi dokumen untuk kategori berbahaya dan sensitif.

AnnotateTextResponse

Pesan respons anotasi teks.

Kolom
sentences[]

Sentence

Kalimat dalam dokumen input. Diisi jika pengguna mengaktifkan AnnotateTextRequest.Features.extract_document_sentiment.

entities[]

Entity

Entitas, beserta informasi semantiknya, dalam dokumen input. Diisi jika pengguna mengaktifkan AnnotateTextRequest.Features.extract_entities atau AnnotateTextRequest.Features.extract_entity_sentiment.

document_sentiment

Sentiment

Keseluruhan sentimen untuk dokumen. Diisi jika pengguna mengaktifkan AnnotateTextRequest.Features.extract_document_sentiment.

language_code

string

Bahasa teks, yang akan sama dengan bahasa yang ditentukan dalam permintaan atau, jika tidak ditentukan, bahasa yang terdeteksi secara otomatis. Lihat kolom [Document.language][] untuk mengetahui detail selengkapnya.

categories[]

ClassificationCategory

Kategori yang diidentifikasi dalam dokumen input.

moderation_categories[]

ClassificationCategory

Kategori berbahaya dan sensitif yang diidentifikasi dalam dokumen input.

language_supported

bool

Apakah bahasa tersebut secara resmi didukung oleh semua fitur yang diminta. API mungkin masih menampilkan respons jika bahasa tidak didukung, tetapi berdasarkan upaya terbaik.

ClassificationCategory

Merepresentasikan kategori yang ditampilkan dari pengklasifikasi teks.

Kolom
name

string

Nama kategori yang mewakili dokumen.

confidence

float

Keyakinan pengklasifikasi terhadap kategori. Angka menunjukkan seberapa yakin pengklasifikasi bahwa kategori ini mewakili teks yang diberikan.

severity

float

Opsional. Tingkat keparahan kategori pengklasifikasi. Ini hanya ada jika ModerateTextRequest.ModelVersion ditetapkan ke MODEL_VERSION_2, dan kategori yang sesuai memiliki skor keparahan.

ClassifyTextRequest

Pesan permintaan klasifikasi dokumen.

Kolom
document

Document

Wajib. Dokumen input.

ClassifyTextResponse

Pesan respons klasifikasi dokumen.

Kolom
categories[]

ClassificationCategory

Kategori yang mewakili dokumen input.

language_code

string

Bahasa teks, yang akan sama dengan bahasa yang ditentukan dalam permintaan atau, jika tidak ditentukan, bahasa yang terdeteksi secara otomatis. Lihat kolom [Document.language][] untuk mengetahui detail selengkapnya.

language_supported

bool

Apakah bahasa tersebut didukung secara resmi. API mungkin masih menampilkan respons jika bahasa tidak didukung, tetapi berdasarkan upaya terbaik.

Dokumen

Merepresentasikan input ke metode API.

Kolom
type

Type

Wajib. Jika jenis tidak ditetapkan atau TYPE_UNSPECIFIED, error INVALID_ARGUMENT akan ditampilkan.

language_code

string

Opsional. Bahasa dokumen (jika tidak ditentukan, bahasa akan otomatis terdeteksi). Kode bahasa ISO dan BCP-47 diterima.
Dukungan Bahasa mencantumkan bahasa yang saat ini didukung untuk setiap metode API. Jika bahasa (baik yang ditentukan oleh pemanggil maupun yang dideteksi secara otomatis) tidak didukung oleh metode API yang dipanggil, error INVALID_ARGUMENT akan ditampilkan.

Kolom union source. Sumber dokumen: string yang berisi konten atau URI Google Cloud Storage. source hanya ada berupa salah satu diantara berikut:
content

string

Konten input dalam format string. Cloud Audit Logs dikecualikan karena didasarkan pada data pengguna.

gcs_content_uri

string

URI Google Cloud Storage tempat konten file berada. URI ini harus dalam bentuk: gs://bucket_name/object_name. Untuk mengetahui detail selengkapnya, lihat https://cloud.google.com/storage/docs/reference-uris. CATATAN: Pembuatan versi objek Cloud Storage tidak didukung.

Jenis

Enum jenis dokumen.

Enum
TYPE_UNSPECIFIED Jenis konten tidak ditentukan.
PLAIN_TEXT Teks biasa
HTML HTML

EncodingType

Merepresentasikan encoding teks yang digunakan pemanggil untuk memproses output. Sebaiknya berikan EncodingType karena API menyediakan offset awal untuk berbagai output, seperti token dan sebutan, dan bahasa yang secara native menggunakan encoding teks yang berbeda dapat mengakses offset secara berbeda.

Enum
NONE Jika EncodingType tidak ditentukan, informasi yang bergantung pada encoding (seperti begin_offset) akan ditetapkan di -1.
UTF8 Informasi yang bergantung pada encoding (seperti begin_offset) dihitung berdasarkan encoding UTF-8 input. C++ dan Go adalah contoh bahasa yang menggunakan encoding ini secara native.
UTF16 Informasi yang bergantung pada encoding (seperti begin_offset) dihitung berdasarkan encoding UTF-16 input. Java dan JavaScript adalah contoh bahasa yang menggunakan encoding ini secara native.
UTF32 Informasi yang bergantung pada encoding (seperti begin_offset) dihitung berdasarkan encoding UTF-32 dari input. Python adalah contoh bahasa yang menggunakan encoding ini secara native.

Entity

Merepresentasikan frasa dalam teks yang merupakan entitas yang diketahui, seperti orang, organisasi, atau lokasi. API mengaitkan informasi, seperti probabilitas dan sebutan, dengan entitas.

Kolom
name

string

Nama perwakilan untuk entity.

type

Type

Jenis entity.

metadata

map<string, string>

Metadata yang terkait dengan entity.

Untuk metadata yang terkait dengan jenis entitas lainnya, lihat tabel Jenis di bawah.

mentions[]

EntityMention

Sebutan entitas ini dalam dokumen input. API tersebut saat ini mendukung sebutan nama diri.

sentiment

Sentiment

Untuk panggilan ke AnalyzeEntitySentimentRequest atau jika AnnotateTextRequest.Features.extract_entity_sentiment ditetapkan ke true, kolom ini akan berisi sentimen gabungan yang dinyatakan untuk entitas ini dalam dokumen yang diberikan.

Jenis

Jenis entitas. Tabel di bawah ini mencantumkan kolom terkait untuk entity yang memiliki metadata berbeda.

Enum
UNKNOWN Tidak diketahui
PERSON Orang
LOCATION Lokasi
ORGANIZATION Organisasi
EVENT Acara
WORK_OF_ART Karya seni
CONSUMER_GOOD Produk konsumen
OTHER Jenis entitas lainnya
PHONE_NUMBER

Nomor telepon

Metadata mencantumkan nomor telepon, yang diformat sesuai dengan konvensi lokal, ditambah elemen tambahan yang muncul dalam teks:

  • number - nomor sebenarnya, yang dibagi menjadi beberapa bagian sesuai dengan konvensi lokal
  • national_prefix - kode negara, jika terdeteksi
  • area_code - kode wilayah atau area, jika terdeteksi
  • extension - ekstensi telepon (untuk diputar setelah koneksi), jika terdeteksi
ADDRESS

Alamat

Metadata mengidentifikasi nomor jalan dan lokalitas serta elemen tambahan yang muncul dalam teks:

  • street_number - nomor jalan
  • locality - kota atau kota kecil
  • street_name - nama jalan/rute, jika terdeteksi
  • postal_code - kode pos, jika terdeteksi
  • country - negara, jika terdeteksi
  • broad_region - wilayah administratif, seperti negara bagian, jika terdeteksi
  • narrow_region - wilayah administratif yang lebih kecil, seperti county, jika terdeteksi
  • sublocality - digunakan di alamat Asia untuk menandai distrik dalam kota, jika terdeteksi
DATE

Tanggal

Metadata mengidentifikasi komponen tanggal:

  • year - tahun empat digit, jika terdeteksi
  • month - nomor bulan dua digit, jika terdeteksi
  • day - nomor hari dua digit, jika terdeteksi
NUMBER

Angka

Metadata adalah angka itu sendiri.

PRICE

Harga

Metadata mengidentifikasi value dan currency.

EntityMention

Mewakili sebutan untuk entitas dalam teks. Saat ini, sebutan nama diri didukung.

Kolom
text

TextSpan

Teks sebutan.

type

Type

Jenis sebutan entitas.

sentiment

Sentiment

Untuk panggilan ke AnalyzeEntitySentimentRequest atau jika AnnotateTextRequest.Features.extract_entity_sentiment ditetapkan ke true, kolom ini akan berisi sentimen yang diungkapkan untuk sebutan entitas ini dalam dokumen yang diberikan.

probability

float

Skor probabilitas yang terkait dengan entity.

Skor menunjukkan probabilitas sebutan entity sebagai jenis entity. Skor berada dalam rentang (0, 1].

Jenis

Jenis sebutan yang didukung.

Enum
TYPE_UNKNOWN Tidak diketahui
PROPER Kata benda khusus
COMMON Kata benda umum (atau kata benda majemuk)

ModerateTextRequest

Pesan permintaan moderasi dokumen.

Kolom
document

Document

Wajib. Masukkan dokumen.

model_version

ModelVersion

Opsional. Versi model yang akan digunakan untuk ModerateText.

ModelVersion

Versi model yang akan digunakan untuk ModerateText.

Enum
MODEL_VERSION_UNSPECIFIED Versi model default.
MODEL_VERSION_1 Gunakan model v1, model ini digunakan secara default jika tidak disediakan. Model v1 hanya menampilkan skor probabilitas (keyakinan) untuk setiap kategori.
MODEL_VERSION_2 Gunakan model v2. Model v2 hanya menampilkan skor probabilitas (keyakinan) untuk setiap kategori, dan menampilkan skor keparahan untuk sebagian kategori.

ModerateTextResponse

Pesan respons moderasi dokumen.

Kolom
moderation_categories[]

ClassificationCategory

Kategori berbahaya dan sensitif yang mewakili dokumen input.

language_code

string

Bahasa teks, yang akan sama dengan bahasa yang ditentukan dalam permintaan atau, jika tidak ditentukan, bahasa yang terdeteksi secara otomatis. Lihat kolom [Document.language][] untuk mengetahui detail selengkapnya.

language_supported

bool

Apakah bahasa tersebut didukung secara resmi. API mungkin masih menampilkan respons jika bahasa tidak didukung, tetapi berdasarkan upaya terbaik.

Kalimat

Merepresentasikan kalimat dalam dokumen input.

Kolom
text

TextSpan

Teks kalimat.

sentiment

Sentiment

Untuk panggilan ke AnalyzeSentimentRequest atau jika AnnotateTextRequest.Features.extract_document_sentiment ditetapkan ke benar, kolom ini akan berisi sentimen untuk kalimat.

Sentimen

Menampilkan perasaan yang terkait dengan seluruh teks atau entity dalam teks.

Kolom
magnitude

float

Angka non-negatif dalam rentang [0, +inf], yang mewakili magnitudo absolut sentimen terlepas dari skornya (positif atau negatif).

score

float

Skor sentimen antara -1,0 (sentimen negatif) dan 1,0 (sentimen positif).

TextSpan

Menampilkan rentang teks dalam dokumen input.

Kolom
content

string

Konten span teks, yang merupakan substring dokumen.

begin_offset

int32

API menghitung offset awal konten dalam dokumen asli sesuai dengan EncodingType yang ditentukan dalam permintaan API.