Package google.cloud.language.v1

Index

LanguageService

Bietet Textanalysevorgänge wie Sentimentanalyse und Entitätserkennung.

AnalyzeEntities

rpc AnalyzeEntities(AnalyzeEntitiesRequest) returns (AnalyzeEntitiesResponse)

Sucht benannte Entitäten (derzeit Eigennamen und Gattungsnamen) im Text zusammen mit Entitätstypen, Auffälligkeiten, Erwähnungen für jede Entität und anderen Eigenschaften.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

AnalyzeEntitySentiment

rpc AnalyzeEntitySentiment(AnalyzeEntitySentimentRequest) returns (AnalyzeEntitySentimentResponse)

Hiermit werden Entitäten gefunden, die dem Begriff AnalyzeEntities im Text ähneln. Anschließend wird das Sentiment analysiert, das mit den einzelnen Entitäten und ihren Erwähnungen verknüpft ist.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

AnalyzeSentiment

rpc AnalyzeSentiment(AnalyzeSentimentRequest) returns (AnalyzeSentimentResponse)

Analysiert die Stimmung des jeweiligen Textes.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

AnalyzeSyntax

rpc AnalyzeSyntax(AnalyzeSyntaxRequest) returns (AnalyzeSyntaxResponse)

Analysiert die Syntax des Textes, liefert Satzgrenzen und ermöglicht die Vergabe eines Tokens zusammen mit Wortart-Tags, Abhängigkeitsstrukturen und anderen Eigenschaften.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

AnnotateText

rpc AnnotateText(AnnotateTextRequest) returns (AnnotateTextResponse)

Eine praktische Methode, die alle Funktionen in einem einzigen Aufruf zur Verfügung stellt: analyzeSentiment, analyzeEntities und analyzeSyntax.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

ClassifyText

rpc ClassifyText(ClassifyTextRequest) returns (ClassifyTextResponse)

Klassifiziert ein Dokument in Kategorien.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

ModerateText

rpc ModerateText(ModerateTextRequest) returns (ModerateTextResponse)

Ein Dokument wird auf schädliche und sensible Inhalte überprüft.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-language
  • https://www.googleapis.com/auth/cloud-platform

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

AnalyzeEntitiesRequest

Die Anfragenachricht für die Entitätsanalyse.

Felder
document

Document

Pflichtangabe. Das Eingabedokument.

encoding_type

EncodingType

Der von der API verwendete Codierungstyp zum Berechnen von Offsets.

AnalyzeEntitiesResponse

Die Antwortnachricht für die Entitätsanalyse.

Felder
entities[]

Entity

Die im Eingabedokument erkannten Entitäten.

language

string

Die Sprache des Textes, die entweder mit der in der Anfrage angegebenen Sprache identisch ist oder automatisch erkannt wird, falls in der Anfrage keine Sprache angegeben ist. Weitere Informationen finden Sie im Feld Document.language.

AnalyzeEntitySentimentRequest

Die Anfragenachricht für die Sentimentanalyse auf Entitätsebene.

Felder
document

Document

Pflichtangabe. Das Eingabedokument.

encoding_type

EncodingType

Der von der API verwendete Codierungstyp zum Berechnen von Offsets.

AnalyzeEntitySentimentResponse

Die Antwortnachricht für die Sentimentanalyse auf Entitätsebene.

Felder
entities[]

Entity

Die erkannten Entitäten im Eingabedokument mit der assoziierten Stimmung.

language

string

Die Sprache des Textes, die entweder mit der in der Anfrage angegebenen Sprache identisch ist oder automatisch erkannt wird, falls in der Anfrage keine Sprache angegeben ist. Weitere Informationen finden Sie im Feld Document.language.

AnalyzeSentimentRequest

Die Anfragenachricht für die Sentimentanalyse.

Felder
document

Document

Pflichtangabe. Das Eingabedokument.

encoding_type

EncodingType

Der Codierungstyp, der von der API zum Berechnen von Satz-Offsets verwendet wird.

AnalyzeSentimentResponse

Die Antwortnachricht für die Sentimentanalyse.

Felder
document_sentiment

Sentiment

Die allgemeine Stimmung des Eingabedokuments.

language

string

Die Sprache des Textes, die entweder mit der in der Anfrage angegebenen Sprache identisch ist oder automatisch erkannt wird, falls in der Anfrage keine Sprache angegeben ist. Weitere Informationen finden Sie im Feld Document.language.

sentences[]

Sentence

Die Stimmung für alle Sätze im Dokument.

AnalyzeSyntaxRequest

Die Anfragenachricht für die Syntaxanalyse.

Felder
document

Document

Pflichtangabe. Das Eingabedokument.

encoding_type

EncodingType

Der von der API verwendete Codierungstyp zum Berechnen von Offsets.

AnalyzeSyntaxResponse

Die Antwortnachricht für die Syntaxanalyse.

Felder
sentences[]

Sentence

Die Sätze im Eingabedokument.

tokens[]

Token

Die Tokens mit ihren syntaktischen Informationen im Eingabedokument.

language

string

Die Sprache des Textes, die entweder mit der in der Anfrage angegebenen Sprache identisch ist oder automatisch erkannt wird, falls in der Anfrage keine Sprache angegeben ist. Weitere Informationen finden Sie im Feld Document.language.

AnnotateTextRequest

Die Anfragenachricht für die Text Annotation API, die mehrere Arten von Analysen (Sentiment-, Entitäts- und Syntaxanalyse) in einem einzigen Aufruf durchführen kann.

Felder
document

Document

Pflichtangabe. Das Eingabedokument.

features

Features

Pflichtangabe. Die aktivierten Funktionen.

encoding_type

EncodingType

Der von der API verwendete Codierungstyp zum Berechnen von Offsets.

Features

Alle verfügbaren Funktionen für Sentimentanalyse, Syntaxanalyse und semantische Analyse. Wenn Sie die einzelnen Werte auf "true" setzen, wird die entsprechende Analyse für die Eingabe aktiviert.

Felder
extract_syntax

bool

Extrahiert Syntaxinformationen.

extract_entities

bool

Extrahiert Entitäten.

extract_document_sentiment

bool

Extrahiert die Stimmung auf Dokumentebene.

extract_entity_sentiment

bool

Extrahiert Entitäten und die assoziierte Stimmung.

classify_text

bool

Klassifiziert das gesamte Dokument in Kategorien.

moderate_text

bool

Moderieren Sie das Dokument auf schädliche und sensible Kategorien.

classification_model_options

ClassificationModelOptions

Optional. Die Modelloptionen, die für die Klassifizierung verwendet werden sollen. Wenn keine Angabe gemacht wird, werden die Optionen für Version 1 verwendet. Wird nur verwendet, wenn classify_text auf „wahr“ gesetzt ist.

AnnotateTextResponse

Die Antwortnachricht für Textanmerkungen.

Felder
sentences[]

Sentence

Die Sätze im Eingabedokument. Wird ausgefüllt, wenn der Nutzer AnnotateTextRequest.Features.extract_syntax aktiviert.

tokens[]

Token

Die Tokens mit ihren syntaktischen Informationen im Eingabedokument. Wird ausgefüllt, wenn der Nutzer AnnotateTextRequest.Features.extract_syntax aktiviert.

entities[]

Entity

Die Entitäten mit ihren semantischen Informationen im Eingabedokument. Wird ausgefüllt, wenn der Nutzer AnnotateTextRequest.Features.extract_entities aktiviert.

document_sentiment

Sentiment

Die allgemeine Stimmung für das Dokument. Wird ausgefüllt, wenn der Nutzer AnnotateTextRequest.Features.extract_document_sentiment aktiviert.

language

string

Die Sprache des Textes, die entweder mit der in der Anfrage angegebenen Sprache identisch ist oder automatisch erkannt wird, falls in der Anfrage keine Sprache angegeben ist. Weitere Informationen finden Sie im Feld Document.language.

categories[]

ClassificationCategory

Die im Eingabedokument identifizierten Kategorien.

moderation_categories[]

ClassificationCategory

Schädliche und sensible Kategorien, die im Eingabedokument gefunden wurden.

ClassificationCategory

Stellt eine Kategorie dar, die vom Textklassifikator zurückgegeben wird.

Felder
name

string

Der Name der Kategorie, die das Dokument darstellt.

confidence

float

Der Konfidenzwert des Klassifikators für die Kategorie. An dieser Zahl kann abgelesen werden, wie sicher der Klassifikator ist, dass diese Kategorie den vorliegenden Text darstellt.

ClassificationModelOptions

Modelloptionen für Klassifizierungsanfragen.

Felder
Union-Feld model_type. Wenn dieses Feld nicht festgelegt ist, wird standardmäßig v1_model verwendet. Für model_type ist nur einer der folgenden Werte zulässig:
v1_model

V1Model

Wenn Sie dieses Feld festlegen, werden das Modell der Version 1 und die Inhaltskategorien der Version 1 verwendet. Das V1-Modell ist ein älteres Modell, für das die Unterstützung in Zukunft eingestellt wird.

v2_model

V2Model

Wenn Sie dieses Feld festlegen, wird das V2-Modell mit der entsprechenden Version der Inhaltskategorien verwendet. Das V2-Modell hat eine bessere Leistung.

V1Model

Dieser Typ hat keine Felder.

Optionen für das V1-Modell.

V2Model

Optionen für das V2-Modell.

Felder
content_categories_version

ContentCategoriesVersion

Die Inhaltskategorien, die für die Klassifizierung verwendet werden.

ContentCategoriesVersion

Die Inhaltskategorien, die für die Klassifizierung verwendet werden.

Enums
CONTENT_CATEGORIES_VERSION_UNSPECIFIED Wenn ContentCategoriesVersion nicht angegeben ist, wird standardmäßig V1 verwendet.
V1 Inhalte aus den ursprünglichen Inhaltskategorien, die 2017 eingeführt wurden.
V2 Die Inhaltskategorien wurden 2022 aktualisiert.

ClassifyTextRequest

Die Anfragenachricht für die Dokumentklassifizierung.

Felder
document

Document

Pflichtangabe. Das Eingabedokument.

classification_model_options

ClassificationModelOptions

Optional. Modelloptionen für die Klassifizierung. Wenn keine Angabe gemacht wird, werden die Optionen für Version 1 verwendet.

ClassifyTextResponse

Die Antwortnachricht für die Dokumentklassifizierung.

Felder
categories[]

ClassificationCategory

Die Kategorien, die das Eingabedokument darstellen.

DependencyEdge

Gibt Informationen zu Abhängigkeitsstrukturen für ein Token an. Weitere Informationen zu Parse-Labels für Abhängigkeiten finden Sie unter http://www.aclweb.org/anthology/P13-2017.

Felder
head_token_index

int32

Stellt den Kopf dieses Tokens in der Abhängigkeitsstruktur dar. Dies ist der Index des Tokens, der auf dieses Token zeigt. Der Index ist die Position des Tokens im Array der Tokens, die von der API-Methode zurückgegeben werden. Wenn dieses Token ein Stammtoken ist, ist head_token_index sein eigener Index.

label

Label

Das Parse-Label für das Token.

Label

Die Parse-Label-Enum für das Token.

Enums
UNKNOWN Unbekannt
ABBREV Abkürzungsmodifikator
ACOMP Adjektivkomplement
ADVCL Modifikator in Form eines Adverbialsatzes
ADVMOD Adverbialer Modifikator
AMOD Adjektivischer Modifikator einer Nominalphrase
APPOS Appositioneller Modifikator einer Nominalphrase
ATTR Von einem Kopulaverb abhängiges Attribut
AUX Hilfsverb (kein Hauptverb)
AUXPASS Passives Hilfsverb
CC Koordinierende Konjunktion
CCOMP Satzkomplement eines Verbs oder Adjektivs
CONJ Konjunktion
CSUBJ Subjektsatz
CSUBJPASS Satzförmiges Subjekt eines Passivverbs
DEP Abhängigkeit (nicht bestimmbar)
DET Determinativ
DISCOURSE Diskurs
DOBJ Direktes Objekt
EXPL Expletiv
GOESWITH Begleitet (Teil eines Wortes in einem nicht gut bearbeiteten Text)
IOBJ Indirektes Objekt
MARK Marker (Wort, das einen Nebensatz einführt)
MWE Mehrwortausdruck
MWV Verbaler Mehrwortausdruck
NEG Negationsmodifikator
NN Modifikator in einem Nominalkompositum
NPADVMOD Nominalphrase, die als adverbialer Modifikator verwendet wird
NSUBJ Nominalphrase als Subjekt
NSUBJPASS Nominalphrase als Subjekt eines Passivsatzes
NUM Numerischer Modifikator eines Substantivs
NUMBER Element einer zusammengesetzten Zahl
P Satzzeichen
PARATAXIS Koordinative Beziehung
PARTMOD Partizipialer Modifikator
PCOMP Das Komplement einer Präposition ist ein Teilsatz
POBJ Objekt einer Präposition
POSS Possessiver Modifikator
POSTNEG Postverbale Negationspartikel
PRECOMP Prädikativkomplement
PRECONJ Beziehung zwischen dem Kopf einer Nominalphrase und dem Bestandteil eines konjunktionalen Konnektors im ersten Konjunkt einer initialen Koordination
PREDET Prädeterminativ
PREF Präfix
PREP Präpositionaler Modifikator
PRONL Die Beziehung zwischen einem Verb und einem verbalen Morphem
PRT Partikel
PS Assoziativ- oder Possessivmarker
QUANTMOD Quantifikatorphrasenmodifikator
RCMOD Modifikator in Form eines Relativsatzes
RCMODREL Komplementierer in Relativsatz
RDROP Ellipse ohne vorangestelltes Prädikat
REF Referent
REMNANT Rest
REPARANDUM Reparandum
ROOT Wortstamm
SNUM Suffix, das den Numerus kennzeichnet
SUFF Suffix
TMOD Temporaler Modifikator
TOPIC Themamarker
VMOD Teilsatz, dem eine finite Form des Verbs vorangestellt wird, das ein Substantiv modifiziert
VOCATIVE Vokativ
XCOMP Offenes prädikatives Komplement
SUFFIX Namenssuffix
TITLE Titel
ADVPHMOD Modifikator in Form einer Adverbialphrase
AUXCAUS Kausatives Hilfsverb
AUXVV Hilfsverb
DTMOD Rentaishi (pränominaler Modifikator)
FOREIGN Fremdwörter
KW Schlüsselwort
LIST Listenförmige Struktur bei Aneinanderreihungen vergleichbarer Einheiten
NOMC Nominalisierter Satz
NOMCSUBJ Nominalisierter Subjektsatz
NOMCSUBJPASS Nominalisiertes satzförmiges Subjekt eines Passivverbs
NUMC Zusammengesetzter numerischer Modifikator
COP Kopula
DISLOCATED Dislokation (bei Vorfeld-/topikalisierten Konstituenten)
ASP Aspektmarker
GMOD Genitivischer Modifikator
GOBJ Genitivobjekt
INFMOD Infinitivischer Modifikator
MES Maß
NCOMP Nominales Komplement eines Substantivs

Document

Stellt die Eingabe für API-Methoden dar.

Felder
type

Type

Pflichtangabe. Wenn der Typ nicht festgelegt wurde oder TYPE_UNSPECIFIED ist, wird der Fehler INVALID_ARGUMENT zurückgegeben.

language

string

Die Sprache des Dokuments (falls nicht angegeben, wird die Sprache automatisch erkannt). Sowohl ISO- als auch BCP-47-Sprachcodes sind zulässig.
Unter Sprachunterstützung sind die aktuell unterstützten Sprachen für jede API-Methode aufgeführt. Wenn die Sprache (entweder vom Aufrufer angegeben oder automatisch erkannt) von der aufgerufenen API-Methode nicht unterstützt wird, wird der Fehler INVALID_ARGUMENT zurückgegeben.

Union-Feld source. Die Quelle des Dokuments: ein String mit dem Inhalt oder ein Google Cloud Storage-URI. Für source ist nur einer der folgenden Werte zulässig:
content

string

Der Inhalt der Eingabe im Stringformat. Cloud-Audit-Logs sind ausgenommen, da sie auf Nutzerdaten basieren.

gcs_content_uri

string

Der Google Cloud Storage-URI, in dem sich der Dateiinhalt befindet. Dieser URI muss das Format gs://bucket_name/object_name haben. Weitere Informationen finden Sie unter https://cloud.google.com/storage/docs/reference-uris. HINWEIS: Cloud Storage-Objektversionierung wird nicht unterstützt.

Typ

Die Enum der Dokumententypen.

Enums
TYPE_UNSPECIFIED Der Inhaltstyp ist nicht angegeben.
PLAIN_TEXT Nur Text
HTML HTML

EncodingType

Stellt die Textcodierung dar, die der Aufrufer zum Verarbeiten der Ausgabe verwendet. Es wird empfohlen, ein EncodingType anzugeben, da die API die Anfangsoffsets für verschiedene Ausgaben wie Tokens und Erwähnungen bereitstellt. Sprachen, die standardmäßig unterschiedliche Textcodierungen verwenden, können auf Offsetwerte unterschiedlich zugreifen.

Enums
NONE Wenn EncodingType nicht angegeben ist, werden codierungsabhängige Informationen wie begin_offset auf -1 gesetzt.
UTF8 Codierungsabhängige Informationen wie begin_offset werden anhand der UTF-8-Codierung der Eingabe berechnet. C++ und Go sind Beispiele für Sprachen, die diese Codierung nativ verwenden.
UTF16 Codierungsabhängige Informationen (z. B. begin_offset) werden basierend auf der UTF-16-Codierung der Eingabe berechnet. Java und JavaScript sind Beispiele für Sprachen, die diese Codierung nativ verwenden.
UTF32 Codierungsabhängige Informationen (z. B. begin_offset) werden anhand der UTF-32-Codierung der Eingabe berechnet. Python ist ein Beispiel für eine Sprache, die diese Codierung nativ verwendet.

Entity

Stellt einen Ausdruck im Text dar, der eine bekannte Entität ist, z. B. eine Person, eine Organisation oder ein Standort. Die API verknüpft Informationen wie Auffälligkeiten und Erwähnungen mit Entitäten.

Felder
name

string

Der repräsentative Name für die Entität.

type

Type

Der Entitätstyp.

metadata

map<string, string>

Die mit der Entität verknüpften Metadaten.

Bei den meisten Entitätstypen sind die Metadaten eine Wikipedia-URL (wikipedia_url) und eine Knowledge Graph MID (mid), sofern verfügbar. Die Metadaten für andere Entitätstypen finden Sie in der Tabelle „Typ“ unten.

salience

float

Der Auffälligkeitswert, der mit der Entität im Bereich [0, 1,0] verknüpft ist.

Der Auffälligkeitswert zeigt den Stellenwert oder die Zentralität einer Entität im gesamten Dokumenttext an. Werte, die näher bei 0 liegen, haben eine niedrige Auffälligkeit. Werte, die näher bei 1,0 liegen, haben eine hohe Auffälligkeit.

mentions[]

EntityMention

Die Erwähnungen dieser Entität im Eingabedokument. Die API unterstützt derzeit Erwähnungen von Eigennamen.

sentiment

Sentiment

Bei Aufrufen von [AnalyzeEntitySentiment][] oder wenn AnnotateTextRequest.Features.extract_entity_sentiment auf „wahr“ gesetzt ist, enthält dieses Feld das aggregierte Sentiment, das im angegebenen Dokument für diese Entität ausgedrückt wird.

Typ

Der Typ der Entität. Für die meisten Entitätstypen sind die zugehörigen Metadaten eine Wikipedia-URL (wikipedia_url) und eine Knowledge Graph MID (mid). In der folgenden Tabelle sind die zugehörigen Felder für Entitäten mit anderen Metadaten aufgeführt.

Enums
UNKNOWN Unbekannt
PERSON Person
LOCATION Ort
ORGANIZATION Organisation
EVENT Ereignis
WORK_OF_ART Kunstwerk
CONSUMER_GOOD Verbraucherprodukt
OTHER Andere Entitätstypen
PHONE_NUMBER

Telefonnummer

Die Metadaten enthalten die Telefonnummer, die gemäß den örtlichen Konventionen formatiert ist, sowie alle zusätzlichen Elemente, die im Text erscheinen:

  • number: die tatsächliche Nummer, unterteilt in Abschnitte gemäß lokaler Konvention
  • national_prefix – Ländercode, falls erkannt
  • area_code – Region oder Vorwahl, falls erkannt
  • extension – Telefonweiterleitung (wird nach der Verbindung gewählt), falls erkannt
ADDRESS

Adresse

Die Metadaten enthalten die Hausnummer und den Ort sowie alle zusätzlichen Elemente, die im Text erscheinen:

  • street_number – Hausnummer
  • locality – Stadt
  • street_name – Name der Straße/Route, falls erkannt
  • postal_code – Postleitzahl, falls erkannt
  • country – Land, falls erkannt<
  • broad_region – Verwaltungsgebiet, z. B. der Bundesstaat, falls erkannt
  • narrow_region – kleineres Verwaltungsgebiet, z. B. ein Landkreis, falls erkannt
  • sublocality – wird in asiatischen Adressen verwendet, um einen Bezirk innerhalb einer Stadt anzugeben, sofern erkannt
DATE

Datum

In den Metadaten werden die Komponenten des Datums angegeben:

  • year – vierstellige Jahreszahl, falls erkannt
  • month – zweistellige Monatszahl, falls erkannt
  • day – zweistellige Tageszahl, falls erkannt
NUMBER

Zahl

Die Metadaten sind die Zahl selbst.

PRICE

Preis

Die Metadaten identifizieren die value und currency.

EntityMention

Stellt eine Erwähnung einer Entität im Text dar. Derzeit werden Erwähnungen von Eigennamen unterstützt.

Felder
text

TextSpan

Der Erwähnungstext.

type

Type

Der Typ der Entitätserwähnung.

sentiment

Sentiment

Bei Aufrufen von [AnalyzeEntitySentiment][] oder wenn AnnotateTextRequest.Features.extract_entity_sentiment auf „wahr“ gesetzt ist, enthält dieses Feld das Sentiment, das für diese Erwähnung des Rechtssubjekts im bereitgestellten Dokument ausgedrückt wird.

Typ

Die unterstützten Erwähnungstypen.

Enums
TYPE_UNKNOWN Unbekannt
PROPER Eigenname
COMMON Gattungsname (oder Kompositum)

ModerateTextRequest

Die Anfragenachricht für die Dokumentmoderation.

Felder
document

Document

Pflichtangabe. Das Eingabedokument.

ModerateTextResponse

Die Antwortnachricht für die Dokumentmoderation.

Felder
moderation_categories[]

ClassificationCategory

Schädliche und sensible Kategorien, die das Eingabedokument repräsentieren.

PartOfSpeech

Stellt Wortartinformationen für ein Token dar. Wortarten werden in http://www.lrec-conf.org/proceedings/lrec2012/pdf/274_Paper.pdf definiert.

Felder
tag

Tag

Das Wortart-Tag.

aspect

Aspect

Der grammatische Aspekt.

case

Case

Der grammatische Fall.

form

Form

Die grammatische Form.

gender

Gender

Das grammatische Geschlecht.

mood

Mood

Der grammatische Modus.

number

Number

Der grammatische Numerus.

person

Person

Die grammatische Person.

proper

Proper

Die grammatische Korrektheit.

reciprocity

Reciprocity

Die grammatische Reziprozität.

tense

Tense

Die grammatische Zeitform.

voice

Voice

Die grammatische Diathese.

Aspect

Die Eigenschaft eines Verbs, die den Zeitverlauf während eines Ereignisses ausdrückt.

Enums
ASPECT_UNKNOWN "Aspect" ist nicht auf die analysierte Sprache anwendbar oder wird nicht vorhergesagt.
PERFECTIVE Perfektiv
IMPERFECTIVE Imperfektiv
PROGRESSIVE Progressiv

Case

Die grammatische Funktion, die ein Substantiv oder Pronomen in einer Wortgruppe, einem Satzteil oder einem Satz erfüllt. Bei einigen Sprachen kongruieren andere Wortarten (z. B. Adjektiv und Determinativ) im Kasus mit dem Substantiv.

Enums
CASE_UNKNOWN "Case" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
ACCUSATIVE Akkusativ
ADVERBIAL Adverbial
COMPLEMENTIVE Komplementär
DATIVE Dativ
GENITIVE Genitiv
INSTRUMENTAL Instrumental
LOCATIVE Lokativ
NOMINATIVE Nominativ
OBLIQUE Abhängig
PARTITIVE Partitiv
PREPOSITIONAL Präpositional
REFLEXIVE_CASE Reflexiv
RELATIVE_CASE Ergativ
VOCATIVE Vokativ

Form

Je nach Sprache kann die Form in verschiedene Formen von Verben, Adjektiven, Adverbien usw. unterteilt werden. Beispielsweise werden flektierte Endungen von Verben und Adjektiven kategorisiert oder es wird zwischen Kurz- und Langformen von Adjektiven und Partizipien unterschieden.

Enums
FORM_UNKNOWN "Form" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
ADNOMIAL Adnominal
AUXILIARY Hilfsverb
COMPLEMENTIZER Komplementierer
FINAL_ENDING Endsuffix
GERUND Gerundium
REALIS Realis
IRREALIS Irrealis
SHORT Kurzform
LONG Langform
ORDER Befehlsform
SPECIFIC Sonderform

Gender

Genusklassen von Substantiven spiegeln sich im Verhalten assoziierter Wörter wider.

Enums
GENDER_UNKNOWN "Gender" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
FEMININE Feminin
MASCULINE Maskulin
NEUTER Neutrum

Mood

Das grammatische Merkmal von Verben, das die Modalität und damit die subjektive Stellungnahme des Sprechers zur Satzaussage zum Ausdruck bringt.

Enums
MOOD_UNKNOWN "Mode" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
CONDITIONAL_MOOD Konditional
IMPERATIVE Imperativ
INDICATIVE Indikativ
INTERROGATIVE Interrogativ
JUSSIVE Jussiv
SUBJUNCTIVE Konjunktiv

Number

Die numerischen Unterscheidungen.

Enums
NUMBER_UNKNOWN "Number" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
SINGULAR Singular
PLURAL Plural
DUAL Dual

Person

Die Unterscheidung zwischen dem Sprecher, der zweiten Person, der dritten Person usw.

Enums
PERSON_UNKNOWN "Person" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
FIRST Erste Person
SECOND Zweite Person
THIRD Dritte Person
REFLEXIVE_PERSON Reflexive Person

Proper

Diese Kategorie zeigt, ob das Token Teil eines Eigennamens ist.

Enums
PROPER_UNKNOWN "Proper" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
PROPER Eigenname
NOT_PROPER Kein Eigenname

Reciprocity

Bezeichnet die reziproken Eigenschaften eines Pronomens.

Enums
RECIPROCITY_UNKNOWN "Reciprocity" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
RECIPROCAL Reziprok
NON_RECIPROCAL Nicht reziprok

Tag

Die Enum der Wortart-Tags.

Enums
UNKNOWN Unbekannt
ADJ Adjektiv
ADP Adposition (Präposition und Postposition)
ADV Adverb
CONJ Konjunktion
DET Determinativ
NOUN Substantiv (Gattungs- und Eigennamen)
NUM Kardinalzahl
PRON Pronomen
PRT Partikel oder anderes Funktionswort
PUNCT Satzzeichen
VERB Verb (alle Zeiten und Modi)
X Sonstiges: Fremdwörter, Tippfehler, Abkürzungen
AFFIX Affix

Tense

Die Zeitreferenz.

Enums
TENSE_UNKNOWN "Tense" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
CONDITIONAL_TENSE Konditional
FUTURE Futur
PAST Präteritum
PRESENT Präsens
IMPERFECT Imperfekt
PLUPERFECT Plusquamperfekt

Voice

Die Beziehung zwischen der Handlung, die ein Verb ausdrückt, und den Partizipanten, die durch die zugehörigen Argumente bestimmt werden (Aktiv bzw. Passiv).

Enums
VOICE_UNKNOWN "Voice" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
ACTIVE Aktiv
CAUSATIVE Kausativ
PASSIVE Passiv

Sentence

Stellt einen Satz im Eingabedokument dar.

Felder
text

TextSpan

Der Satztext.

sentiment

Sentiment

Bei Aufrufen von [AnalyzeSentiment][] oder wenn AnnotateTextRequest.Features.extract_document_sentiment auf „wahr“ gesetzt ist, enthält dieses Feld das Sentiment für den Satz.

Sentiment

Stellt die Stimmung des gesamten Textes oder der Entitäten im Text dar.

Felder
magnitude

float

Eine nicht negative Zahl im Bereich [0, +inf], die die absolute Größe der Stimmung darstellt, unabhängig vom Wert (positiv oder negativ).

score

float

Stimmungswert zwischen -1,0 (negative Stimmung) und 1,0 (positive Stimmung).

TextSpan

Stellt einen Textabschnitt im Eingabedokument dar.

Felder
content

string

Der Inhalt des Textabschnitts, ein Teilstring des Dokuments.

begin_offset

int32

Die API berechnet den Anfangsoffset des Inhalts im Originaldokument gemäß dem in der API-Anfrage angegebenen EncodingType.

Token

Stellt den kleinsten syntaktischen Baustein des Textes dar.

Felder
text

TextSpan

Der Tokentext.

part_of_speech

PartOfSpeech

Das Wortart-Tag für dieses Token.

dependency_edge

DependencyEdge

Das Parsing der Abhängigkeitsstruktur für dieses Token.

lemma

string

Das Lemma des Tokens.