Ressource : Document
Représente l'entrée fournie aux méthodes API.
Représentation JSON |
---|
{ "type": enum ( |
Champs | |
---|---|
type |
Obligatoire. Si le type n'est pas défini ou est défini sur |
language |
Langue du document (si aucune valeur n'est spécifiée, la langue est détectée automatiquement). Les codes de langue ISO et BCP-47 sont acceptés. |
reference |
URI Web d'où provient le document. Cet URI n'est pas utilisé pour extraire le contenu, mais comme indice pour analyser le document. |
boilerplate |
Indique comment les éléments standards détectés(par exemple, les annonces, les déclarations de droits d'auteur, les bannières) doivent être traités pour ce document. Si rien n'est spécifié, le texte standard sera traité de la même manière que le contenu. |
Champ d'union source . Source du document : chaîne contenant le contenu ou URI URI Google Cloud Storage. source ne peut être qu'un des éléments suivants : |
|
content |
Contenu de l'entrée au format de chaîne. Exclu de Cloud Audit Logging, car il est basé sur des données utilisateur. |
gcs |
URI Google Cloud Storage où se trouve le contenu du fichier. Cet URI doit être au format gs://nom_bucket/nom_objet. Pour en savoir plus, consultez la page https://cloud.google.com/storage/docs/reference-uris. REMARQUE : La gestion des versions d'objets Cloud Storage n'est pas compatible. |
Type
Énumération des types de documents.
Enums | |
---|---|
TYPE_UNSPECIFIED |
Le type de contenu n'est pas spécifié. |
PLAIN_TEXT |
Texte brut |
HTML |
HTML |
BoilerplateHandling
Méthodes de gestion des éléments standards détectés dans le document
Enums | |
---|---|
BOILERPLATE_HANDLING_UNSPECIFIED |
La gestion des modèles n'est pas spécifiée. |
SKIP_BOILERPLATE |
Ne pas analyser le texte standard détecté. L'URI Web de référence est requis pour détecter les modèles. |
KEEP_BOILERPLATE |
Traitez le contenu standard de la même manière que le contenu. |
Méthodes |
|
---|---|
|
Recherche les entités nommées (à l'heure actuelle, noms propres et noms communs) dans le texte, ainsi que les types d'entités, la saillance, les mentions pour chaque entité et d'autres propriétés. |
|
Recherche les entités dans le texte, de manière similaire à AnalyzeEntities , et analyse le sentiment associé à chaque entité et à ses mentions. |
|
Analyse le sentiment du texte fourni. |
|
Analyse la syntaxe du texte et fournit les frontières et la tokenization des phrases, ainsi que les tags de classe de mots, les arbres de dépendances et autres propriétés. |
|
Méthode pratique fournissant toutes les caractéristiques de syntaxe, de sentiment, d'entité et de classification dans un même appel. |
|
Classe un document en catégories. |
|
Modère un document pour les catégories nuisibles et sensibles. |