REST Resource: documents

Recurso: Document

Representa a entrada para métodos da API.

Representação JSON
{
  "type": enum (Type),
  "language": string,
  "referenceWebUri": string,
  "boilerplateHandling": enum (BoilerplateHandling),

  // Union field source can be only one of the following:
  "content": string,
  "gcsContentUri": string
  // End of list of possible types for union field source.
}
Campos
type

enum (Type)

Obrigatório. Se o tipo não estiver definido ou for TYPE_UNSPECIFIED, retorna um erro INVALID_ARGUMENT.

language

string

O idioma do documento (se não especificado, o idioma é automaticamente detectado). Os códigos de idioma ISO e BCP-47 são aceitos.Veja em
Suporte de idioma a lista de idiomas atualmente compatíveis para cada método de API. Se o idioma (especificado pelo autor da chamada ou detectado automaticamente) não for compatível com o método API chamado, um erro INVALID_ARGUMENT será retornado.

referenceWebUri

string

O URI da Web de onde o documento vem. Esse URI não é usado para buscar o conteúdo, mas como uma dica para analisar o documento.

boilerplateHandling

enum (BoilerplateHandling)

Indica como o modelo detectado(por exemplo, anúncios, declarações de direitos autorais, banners) deve ser tratado para este documento. Se não for especificado, o modelo será tratado da mesma forma que o conteúdo.

Campo de união source. A origem do documento: uma string com o conteúdo ou um URI do Google Cloud Storage. source pode ser apenas de um dos tipos a seguir:
content

string

O conteúdo da entrada em formato de string. Os registros de auditoria do Cloud estão isentos, porque são baseados nos dados do usuário.

gcsContentUri

string

O URI do Google Cloud Storage, onde o conteúdo do arquivo está localizado. Esse URI precisa ter o formato: gs://bucketName/object_name. Para saber mais, consulte https://cloud.google.com/storage/docs/reference-uris. OBSERVAÇÃO: o controle de versão de objeto do Cloud Storage não é aceito.

Tipo

O enum de tipos de documento.

Enums
TYPE_UNSPECIFIED O tipo de conteúdo não é especificado.
PLAIN_TEXT Texto simples
HTML HTML

BoilerplateHandling

Maneiras de lidar com o modelo detectado no documento

Enums
BOILERPLATE_HANDLING_UNSPECIFIED O processamento de modelo não foi especificado.
SKIP_BOILERPLATE Não analisar o boilerplate detectado. O URI da Web de referência é necessário para detectar o modelo.
KEEP_BOILERPLATE Trate o modelo da mesma forma que o conteúdo.

Métodos

analyzeEntities

Encontra entidades nomeadas (atualmente, nomes próprios e substantivos comuns) no texto com tipos de entidade, saliência, referências a cada entidade e outras propriedades.

analyzeEntitySentiment

Encontra entidades de maneira semelhante a AnalyzeEntities no texto e analisa o sentimento associado a cada entidade e referências a ela.

analyzeSentiment

Analisa o sentimento do texto fornecido.

analyzeSyntax

Analisa a sintaxe do texto e fornece limites de frase e tokenização com tags de classe gramatical, árvores de dependência e outras propriedades.

annotateText

Um método de conveniência que fornece todos os recursos de sintaxe, sentimento, entidade e classificação em uma chamada.

classifyText

Classifica um documento em categorias.

moderateText

Modera um documento em categorias nocivas e sensíveis.