REST Resource: projects.locations.collections.dataStores.branches.documents.chunks

Recurso: Chunk

O modo de fragmentação captura todas as informações de metadados não processados de itens a serem recomendados ou pesquisados no modo de fragmentação.

Representação JSON
{
  "name": string,
  "id": string,
  "content": string,
  "documentMetadata": {
    object (DocumentMetadata)
  },
  "derivedStructData": {
    object
  },
  "pageSpan": {
    object (PageSpan)
  },
  "chunkMetadata": {
    object (ChunkMetadata)
  },
  "dataUrls": [
    string
  ],
  "annotationContents": [
    string
  ],
  "annotationMetadata": [
    {
      object (AnnotationMetadata)
    }
  ],
  "relevanceScore": number
}
Campos
name

string

O nome de recurso completo do fragmento. Formato: projects/{project}/locations/{location}/collections/{collection}/dataStores/{dataStore}/branches/{branch}/documents/{documentId}/chunks/{chunk_id}.

Este campo tem de ser uma string codificada em UTF-8 com um limite de comprimento de 1024 carateres.

id

string

ID exclusivo do fragmento atual.

content

string

O conteúdo é uma string de um documento (conteúdo analisado).

documentMetadata

object (DocumentMetadata)

Metadados do documento do fragmento atual.

derivedStructData

object (Struct format)

Apenas saída. Este campo é OUTPUT_ONLY. Contém dados derivados que não estão no documento de entrada original.

pageSpan

object (PageSpan)

Intervalo de páginas do fragmento.

chunkMetadata

object (ChunkMetadata)

Apenas saída. Metadados do fragmento atual.

dataUrls[]

string

Apenas saída. URLs de dados de imagens se o fragmento atual contiver imagens. Os URLs de dados são compostos por quatro partes: um prefixo (data:), um tipo MIME que indica o tipo de dados, um token base64 opcional se não for textual e os próprios dados: data:[][;base64],

annotationContents[]

string

Apenas saída. Conteúdos das anotações, se o fragmento atual contiver anotações.

annotationMetadata[]

object (AnnotationMetadata)

Apenas saída. Os metadados de anotação incluem conteúdo estruturado no fragmento atual.

relevanceScore

number

Apenas saída. Representa a pontuação de relevância com base na semelhança. Uma pontuação mais elevada indica uma maior relevância do fragmento. A pontuação está no intervalo [-1,0, 1,0]. Preenchido apenas no SearchResponse.

DocumentMetadata

Os metadados do documento contêm as informações do documento do fragmento atual.

Representação JSON
{
  "uri": string,
  "title": string,
  "mimeType": string,
  "structData": {
    object
  }
}
Campos
uri

string

URI do documento.

title

string

Título do documento.

mimeType

string

O tipo MIME do documento. https://www.iana.org/assignments/media-types/media-types.xhtml.

structData

object (Struct format)

Representação de dados. Os dados JSON estruturados para o documento. Deve estar em conformidade com o Schema registado ou é gerado um erro INVALID_ARGUMENT.

PageSpan

Intervalo de páginas do fragmento.

Representação JSON
{
  "pageStart": integer,
  "pageEnd": integer
}
Campos
pageStart

integer

A página inicial do fragmento.

pageEnd

integer

A página final do fragmento.

ChunkMetadata

Metadados do fragmento atual. Este campo só é preenchido na API SearchService.Search.

Representação JSON
{
  "previousChunks": [
    {
      object (Chunk)
    }
  ],
  "nextChunks": [
    {
      object (Chunk)
    }
  ]
}
Campos
previousChunks[]

object (Chunk)

Os fragmentos anteriores do fragmento atual. O número é controlado por SearchRequest.ContentSearchSpec.ChunkSpec.num_previous_chunks. Este campo só é preenchido na API SearchService.Search.

nextChunks[]

object (Chunk)

Os próximos fragmentos do fragmento atual. O número é controlado por SearchRequest.ContentSearchSpec.ChunkSpec.num_next_chunks. Este campo só é preenchido na API SearchService.Search.

AnnotationMetadata

Os metadados de anotação incluem conteúdo estruturado no fragmento atual.

Representação JSON
{
  "structuredContent": {
    object (StructuredContent)
  },
  "imageId": string
}
Campos
structuredContent

object (StructuredContent)

Apenas saída. As informações de conteúdo estruturado.

imageId

string

Apenas saída. O ID da imagem é fornecido se o conteúdo estruturado se basear numa imagem.

StructuredContent

As informações de conteúdo estruturado.

Representação JSON
{
  "structureType": enum (StructureType),
  "content": string
}
Campos
structureType

enum (StructureType)

Apenas saída. O tipo de estrutura do conteúdo estruturado.

content

string

Apenas saída. O conteúdo do conteúdo estruturado.

StructureType

Define os tipos de conteúdo estruturado que podem ser extraídos.

Enumerações
STRUCTURE_TYPE_UNSPECIFIED Valor predefinido.
SHAREHOLDER_STRUCTURE Estrutura acionista.
SIGNATURE_STRUCTURE estrutura da assinatura.
CHECKBOX_STRUCTURE Estrutura da caixa de verificação.

Métodos

get

Obtém um Document.

list

Obtém uma lista de Chunks.