Recurso: Chunk
El fragmento captura toda la información de metadatos sin procesar de los elementos que se recomendarán o buscarán en el modo de fragmento.
| Representación JSON |
|---|
{ "name": string, "id": string, "content": string, "documentMetadata": { object ( |
| Campos | |
|---|---|
name |
Es el nombre completo del recurso del fragmento. Formato: Este campo debe ser una cadena codificada en UTF-8 con un límite de longitud de 1,024 caracteres. |
id |
Es el ID único del fragmento actual. |
content |
El contenido es una cadena de un documento (contenido analizado). |
documentMetadata |
Son los metadatos del documento del fragmento actual. |
derivedStructData |
Solo salida. Este campo es OUTPUT_ONLY. Contiene datos derivados que no se encuentran en el documento de entrada original. |
pageSpan |
Es el intervalo de páginas del fragmento. |
chunkMetadata |
Solo salida. Son los metadatos del fragmento actual. |
dataUrls[] |
Solo salida. Son las URLs de los datos de la imagen si el fragmento actual contiene imágenes. Las URLs de datos se componen de cuatro partes: un prefijo (data:), un tipo de MIME que indica el tipo de datos, un token base64 opcional si no es textual y los datos en sí: data:[ |
annotationContents[] |
Solo salida. Contenido de la anotación si el fragmento actual contiene anotaciones. |
annotationMetadata[] |
Solo salida. Los metadatos de la anotación incluyen contenido estructurado en el fragmento actual. |
relevanceScore |
Solo salida. Representa la puntuación de relevancia basada en la similitud. Una puntuación más alta indica una mayor relevancia del fragmento. La puntuación está en el rango [-1.0, 1.0]. Solo se propaga en |
DocumentMetadata
Los metadatos del documento contienen la información del documento del fragmento actual.
| Representación JSON |
|---|
{ "uri": string, "title": string, "mimeType": string, "structData": { object } } |
| Campos | |
|---|---|
uri |
Es el URI del documento. |
title |
Es el título del documento. |
mimeType |
Es el tipo MIME del documento. https://www.iana.org/assignments/media-types/media-types.xhtml. |
structData |
Representación de datos Son los datos estructurados en formato JSON del documento. Debe cumplir con el |
PageSpan
Es el intervalo de páginas del fragmento.
| Representación JSON |
|---|
{ "pageStart": integer, "pageEnd": integer } |
| Campos | |
|---|---|
pageStart |
Es la página de inicio del fragmento. |
pageEnd |
Es la página final del fragmento. |
ChunkMetadata
Son los metadatos del fragmento actual. Este campo solo se completa en la API de SearchService.Search.
| Representación JSON |
|---|
{ "previousChunks": [ { object ( |
| Campos | |
|---|---|
previousChunks[] |
Son los fragmentos anteriores del fragmento actual. |
nextChunks[] |
Son los próximos fragmentos del fragmento actual. |
AnnotationMetadata
Los metadatos de la anotación incluyen contenido estructurado en el fragmento actual.
| Representación JSON |
|---|
{
"structuredContent": {
object ( |
| Campos | |
|---|---|
structuredContent |
Solo salida. Es la información del contenido estructurado. |
imageId |
Solo salida. Se proporciona el ID de la imagen si el contenido estructurado se basa en una imagen. |
StructuredContent
Es la información del contenido estructurado.
| Representación JSON |
|---|
{
"structureType": enum ( |
| Campos | |
|---|---|
structureType |
Solo salida. Es el tipo de estructura del contenido estructurado. |
content |
Solo salida. Es el contenido del contenido estructurado. |
StructureType
Define los tipos de contenido estructurado que se pueden extraer.
| Enums | |
|---|---|
STRUCTURE_TYPE_UNSPECIFIED |
Valor predeterminado. |
SHAREHOLDER_STRUCTURE |
Estructura de accionistas |
SIGNATURE_STRUCTURE |
estructura de firma. |
CHECKBOX_STRUCTURE |
Estructura de la casilla de verificación. |
Métodos |
|
|---|---|
|
Obtienes una Document. |
|
Obtiene una lista de Chunks. |