Ressource : Chunk
Le bloc capture toutes les informations brutes sur les métadonnées des éléments à recommander ou à rechercher en mode bloc.
| Représentation JSON |
|---|
{ "name": string, "id": string, "content": string, "documentMetadata": { object ( |
| Champs | |
|---|---|
name |
Nom complet de la ressource du bloc. Format : Ce champ doit être une chaîne encodée au format UTF-8, dont la longueur ne doit pas dépasser 1 024 caractères. |
id |
ID unique du bloc actuel. |
content |
Le contenu est une chaîne provenant d'un document (contenu analysé). |
documentMetadata |
Métadonnées du document provenant du bloc actuel. |
derivedStructData |
Uniquement en sortie. Ce champ est OUTPUT_ONLY. Il contient des données dérivées qui ne figurent pas dans le document d'entrée d'origine. |
pageSpan |
Étendue de la page du bloc. |
chunkMetadata |
Uniquement en sortie. Métadonnées du bloc actuel. |
dataUrls[] |
Uniquement en sortie. URL des données d'image si le bloc actuel contient des images. Les URL de données se composent de quatre parties : un préfixe (data:), un type MIME indiquant le type de données, un jeton base64 facultatif si les données ne sont pas textuelles et les données elles-mêmes : data:[ |
annotationContents[] |
Uniquement en sortie. Contenu des annotations si le bloc actuel en contient. |
annotationMetadata[] |
Uniquement en sortie. Les métadonnées d'annotation incluent le contenu structuré du bloc actuel. |
relevanceScore |
Uniquement en sortie. Représente le score de pertinence basé sur la similarité. Plus le score est élevé, plus le bloc est pertinent. Le score est compris dans la plage [-1,0, 1,0]. Renseigné uniquement sur |
DocumentMetadata
Les métadonnées du document contiennent les informations du document du bloc actuel.
| Représentation JSON |
|---|
{ "uri": string, "title": string, "mimeType": string, "structData": { object } } |
| Champs | |
|---|---|
uri |
URI du document. |
title |
Titre du document. |
mimeType |
Type MIME du document. https://www.iana.org/assignments/media-types/media-types.xhtml. |
structData |
Représentation des données. Données JSON structurées pour le document. Il doit être conforme au |
PageSpan
Étendue de la page du bloc.
| Représentation JSON |
|---|
{ "pageStart": integer, "pageEnd": integer } |
| Champs | |
|---|---|
pageStart |
Page de début du bloc. |
pageEnd |
Page de fin du bloc. |
ChunkMetadata
Métadonnées du bloc actuel. Ce champ n'est renseigné que dans l'API SearchService.Search.
| Représentation JSON |
|---|
{ "previousChunks": [ { object ( |
| Champs | |
|---|---|
previousChunks[] |
Les blocs précédents du bloc actuel. Le nombre est contrôlé par |
nextChunks[] |
Les blocs suivants du bloc actuel. Le nombre est contrôlé par |
AnnotationMetadata
Les métadonnées d'annotation incluent le contenu structuré du bloc actuel.
| Représentation JSON |
|---|
{
"structuredContent": {
object ( |
| Champs | |
|---|---|
structuredContent |
Uniquement en sortie. Informations sur le contenu structuré. |
imageId |
Uniquement en sortie. L'ID de l'image est fourni si le contenu structuré est basé sur une image. |
StructuredContent
Informations sur le contenu structuré.
| Représentation JSON |
|---|
{
"structureType": enum ( |
| Champs | |
|---|---|
structureType |
Uniquement en sortie. Type de structure du contenu structuré. |
content |
Uniquement en sortie. Contenu du contenu structuré. |
StructureType
Définit les types de contenu structuré pouvant être extraits.
| Enums | |
|---|---|
STRUCTURE_TYPE_UNSPECIFIED |
Valeur par défaut. |
SHAREHOLDER_STRUCTURE |
Structure des actionnaires. |
SIGNATURE_STRUCTURE |
la structure de la signature. |
CHECKBOX_STRUCTURE |
Structure de la case à cocher. |
Méthodes |
|
|---|---|
|
Récupère un Document. |
|
Obtient une liste de Chunk. |