Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Une fois un document ingéré, le moteur RAG Vertex AI exécute un ensemble de transformations pour préparer les données à l'indexation. Vous pouvez contrôler vos cas d'utilisation à l'aide des paramètres suivants :
Paramètre
Description
chunk_size
Lorsque des documents sont ingérés dans un index, ils sont divisés en blocs. Le paramètre chunk_size (en jetons) spécifie la taille du bloc. La taille des fragments par défaut est de 1 024 jetons.
chunk_overlap
Par défaut, les documents sont divisés en fragments qui se chevauchent légèrement pour améliorer la pertinence et la qualité de récupération. Le chevauchement de fragments par défaut est de 256 jetons.
Une taille de fragment plus petite signifie que les embeddings sont plus précis. Une taille de fragment plus importante signifie que les embeddings peuvent être plus généraux, mais peuvent passer à côté de détails spécifiques.
Par exemple, si vous convertissez 1 000 mots en un tableau de représentations vectorielles continues qui était destiné à 200 mots, vous risquez de perdre des détails. La capacité d'embedding est fixe pour chaque bloc. Il est possible qu'un grand bloc de texte ne tienne pas dans un modèle à petite fenêtre.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/07/09 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/07/09 (UTC)."],[],[]]