Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Une fois un document ingéré, le moteur RAG de Vertex AI exécute un ensemble de transformations pour préparer les données à l'indexation. Vous pouvez contrôler vos cas d'utilisation à l'aide des paramètres suivants:
Paramètre
Description
chunk_size
Lorsque des documents sont ingérés dans un index, ils sont divisés en segments. Le paramètre chunk_size (en jetons) spécifie la taille du segment. La taille des fragments par défaut est de 1 024 jetons.
chunk_overlap
Par défaut, les documents sont divisés en fragments qui se chevauchent légèrement pour améliorer la pertinence et la qualité de récupération. Le chevauchement de fragments par défaut est de 200 jetons.
Une taille de fragment plus petite signifie que les embeddings sont plus précis. Une taille de fragment plus importante signifie que les embeddings peuvent être plus généraux, mais peuvent passer à côté de détails spécifiques.
Par exemple, si vous convertissez 1 000 mots en un tableau de représentations vectorielles continues conçu pour 200 mots, vous risquez de perdre des détails. La capacité d'embedding est fixe pour chaque segment. Un grand volume de texte peut ne pas tenir dans un modèle de petite fenêtre.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/04/02 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/04/02 (UTC)."],[],[]]