Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Nachdem ein Dokument aufgenommen wurde, führt die Vertex AI RAG Engine eine Reihe von Transformationen aus, um die Daten für die Indexierung vorzubereiten. Sie können Ihre Anwendungsfälle mit den folgenden Parametern steuern:
Parameter
Beschreibung
chunk_size
Wenn Dokumente in einen Index aufgenommen werden, werden sie in Blöcke unterteilt. Der Parameter chunk_size (in Tokens) gibt die Größe des Blocks an. Die standardmäßige Blockgröße beträgt 1.024 Tokens.
chunk_overlap
Standardmäßig werden Dokumente in Blöcke unterteilt, mit einem gewissen Grad an Überschneidungen, um die Relevanz und die Abrufqualität zu verbessern. Die standardmäßige Blocküberschneidung beträgt 256 Tokens.
Eine kleinere Blockgröße bedeutet, dass die Einbettungen genauer sind. Ein größerer Block bedeutet, dass die Einbettungen allgemeiner sein können, aber bestimmte Details nicht erfasst werden.
Wenn Sie beispielsweise 1.000 Wörter in ein Einbettungsarray umwandeln, das für 200 Wörter vorgesehen war, gehen möglicherweise Details verloren. Die Einbettungskapazität ist für jeden Chunk festgelegt. Ein großer Textblock passt möglicherweise nicht in ein Modell mit kleinen Fenstern.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-02 (UTC)."],[],[],null,["# Fine-tune RAG transformations\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nAfter a document is ingested, Vertex AI RAG Engine runs a set of transformations to\nprepare the data for indexing. You can control your use cases using the\nfollowing parameters:\n\nA smaller chunk size means the embeddings are more precise. A larger chunk size\nmeans that the embeddings might be more general but might miss specific details.\n\nFor example, if you convert 1,000 words into an embedding array that was meant\nfor 200 words, you might lose details. The embedding capacity is fixed for each\nchunk. A large chunk of text may not fit into a small-window model.\n\nWhat's next\n-----------\n\n- Use [Document AI layout parser with Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/layout-parser-integration)."]]