Aprimorar as transformações do RAG

Depois que um documento é ingerido, o mecanismo de RAG da Vertex AI executa um conjunto de transformações para preparar os dados para indexação. É possível controlar seus casos de uso com os seguintes parâmetros:

Parâmetro Descrição
chunk_size Quando os documentos são ingeridos em um índice, eles são divididos em partes. O parâmetro chunk_size (em tokens) especifica o tamanho do bloco. O tamanho do bloco padrão é de 1.024 tokens.
chunk_overlap Por padrão, os documentos são divididos em blocos com uma certa quantidade de sobreposição para melhorar a relevância e a qualidade de recuperação. A sobreposição de blocos padrão é de 256 tokens.

Um tamanho de bloco menor significa que os embeddings são mais precisos. Um tamanho de bloco maior significa que os embeddings podem ser mais gerais, mas podem perder detalhes específicos.

Por exemplo, se você converter 1.000 palavras em uma matriz de incorporação destinada a 200 palavras, poderá perder detalhes. A capacidade de embedding é fixa para cada bloco. Um grande bloco de texto pode não caber em um modelo de janela pequena.

A seguir