Nesta página, apresentamos os bancos de dados vetoriais compatíveis com o mecanismo de RAG da Vertex AI. Você também pode conferir como conectar um banco de dados vetorial (repositório de vetores) ao seu corpus de RAG.
Os bancos de dados de vetores são essenciais para permitir a recuperação em aplicativos de RAG. Os bancos de dados vetoriais oferecem uma maneira especializada de armazenar e consultar embeddings de vetores, que são representações matemáticas de texto ou outros dados que capturam significado e relações semânticas. Os embeddings de vetor permitem que os sistemas de RAG encontrem rapidamente e com precisão as informações mais relevantes em uma vasta base de conhecimento, mesmo ao lidar com consultas complexas ou sutis. Quando combinados com um modelo de incorporação, os bancos de dados vetoriais ajudam a superar as limitações dos LLMs e fornecem respostas mais precisas, relevantes e abrangentes.
Bancos de dados vetoriais compatíveis
Ao criar um corpus RAG, o mecanismo RAG da Vertex AI oferece o
RagManagedDb
pronto para empresas como o banco de dados vetorial padrão, que não exige
provisionamento ou gerenciamento adicional.
O RagManagedDb
oferece opções de pesquisa KNN e ANN e permite mudar para um nível básico para prototipagem e experimentação rápidas.
Para saber mais sobre como escolher uma estratégia de recuperação no RagManagedDb
ou atualizar o nível, consulte Usar o RagManagedDb
com RAG. Para que o mecanismo RAG da Vertex AI crie e gerencie automaticamente o banco de dados de vetores, consulte Criar um corpus RAG.
Além do RagManagedDb
padrão, o mecanismo de RAG da Vertex AI permite provisionar e usar seu banco de dados vetorial no corpus de RAG. Nesse caso, você é responsável pelo ciclo de vida e pela escalonabilidade do banco de dados de vetores.
Comparar opções de banco de dados de vetores
Esta tabela lista as opções de bancos de dados de vetores compatíveis com o mecanismo de RAG da Vertex AI e fornece links para páginas que explicam como usar os bancos de dados de vetores no corpus de RAG.
Banco de dados de vetores | Benefícios | Ideal para | Desvantagens | Métricas de distância aceitas | Tipo de pesquisa | Etapa do lançamento |
---|---|---|---|---|---|---|
O RagManagedDb (padrão) é um serviço de banco de dados escalonável distribuído regionalmente que oferece consistência e alta disponibilidade muito altas e pode ser usado para uma pesquisa vetorial.
fácil simples rápido rápido |
|
|
|
cosine |
KNN (padrão) e ANN | Visualizar |
A pesquisa vetorial é o serviço de banco de dados vetorial na Vertex AI otimizado para tarefas de machine learning. |
|
|
|
cosine dot-product |
ANN | Disponibilidade geral |
A Vertex AI Feature Store é um serviço gerenciado para organizar, armazenar e disponibilizar atributos de machine learning. |
|
|
|
cosine dot-product L2 squared |
ANN | Visualizar |
O Weaviate é um banco de dados vetorial de código aberto flexível e modular. |
|
|
|
cosine dot-product L2 squared hamming manhattan |
Suporte para pesquisa híbrida e ANN | Visualizar |
O Pinecone é um banco de dados de vetores nativo da nuvem totalmente gerenciado, projetado para uma pesquisa de similaridade de alto desempenho. |
|
|
|
cosine euclidean dot-product |
ANN | Disponibilidade geral |
A seguir
- Para criar um corpus RAG, consulte o exemplo de criação de um corpus RAG.
- Para listar todos os corpora RAG, consulte o exemplo de listagem de corpora RAG.