Questa pagina presenta i database vettoriali supportati su Vertex AI RAG Engine. Puoi anche scoprire come connettere un database vettoriale (archivio vettoriale) al tuo corpus RAG.
I database vettoriali svolgono un ruolo fondamentale nell'attivazione del recupero per le applicazioni RAG. I database vettoriali offrono un modo specializzato per archiviare ed eseguire query su vector embedding, che sono rappresentazioni matematiche di testo o altri dati che acquisiscono significato e relazioni semantiche. I vector embedding consentono ai sistemi RAG di trovare rapidamente e con precisione le informazioni più pertinenti all'interno di una vasta knowledge base, anche quando si tratta di query complesse o sfumate. Se combinati con un modello di incorporamento, i database vettoriali possono contribuire a superare i limiti degli LLM e fornire risposte più accurate, pertinenti e complete.
Database vettoriali supportati
Quando crei un corpus RAG, Vertex AI RAG Engine offre RagManagedDb
pronto per l'uso aziendale come database vettoriale predefinito, che non richiede provisioning o gestione aggiuntivi.
RagManagedDb
offre opzioni di ricerca KNN e ANN e
consente di passare a un livello di base per una prototipazione e una sperimentazione rapide.
Per scoprire di più sulla scelta di una strategia di recupero su RagManagedDb
o per
aggiornare il livello, consulta Utilizzare RagManagedDb
con
RAG. Per
consentire al motore RAG di Vertex AI di creare e gestire automaticamente il
database vettoriale, consulta Creare un corpus
RAG.
Oltre al RagManagedDb
predefinito, il motore RAG di Vertex AI
ti consente di eseguire il provisioning e utilizzare il tuo database vettoriale all'interno del corpus RAG. In questo
caso, sei responsabile del ciclo di vita e della scalabilità del tuo database
vector.
Confrontare le opzioni del database vettoriale
Questa tabella elenca le tue scelte di database vettoriali supportati in Vertex AI RAG Engine e fornisce link a pagine che spiegano come utilizzare i database vettoriali nel tuo corpus RAG.
Database vettoriale | Vantaggi | Ideale per | Svantaggi | Metriche di distanza supportate | Tipo di ricerca | Fase di avvio |
---|---|---|---|---|---|---|
RagManagedDb (impostazione predefinita) è un servizio di database scalabile distribuito a livello regionale che offre coerenza molto elevata e alta disponibilità e può essere utilizzato per una ricerca vettoriale.
easy simple fast quick |
|
|
|
cosine |
KNN (impostazione predefinita) e ANN | Anteprima |
Vector Search è il servizio di database vettoriale all'interno di Vertex AI ottimizzato per le attività di machine learning. |
|
|
|
cosine dot-product |
ANN | Generalmente disponibile |
Vertex AI Feature Store è un servizio gestito per organizzare, archiviare e distribuire le caratteristiche di machine learning. |
|
|
|
cosine dot-product L2 squared |
ANN | Anteprima |
Weaviate è un database vettoriale open source flessibile e modulare. |
|
|
|
cosine dot-product L2 squared hamming manhattan |
Supporto di ANN + ricerca ibrida | Anteprima |
Pinecone è un database vettoriale cloud-native completamente gestito progettato per una ricerca di similarità ad alte prestazioni. |
|
|
|
cosine euclidean dot-product |
ANN | Generalmente disponibile |
Passaggi successivi
- Per creare un corpus RAG, consulta l'esempio di creazione di un corpus RAG.
- Per elencare tutti i corpora RAG, consulta l'esempio di elenco dei corpora RAG.