Scelte del database vettoriale nell'engine RAG di Vertex AI

Questa pagina presenta i database vettoriali supportati su Vertex AI RAG Engine. Puoi anche scoprire come connettere un database vettoriale (archivio vettoriale) al tuo corpus RAG.

I database vettoriali svolgono un ruolo fondamentale nell'attivazione del recupero per le applicazioni RAG. I database vettoriali offrono un modo specializzato per archiviare ed eseguire query su vector embedding, che sono rappresentazioni matematiche di testo o altri dati che acquisiscono significato e relazioni semantiche. I vector embedding consentono ai sistemi RAG di trovare rapidamente e con precisione le informazioni più pertinenti all'interno di una vasta knowledge base, anche quando si tratta di query complesse o sfumate. Se combinati con un modello di incorporamento, i database vettoriali possono contribuire a superare i limiti degli LLM e fornire risposte più accurate, pertinenti e complete.

Database vettoriali supportati

Quando crei un corpus RAG, Vertex AI RAG Engine offre RagManagedDb pronto per l'uso aziendale come database vettoriale predefinito, che non richiede provisioning o gestione aggiuntivi. RagManagedDb offre opzioni di ricerca KNN e ANN e consente di passare a un livello di base per una prototipazione e una sperimentazione rapide. Per scoprire di più sulla scelta di una strategia di recupero su RagManagedDb o per aggiornare il livello, consulta Utilizzare RagManagedDb con RAG. Per consentire al motore RAG di Vertex AI di creare e gestire automaticamente il database vettoriale, consulta Creare un corpus RAG.

Oltre al RagManagedDb predefinito, il motore RAG di Vertex AI ti consente di eseguire il provisioning e utilizzare il tuo database vettoriale all'interno del corpus RAG. In questo caso, sei responsabile del ciclo di vita e della scalabilità del tuo database vector.

Confrontare le opzioni del database vettoriale

Questa tabella elenca le tue scelte di database vettoriali supportati in Vertex AI RAG Engine e fornisce link a pagine che spiegano come utilizzare i database vettoriali nel tuo corpus RAG.

Database vettoriale   Vantaggi   Ideale per   Svantaggi Metriche di distanza supportate Tipo di ricerca Fase di avvio
RagManagedDb (impostazione predefinita) è un servizio di database scalabile distribuito a livello regionale che offre coerenza molto elevata e alta disponibilità e può essere utilizzato per una ricerca vettoriale. easy simple fast quick
  • Non è richiesta alcuna configurazione.
  • Ideale per casi d'uso su piccola e grande scala.
  • Coerenza molto elevata.
  • Alta disponibilità.
  • Bassa latenza.
  • Ideale per carichi di lavoro transazionali.
  • CMEK abilitata.
  • Generazione di documenti di grandi dimensioni.
  • Creazione di RAG di livello enterprise.
  • Sviluppo di una proof of concept rapida.
  • Fornendo un overhead di provisioning e manutenzione ridotto.
  • Utilizzo con i chatbot.
  • Creazione di applicazioni RAG.
  • Per un richiamo ottimale, la funzionalità ANN richiede che l'indice venga ricreato dopo modifiche importanti ai dati.
cosine KNN (impostazione predefinita) e ANN Anteprima
Vector Search è il servizio di database vettoriale all'interno di Vertex AI ottimizzato per le attività di machine learning.
  • Si integra con altri Google Cloud servizi.
  • Scalabilità e affidabilità sono supportate dall'infrastruttura Google Cloud .
  • Utilizza il pagamento a consumo.
  • Generazione di documenti di grandi dimensioni.
  • Creazione di RAG di livello enterprise.
  • Gestione dell'infrastruttura di database vettoriale.
  • Clienti Google Cloud esistenti o chiunque voglia utilizzare più servizi Google Cloud .
  • Gli aggiornamenti non vengono applicati immediatamente.
  • Vincoli al fornitore con Google Cloud.
  • Potrebbe essere più costoso a seconda dei casi d'uso.
cosine

dot-product
ANN Generalmente disponibile
Vertex AI Feature Store è un servizio gestito per organizzare, archiviare e distribuire le caratteristiche di machine learning.
  • Si integra con Vertex AI e altri Google Cloud servizi.
  • Scalabilità e affidabilità sono supportate dall'infrastruttura Google Cloud .
  • Sfrutta l'infrastruttura BigQuery esistente.
  • Generazione di documenti di grandi dimensioni.
  • Creazione di RAG di livello enterprise.
  • Gestione dell'infrastruttura di database vettoriale.
  • Clienti Google Cloud esistenti o clienti che vogliono utilizzare più Google Cloud servizi.
  • Le modifiche sono disponibili nel negozio online solo dopo l'esecuzione di una sincronizzazione manuale.
  • Vincoli al fornitore con Google Cloud.
cosine

dot-product

L2 squared
ANN Anteprima
Weaviate è un database vettoriale open source flessibile e modulare.
  • Supporta vari tipi di dati e offre funzionalità di grafi integrate.
  • Fornisce open source e una community vivace.
  • Altamente flessibili e personalizzabili.
  • Supporta diversi tipi di dati e moduli per diverse modalità, come testo e immagini.
  • Può scegliere tra i provider cloud, come Google Cloud, AWS e Azure.
  • Generazione di documenti di grandi dimensioni.
  • Creazione di RAG di livello enterprise.
  • Gestione dell'infrastruttura di database vettoriale.
  • Clienti Weaviate esistenti.
  • Gli aggiornamenti non vengono applicati immediatamente.
  • Può essere più complesso da configurare e gestire.
  • Il rendimento può variare in base alla configurazione.
cosine

dot-product

L2 squared

hamming

manhattan
Supporto di ANN + ricerca ibrida Anteprima
Pinecone è un database vettoriale cloud-native completamente gestito progettato per una ricerca di similarità ad alte prestazioni.
  • Inizia rapidamente.
  • Scalabilità e prestazioni eccellenti.
  • Concentrati sulla ricerca vettoriale con funzionalità avanzate come il filtro e la ricerca di metadati.
  • Può scegliere tra i provider cloud, come Google Cloud, AWS e Azure.
  • Generazione di documenti di grandi dimensioni.
  • Creazione di RAG di livello enterprise.
  • Gestione dell'infrastruttura di database vettoriale.
  • Clienti Pinecone esistenti.
  • Gli aggiornamenti non vengono applicati immediatamente.
  • Può essere più costoso di altre opzioni.
  • Quote e limiti restringono la scalabilità e le prestazioni.
  • Controllo limitato sull'infrastruttura sottostante.
cosine

euclidean

dot-product
ANN Generalmente disponibile

Passaggi successivi