Questa pagina è stata tradotta dall'API Cloud Translation.

Informazioni su RagManagedDb

Questa pagina ti introduce a RagManagedDb, alla sua tecnologia di base e a come RagManagedDb viene utilizzato nel motore RAG di Vertex AI. Inoltre, questa pagina descrive i diversi livelli disponibili per ottimizzare le prestazioni, il che potrebbe influire sui costi, e fornisce istruzioni per eliminare i dati di Vertex AI RAG Engine, interrompendo la fatturazione.

Panoramica

Vertex AI RAG Engine utilizza RagManagedDb, un'istanza Google Spanner completamente gestita e pronta per l'uso aziendale, utilizzata per l'archiviazione delle risorse da Vertex AI RAG Engine e disponibile facoltativamente per essere utilizzata come database vettoriale di scelta per i tuoi corpus RAG.

Tramite Spanner, Vertex AI RAG Engine offre un database coerente, a disponibilità elevata e altamente scalabile per supportare la tua applicazione. Per scoprire di più su Google Spanner, consulta Spanner.

Il motore RAG di Vertex AI archivia i metadati del corpus RAG e della risorsa file RAG in RagManagedDb, indipendentemente dalla scelta del database vettoriale. I database vettoriali vengono utilizzati solo per l'archiviazione e il recupero degli embedding. Oltre all'archiviazione delle risorse, RagManagedDb può essere utilizzato anche per archiviare e gestire le rappresentazioni vettoriali dei documenti. Il database vettoriale viene quindi utilizzato per recuperare documenti pertinenti in base alla somiglianza semantica del documento con una determinata query.

Gestire i livelli

Vertex AI RAG Engine ti consente di scalare l'istanza RagManagedDb in base ai tuoi requisiti di utilizzo e prestazioni utilizzando una scelta di due livelli e, facoltativamente, ti consente di eliminare i dati di Vertex AI RAG Engine utilizzando un terzo livello.

Il livello è un'impostazione a livello di progetto disponibile nella risorsa RagEngineConfig che influisce sui corpus RAG utilizzando RagManagedDb. In RagEngineConfig sono disponibili i seguenti livelli:

Livello scalato: questo livello offre prestazioni su scala di produzione insieme alla funzionalità di scalabilità automatica. È adatto ai clienti con grandi quantità di dati o workload sensibili alle prestazioni. Internamente, questo livello imposta l'istanza Spanner sulla configurazione di scalabilità automatica con un minimo di 1 nodo (1000 unità di elaborazione) e un massimo di 10 nodi (10.000 unità di elaborazione).
Livello di base (predefinito): questo livello offre un livello di computing economico e basso, che potrebbe essere adatto ad alcuni dei seguenti casi:
- È in corso l'esperimento con RagManagedDb.
- Dati di piccole dimensioni.
- Workload non sensibili alla latenza.
- Utilizza Vertex AI RAG Engine solo con altri database vettoriali.
Per offrire il livello base, RagManagedDb imposta l'istanza Spanner sottostante su una configurazione fissa di 100 unità di elaborazione, che equivale a 0,1 nodi.
Livello di cui non è stato eseguito il provisioning: questo livello elimina RagManagedDb e la relativa istanza Spanner sottostante. Il livello Non sottoposto a provisioning disattiva il servizio Vertex AI RAG Engine ed elimina i dati archiviati in questo servizio indipendentemente dal database vettoriale utilizzato per il tuo RagCorpora. In questo modo, la fatturazione del servizio viene interrotta. Per ulteriori informazioni sulla fatturazione, consulta Fatturazione di Vertex AI RAG Engine.

Una volta eliminati, i dati non possono essere recuperati. Per ricominciare a utilizzare Vertex AI RAG Engine, devi aggiornare il livello chiamando l'API UpdateRagEngineConfig.

Ottieni la configurazione del progetto

I seguenti esempi di codice mostrano come utilizzare l'API GetRagEngineConfig per ogni tipo di livello:

Esempi di codice dell'API versione 1 (v1).
Esempi di codice dell'API v1beta1.

Aggiorna la configurazione del progetto

I seguenti esempi di codice mostrano come utilizzare l'API UpdateRagEngineConfig per ogni tipo di livello:

Versione 1 (v1) Esempi di codice API.
v1beta1 Esempi di codice API.

Passaggi successivi

Per scoprire come utilizzare l'API RAG v1, quella predefinita, consulta API RAG v1.
Per scoprire come utilizzare l'API RAG v1beta1, consulta API RAG v1beta1.
Per saperne di più su RagManagedDb e su come gestire la configurazione del livello e la strategia di recupero a livello di corpus RAG, consulta Utilizzare RagManagedDb con Vertex AI RAG Engine.