Informazioni su RagManagedDb

Questa pagina ti introduce a RagManagedDb, alla sua tecnologia di base e a come RagManagedDb viene utilizzato nel motore RAG di Vertex AI. Inoltre, questa pagina descrive i diversi livelli disponibili per ottimizzare le prestazioni, il che potrebbe influire sui costi, e fornisce istruzioni per eliminare i dati di Vertex AI RAG Engine, che interrompe la fatturazione.

Panoramica

Vertex AI RAG Engine utilizza RagManagedDb, un'istanza Google Spanner completamente gestita e pronta per l'uso aziendale, che viene utilizzata per l'archiviazione delle risorse da Vertex AI RAG Engine ed è disponibile facoltativamente per essere utilizzata come database vettoriale di scelta per i tuoi corpus RAG.

Tramite Spanner, Vertex AI RAG Engine offre un database coerente, a disponibilità elevata e altamente scalabile per supportare la tua applicazione. Per saperne di più su Google Spanner, consulta Spanner.

Il motore RAG di Vertex AI archivia i metadati del corpus RAG e della risorsa file RAG in RagManagedDb, indipendentemente dalla scelta del database vettoriale. I database vettoriali vengono utilizzati solo per l'archiviazione e il recupero degli embedding. Oltre all'archiviazione delle risorse, RagManagedDb può essere utilizzato anche per archiviare e gestire le rappresentazioni vettoriali dei tuoi documenti. Il database vettoriale viene quindi utilizzato per recuperare documenti pertinenti in base alla somiglianza semantica del documento con una determinata query.

Gestire i livelli

Vertex AI RAG Engine ti consente di scalare l'istanza RagManagedDb in base ai requisiti di utilizzo e prestazioni utilizzando una scelta di due livelli e, facoltativamente, ti consente di eliminare i dati di Vertex AI RAG Engine utilizzando un terzo livello.

Il livello è un'impostazione a livello di progetto disponibile nella risorsa RagEngineConfig che influisce sui corpus RAG utilizzando RagManagedDb. I seguenti livelli sono disponibili in RagEngineConfig:

  • Livello scalabile: questo livello offre prestazioni su scala di produzione insieme alla funzionalità di scalabilità automatica. È adatto ai clienti con grandi quantità di dati o carichi di lavoro sensibili al rendimento. Internamente, questo livello imposta l'istanza Spanner sulla configurazione di scalabilità automatica con un minimo di 1 nodo (1000 unità di elaborazione) e un massimo di 10 nodi (10.000 unità di elaborazione).

  • Livello di base (predefinito): questo livello offre un livello conveniente e a basso costo di calcolo, che potrebbe essere adatto ad alcuni dei seguenti casi:

    • È in corso l'esperimento con RagManagedDb.
    • Dimensioni ridotte dei dati.
    • Carico di lavoro insensibile alla latenza.
    • Utilizza il motore RAG di Vertex AI solo con altri database vettoriali.

    Per offrire il livello base, RagManagedDb imposta l'istanza Spanner sottostante su una configurazione fissa di 100 unità di elaborazione, che equivale a 0,1 nodi.

  • Livello di cui non è stato eseguito il provisioning: questo livello elimina RagManagedDb e la relativa istanza Spanner sottostante. Il livello Non provisionato disattiva il servizio Vertex AI RAG Engine ed elimina i dati contenuti in questo servizio indipendentemente dal database vettoriale utilizzato per RagCorpora. In questo modo, la fatturazione del servizio viene interrotta. Per ulteriori informazioni sulla fatturazione, consulta Fatturazione di Vertex AI RAG Engine.

    Una volta eliminati, i dati non possono essere recuperati. Per ricominciare a utilizzare Vertex AI RAG Engine, devi aggiornare il livello chiamando l'API UpdateRagEngineConfig.

Ottieni la configurazione del progetto

I seguenti esempi di codice mostrano come utilizzare l'API GetRagEngineConfig per ogni tipo di livello:

Aggiorna la configurazione del progetto

I seguenti esempi di codice mostrano come utilizzare l'API UpdateRagEngineConfig per ogni tipo di livello:

Passaggi successivi