Esta página se ha traducido con Cloud Translation API.

Información sobre RagManagedDb

En esta página se presenta RagManagedDb, su tecnología subyacente y cómo se usa RagManagedDb en el motor RAG de Vertex AI. Además, en esta página se describen los diferentes niveles disponibles para optimizar el rendimiento, lo que puede influir en los costes, y se proporcionan instrucciones para eliminar los datos de Vertex AI RAG Engine, lo que detiene la facturación.

Información general

Vertex AI RAG Engine usa RagManagedDb, que es una instancia de Google Spanner totalmente gestionada y lista para empresas que se usa para el almacenamiento de recursos en Vertex AI RAG Engine y que se puede usar de forma opcional como la base de datos de vectores que elijas para tus corpora de RAG.

A través de Spanner, Vertex AI RAG Engine ofrece una base de datos coherente, de alta disponibilidad y altamente escalable para admitir tu aplicación. Para obtener más información sobre Google Spanner, consulta Spanner.

Vertex AI RAG Engine almacena el corpus y los metadatos de los recursos de archivos de RAG en RagManagedDb, independientemente de la base de datos vectorial que elijas. Las bases de datos vectoriales solo se usan para almacenar y recuperar las inserciones. Además de almacenar recursos, RagManagedDb también se puede usar para almacenar y gestionar representaciones vectoriales de tus documentos. A continuación, se usa la base de datos vectorial para recuperar los documentos relevantes en función de la similitud semántica del documento con una consulta determinada.

Gestionar niveles

Vertex AI RAG Engine te permite escalar tu instancia de RagManagedDb en función de tus requisitos de uso y rendimiento mediante dos niveles. Además, te ofrece la opción de eliminar tus datos de Vertex AI RAG Engine con un tercer nivel.

El nivel es un ajuste a nivel de proyecto que está disponible en el recurso RagEngineConfig que afecta a los corpora de RAG que usan RagManagedDb. Los siguientes niveles están disponibles en RagEngineConfig:

Nivel escalado: este nivel ofrece un rendimiento a escala de producción junto con la función de escalado automático. Es adecuada para clientes con grandes cantidades de datos o cargas de trabajo sensibles al rendimiento. Internamente, este nivel define la instancia de Spanner en la configuración de autoescalado con un mínimo de 1 nodo (1000 unidades de procesamiento) y un máximo de 10 nodos (10.000 unidades de procesamiento).
Nivel básico (predeterminado): este nivel ofrece una opción rentable y de baja computación, que puede ser adecuada para algunos de los siguientes casos:
- Experimentando con RagManagedDb.
- Tamaño de datos pequeño.
- Carga de trabajo no sensible a la latencia.
- Usar Vertex AI RAG Engine solo con otras bases de datos vectoriales.
Para ofrecer el nivel básico, RagManagedDb define la instancia de Spanner subyacente con una configuración fija de 100 unidades de procesamiento, lo que equivale a 0,1 nodos.
Nivel sin aprovisionar: este nivel elimina el RagManagedDb y su instancia de Spanner subyacente. El nivel Sin aprovisionar inhabilita el servicio Vertex AI RAG Engine y elimina los datos que contiene, independientemente de la base de datos de vectores que se haya usado para tu RagCorpora. De esta forma, se detendrá la facturación del servicio. Para obtener más información sobre la facturación, consulta la facturación del motor de RAG de Vertex AI.

Una vez eliminados los datos, no se podrán recuperar. Para volver a usar Vertex AI RAG Engine, debes cambiar el nivel llamando a la API UpdateRagEngineConfig.

Obtener la configuración del proyecto

En los siguientes ejemplos de código se muestra cómo usar la API GetRagEngineConfig para cada tipo de nivel:

Ejemplos de código de la versión 1 (v1) de la API.
Códigos de ejemplo de la API v1beta1.

Actualizar la configuración del proyecto

En los siguientes ejemplos de código se muestra cómo usar la API UpdateRagEngineConfig para cada tipo de nivel:

Versión 1 (v1) Ejemplos de código de la API.
v1beta1 Ejemplos de código de la API.

Siguientes pasos

Para saber cómo usar la API RAG v1, que es la predeterminada, consulta API RAG v1.
Para saber cómo usar la API RAG v1beta1, consulta API RAG v1beta1.
Para obtener más información sobre RagManagedDb y cómo gestionar la configuración de tu nivel, así como la estrategia de extracción a nivel de corpus de RAG, consulta el artículo Usar RagManagedDb con Vertex AI RAG Engine.