Información sobre RagManagedDb

En esta página, se presenta RagManagedDb, su tecnología subyacente y cómo se usa RagManagedDb en el motor de RAG de Vertex AI. Además, en esta página, se describen los diferentes niveles disponibles para ajustar el rendimiento, lo que podría afectar tus costos, y se proporcionan instrucciones para borrar los datos de tu motor de RAG de Vertex AI, lo que detiene la facturación.

Descripción general

El motor de RAG de Vertex AI usa RagManagedDb, que es una instancia de Google Spanner completamente administrada y lista para la empresa que el motor de RAG de Vertex AI usa para el almacenamiento de recursos y que, de manera opcional, está disponible para usarse como la base de datos de vectores de tu elección para tus corpus de RAG.

A través de Spanner, el motor de RAG de Vertex AI ofrece una base de datos coherente, altamente disponible y altamente escalable para admitir tu aplicación. Para obtener más información sobre Google Spanner, consulta Spanner.

El motor de RAG de Vertex AI almacena los metadatos de tu corpus de RAG y del recurso de archivo de RAG en RagManagedDb, independientemente de la base de datos de vectores que elijas. Las bases de datos de vectores solo se usan para almacenar y recuperar embeddings. Además del almacenamiento de recursos, RagManagedDb también se puede usar para almacenar y administrar representaciones vectoriales de tus documentos. Luego, se usa la base de datos de vectores para recuperar documentos relevantes en función de la similitud semántica del documento con una búsqueda determinada.

Administra niveles

El motor de RAG de Vertex AI te permite escalar tu instancia de RagManagedDb según tus requisitos de uso y rendimiento con dos niveles para elegir y, de manera opcional, te permite borrar tus datos del motor de RAG de Vertex AI con un tercer nivel.

El nivel es un parámetro de configuración a nivel del proyecto que está disponible en el recurso RagEngineConfig y que afecta los corpus de la RAG con RagManagedDb. Los siguientes niveles están disponibles en RagEngineConfig:

  • Nivel escalado: Este nivel ofrece rendimiento a escala de producción junto con la función de ajuste de escala automático. Es adecuado para los clientes con grandes cantidades de datos o cargas de trabajo sensibles al rendimiento. Internamente, este nivel establece la instancia de Spanner en la configuración de ajuste de escala automático con un mínimo de 1 nodo (1,000 unidades de procesamiento) y un máximo de 10 nodos (10,000 unidades de procesamiento).

  • Nivel básico (predeterminado): Este nivel ofrece una opción rentable y de baja capacidad de procesamiento, que puede ser adecuada para algunos de los siguientes casos:

    • Experimentando con RagManagedDb.
    • El tamaño de los datos es pequeño.
    • Carga de trabajo no sensible a la latencia.
    • Usar Vertex AI RAG Engine solo con otras bases de datos de vectores

    Para ofrecer el nivel Básico, RagManagedDb establece la instancia subyacente de Spanner en una configuración fija de 100 unidades de procesamiento, lo que equivale a 0.1 nodos.

  • Nivel sin aprovisionar: Este nivel borra el RagManagedDb y su instancia subyacente de Spanner. El nivel Sin aprovisionar inhabilita el servicio del motor de RAG de Vertex AI y borra los datos que se encuentran en este servicio, independientemente de la base de datos de vectores que se use para tu RagCorpora. De esta manera, se detiene la facturación del servicio. Para obtener más información sobre la facturación, consulta Facturación del motor de RAG de Vertex AI.

    Una vez que se borran los datos, no se pueden recuperar. Para volver a usar Vertex AI RAG Engine, debes actualizar el nivel llamando a la API de UpdateRagEngineConfig.

Obtén la configuración del proyecto

En los siguientes ejemplos de código, se muestra cómo usar la API de GetRagEngineConfig para cada tipo de nivel:

Actualiza la configuración del proyecto

En los siguientes ejemplos de código, se muestra cómo usar la API de UpdateRagEngineConfig para cada tipo de nivel:

¿Qué sigue?

  • Para obtener información sobre cómo usar la API de RAG v1, que es la predeterminada, consulta API de RAG v1.
  • Para obtener información sobre cómo usar la API de RAG v1beta1, consulta API de RAG v1beta1.
  • Para obtener más información sobre RagManagedDb y cómo administrar la configuración de tu nivel, así como la estrategia de recuperación a nivel del corpus de RAG, consulta Cómo usar RagManagedDb con el motor de RAG de Vertex AI.