Esta página se ha traducido con Cloud Translation API.

Facturación de Vertex AI RAG Engine

En esta página se describen los precios y la facturación de Vertex AI RAG Engine en función de los componentes que uses, como los modelos, la reclasificación y el almacenamiento de vectores.

Para obtener más información, consulta la página Descripción general del motor RAG de Vertex AI.

Precios y facturación

El motor de RAG de Vertex AI se puede usar de forma gratuita. Sin embargo, si configuras los componentes de Vertex AI RAG Engine, la facturación podría verse afectada.

En esta tabla se explica cómo funciona la facturación cuando usas los componentes de RAG.

Componente	Cómo funciona la facturación con el motor de RAG de Vertex AI
Ingestión de datos	El motor de RAG de Vertex AI admite la ingestión de datos de diferentes fuentes de datos. Por ejemplo, subir archivos locales, de Cloud Storage y de Google Drive. Acceder a los archivos de estas fuentes de datos desde Vertex AI RAG Engine es gratuito, pero es posible que estas fuentes de datos cobren por la transferencia de datos. Por ejemplo, los costes de salida de datos.
Transformación de datos (análisis de archivos)	Analizador predeterminado: gratuito. Analizador de LLMs: el motor RAG de Vertex AI usa el modelo de LLM que has especificado para analizar tu archivo. Verás los costes del modelo de LLM y los pagarás directamente desde tu proyecto. Analizador de diseño de Document AI: el motor RAG de Vertex AI usa el analizador de diseño de Document AI que hayas especificado para procesar tu archivo. Verás el uso del analizador de diseño de Document AI y pagarás por él directamente desde tu proyecto.
Transformación de datos (división de archivos en fragmentos)	Admite la fragmentación de tamaño fijo, que es gratuita.
Generación de inserciones	Vertex AI RAG Engine orquesta la generación de inserciones mediante el modelo de inserciones que hayas especificado, y se te facturan los costes asociados a ese modelo. Para obtener más información sobre los precios, consulta Coste de crear y desplegar modelos de IA en Vertex AI.
Indexación y recuperación de datos	RAG Engine admite dos categorías de bases de datos de vectores para la búsqueda de vectores: Base de datos gestionada por RAG Base de datos de vectores Bring-Your-Own Una base de datos gestionada por RAG tiene dos finalidades: Una base de datos gestionada por RAG almacena recursos de RAG, como corpus y archivos de RAG. El contenido de los archivos se excluye. Según tu elección, indexación de inserciones y recuperación para la búsqueda de vectores. Una base de datos gestionada por RAG usa una instancia de Spanner como backend. En cada uno de tus proyectos, Vertex AI RAG Engine aprovisiona un Google Cloud proyecto específico para el cliente y gestiona los recursos gestionados por RAG que se almacenan en Vertex AI RAG Engine, de forma que tus datos estén aislados físicamente. Si eliges el nivel `RagManagedDB` Basic o el nivel Scaled, Vertex AI RAG Engine aprovisiona una instancia de la edición Enterprise de Spanner en el proyecto correspondiente: Nivel básico: 100 unidades de procesamiento con copia de seguridad Nivel escalado: empieza con 1 nodo (1000 unidades de procesamiento) y se escala automáticamente hasta 10 nodos con copia de seguridad. Si algún corpus de RAG de tu proyecto decide usar una base de datos gestionada por RAG para la búsqueda de vectores, se te cobrará por la instancia de Spanner gestionada por RAG. Vertex AI RAG Engine muestra los costes de Spanner de tu proyecto gestionado por RAG correspondiente en tu Google Cloud proyecto, de forma que puedas ver y pagar los costes de la instancia de Spanner. Para obtener más información sobre los precios de Spanner, consulta la página de precios de Spanner.
Reclasificación para el motor de RAG de Vertex AI	Las siguientes herramientas de clasificación se admiten después de la recuperación: Volver a clasificar con LLM: el motor RAG de Vertex AI usa el modelo LLM que hayas especificado para volver a clasificar los resultados de la extracción. Verás los costes del modelo LLM y los pagarás directamente desde tu proyecto. API de clasificación de Vertex AI Search: Vertex AI RAG Engine usa la API de clasificación de Vertex AI Search para volver a clasificar los resultados de la extracción. Verás y pagarás la API de clasificación directamente desde tu proyecto.

Eliminar Vertex AI RAG Engine

En los siguientes ejemplos de código se muestra cómo eliminar un motor RAG de Vertex AI en la consola, Python y REST: Google Cloud

Parámetros de la API versión 1 (v1) y ejemplos de código.
Parámetros y ejemplos de código de la API v1beta1.

Siguientes pasos

Para saber cómo usar el SDK de Vertex AI para ejecutar tareas de Vertex AI RAG Engine, consulta la guía de inicio rápido de RAG para Python.
Para obtener información sobre el grounding, consulta la introducción al grounding.
Para obtener más información sobre las respuestas de RAG, consulta Resultados de extracción y generación del motor RAG de Vertex AI.
Para obtener información sobre la arquitectura RAG, sigue estos pasos:
- Infraestructura para una aplicación de IA generativa compatible con RAG que use Vertex AI y Vector Search
- Infraestructura para una aplicación de IA generativa compatible con RAG que use Vertex AI y AlloyDB para PostgreSQL.