Se usó la API de Cloud Translation para traducir esta página.

Opciones de base de datos de vectores en el motor de RAG de Vertex AI

En esta página, se presentan las bases de datos de vectores compatibles con Vertex AI RAG Engine. También puedes ver cómo conectar una base de datos de vectores (almacén de vectores) a tu corpus de RAG.

Las bases de datos vectoriales desempeñan un papel fundamental para habilitar la recuperación en las aplicaciones de RAG. Las bases de datos de vectores ofrecen una forma especializada de almacenar y consultar embeddings de vectores, que son representaciones matemáticas de texto o de otros datos que capturan el significado y las relaciones semánticas. Los embeddings de vectores permiten que los sistemas de RAG encuentren de forma rápida y precisa la información más pertinente dentro de una vasta base de conocimiento, incluso cuando se trata de consultas complejas o matizadas. Cuando se combinan con un modelo de embedding, las bases de datos vectoriales pueden ayudar a superar las limitaciones de los LLM y proporcionar respuestas más precisas, pertinentes y completas.

Bases de datos vectoriales compatibles

Cuando creas un corpus de RAG, Vertex AI RAG Engine ofrece RagManagedDb listo para la empresa como la base de datos de vectores predeterminada, que no requiere aprovisionamiento ni administración adicionales. RagManagedDb ofrece opciones de búsqueda de KNN y ANN, y permite cambiar a un nivel básico para realizar prototipos y experimentos rápidos. Para obtener más información sobre cómo elegir una estrategia de recuperación en RagManagedDb o actualizar el nivel, consulta Usa RagManagedDb con RAG. Para que Vertex AI RAG Engine cree y administre automáticamente la base de datos de vectores por ti, consulta Crea un corpus de RAG.

Además de RagManagedDb predeterminado, Vertex AI RAG Engine te permite aprovisionar y usar tu base de datos de vectores dentro de tu corpus de RAG. En este caso, eres responsable del ciclo de vida y la escalabilidad de tu base de datos de vectores.

Compara las opciones de bases de datos vectoriales

En esta tabla, se enumeran las bases de datos de vectores que se admiten en Vertex AI RAG Engine y se proporcionan vínculos a páginas que explican cómo usar las bases de datos de vectores en tu corpus de RAG.

Base de datos de vectores	Beneficios	Ideal para	Desventajas	Métricas de distancia admitidas	Tipo de búsqueda	Etapa de lanzamiento
`RagManagedDb` (opción predeterminada) es un servicio de base de datos escalable distribuido regionalmente que ofrece una coherencia muy alta y alta disponibilidad, y se puede usar para una búsqueda de vectores. fácil simple rápido	No requiere configuración. Es adecuado para casos de uso a gran y pequeña escala. Coherencia muy alta. Alta disponibilidad. Latencia baja Excelente para cargas de trabajo transaccionales. La CMEK está habilitada.	Generar documentos de gran volumen Creación de RAG a escala empresarial Desarrollar una prueba de concepto rápida Proporciona una sobrecarga de aprovisionamiento y mantenimiento baja. Usar con chat bots Compila aplicaciones de RAG.	Para lograr una recuperación óptima, la función de ANN requiere que se vuelva a compilar el índice después de realizar cambios importantes en tus datos.	`cosine`	KNN (predeterminado) y ANN	Disponible de manera general
Vector Search es el servicio de base de datos de vectores dentro de Vertex AI que está optimizado para las tareas de aprendizaje automático.	Se integra con otros servicios de Google Cloud . La infraestructura admite la escalabilidad y la confiabilidad. Google Cloud Utiliza precios de pago por uso.	Generar documentos de gran volumen Creación de RAG a escala empresarial Administrar la infraestructura de la base de datos vectorial Clientes Google Cloud existentes o cualquier persona que desee usar varios Google Cloud servicios.	Las actualizaciones no se reflejan de inmediato. Compromiso con un solo proveedor con Google Cloud. Podría ser más costoso según tus casos de uso.	`cosine` `dot-product`	ANN	Disponible de manera general
Vertex AI Feature Store es un servicio administrado para organizar, almacenar y entregar atributos de aprendizaje automático.	Se integra en Vertex AI y otros servicios de Google Cloud . La infraestructura admite la escalabilidad y la confiabilidad. Google Cloud Aprovecha la infraestructura existente de BigQuery.	Generar documentos de gran volumen Creación de RAG a escala empresarial Administrar la infraestructura de la base de datos vectorial Clientes existentes Google Cloud o clientes que desean usar varios Google Cloud servicios	Los cambios solo están disponibles en la tienda en línea después de que se realiza una sincronización manual. Compromiso con un solo proveedor con Google Cloud.	`cosine` `dot-product` `L2 squared`	ANN	Vista previa
Weaviate es una base de datos de vectores de código abierto que es flexible y modular.	Admite varios tipos de datos y ofrece capacidades de gráficos integradas. Proporciona código abierto y una comunidad activa. Son altamente flexibles y personalizables. Admite diversos tipos de datos y módulos para diferentes modalidades, como texto e imágenes. Puedes elegir entre proveedores de servicios en la nube, como Google Cloud, AWS y Azure.	Generar documentos de gran volumen Creación de RAG a escala empresarial Administrar la infraestructura de la base de datos vectorial Clientes existentes de Weaviate	Las actualizaciones no se reflejan de inmediato. Puede ser más complejo de configurar y administrar. El rendimiento puede variar según la configuración.	`cosine` `dot-product` `L2 squared` `hamming` `manhattan`	Compatibilidad con la búsqueda híbrida y la ANN	Vista previa
Pinecone es una base de datos de vectores nativa de la nube completamente administrada y diseñada para una búsqueda de similitud de alto rendimiento.	Comienza rápidamente. Excelente escalabilidad y rendimiento Enfócate en la búsqueda de vectores con funciones avanzadas, como el filtrado y la búsqueda de metadatos. Puedes elegir entre proveedores de servicios en la nube, como Google Cloud, AWS y Azure.	Generar documentos de gran volumen Creación de RAG a escala empresarial Administrar la infraestructura de la base de datos vectorial Clientes existentes de Pinecone	Las actualizaciones no se reflejan de inmediato. Puede ser más costosa que las otras opciones. Las cuotas y los límites restringen la escala y el rendimiento. Control limitado sobre la infraestructura subyacente.	`cosine` `euclidean` `dot-product`	ANN	Disponible de manera general

¿Qué sigue?

Para crear un corpus de RAG, consulta el ejemplo de creación de un corpus de RAG.
Para enumerar todos los corpus de RAG, consulta el ejemplo de enumeración de corpus de RAG.