En esta página se describe qué es Vertex AI RAG Engine y cómo funciona.
Descripción | Consola |
---|---|
Para saber cómo usar el SDK de Vertex AI para ejecutar tareas de Vertex AI RAG Engine, consulta la guía de inicio rápido de RAG para Python. |
Información general
Vertex AI RAG Engine, un componente de la plataforma Vertex AI, facilita la generación aumentada de recuperación (RAG). Vertex AI RAG Engine también es un marco de datos para desarrollar aplicaciones de modelos de lenguaje extensos (LLMs) con contexto aumentado. El aumento del contexto se produce cuando aplicas un LLM a tus datos. Implementa la generación aumentada por recuperación (RAG).
Un problema habitual de los LLMs es que no entienden el conocimiento privado, es decir, los datos de tu organización. Con Vertex AI RAG Engine, puedes enriquecer el contexto de los LLMs con información privada adicional, ya que el modelo puede reducir las alucinaciones y responder a las preguntas de forma más precisa.
Al combinar fuentes de conocimiento adicionales con el conocimiento que ya tienen los LLMs, se proporciona un mejor contexto. El contexto mejorado junto con la consulta aumenta la calidad de la respuesta del LLM.
En la siguiente imagen se ilustran los conceptos clave para entender el motor de RAG de Vertex AI.
Estos conceptos se enumeran en el orden del proceso de generación aumentada de recuperación (RAG).
Ingestión de datos: ingiere datos de diferentes fuentes de datos. Por ejemplo, archivos locales, Cloud Storage y Google Drive.
Transformación de datos: conversión de los datos para prepararlos para la indexación. Por ejemplo, los datos se dividen en fragmentos.
Inserción: representaciones numéricas de palabras o fragmentos de texto. Estos números capturan el significado semántico y el contexto del texto. Las palabras o el texto similares o relacionados tienden a tener inserciones similares, lo que significa que están más cerca en el espacio vectorial de alta dimensión.
Indexación de datos: el motor de RAG de Vertex AI crea un índice llamado corpus. El índice estructura la base de conocimientos para que esté optimizada para las búsquedas. Por ejemplo, el índice es como una tabla de contenido detallada de un libro de referencia enorme.
Extracción: cuando un usuario hace una pregunta o proporciona una petición, el componente de extracción de Vertex AI RAG Engine busca en su base de conocimientos información relevante para la consulta.
Generación: la información obtenida se convierte en el contexto que se añade a la consulta original del usuario como guía para que el modelo de IA generativa genere respuestas fundamentadas y relevantes.
Regiones disponibles
El motor de RAG de Vertex AI está disponible en las siguientes regiones:
Región | Ubicación | Descripción | Fase de lanzamiento |
---|---|---|---|
us-central1 |
Iowa | Se admiten las versiones v1 y v1beta1 . |
Lista de permitidos |
us-east4 |
Virginia | Se admiten las versiones v1 y v1beta1 . |
GA |
europe-west3 |
Fráncfort (Alemania) | Se admiten las versiones v1 y v1beta1 . |
GA |
europe-west4 |
Eemshaven (Países Bajos) | Se admiten las versiones v1 y v1beta1 . |
GA |
us-central1
se ha cambiado aAllowlist
. Si quieres experimentar con Vertex AI RAG Engine, prueba con otras regiones. Si tiene previsto incorporar su tráfico de producción aus-central1
, póngase en contacto convertex-ai-rag-engine-support@google.com
.
Eliminar Vertex AI RAG Engine
En los siguientes ejemplos de código se muestra cómo eliminar un motor RAG de Vertex AI en la consola, Python y REST: Google Cloud
Parámetros de la API versión 1 (v1) y ejemplos de código.
Parámetros y ejemplos de código de la API v1beta1.
Enviar comentarios
Para chatear con el equipo de Asistencia de Google, ve al grupo de asistencia de Vertex AI RAG Engine.
Para enviar un correo, usa la dirección de correo vertex-ai-rag-engine-support@google.com
.
Siguientes pasos
- Para saber cómo usar el SDK de Vertex AI para ejecutar tareas de Vertex AI RAG Engine, consulta la guía de inicio rápido de RAG para Python.
- Para obtener información sobre el grounding, consulta la introducción al grounding.
- Para obtener más información sobre las respuestas de RAG, consulta Resultados de extracción y generación del motor RAG de Vertex AI.
- Para obtener información sobre la arquitectura RAG, sigue estos pasos: