Cuando realizas búsquedas en tu app de Vertex AI Search, puedes aplicar un umbral de relevancia para que solo se muestren como resultados los documentos que cumplan con este umbral. En esta página, se explica cómo especificar un umbral de relevancia para reducir la cantidad de documentos que se muestran en las búsquedas.
Acerca del filtrado por relevancia a nivel del documento
A cada documento que devuelve una búsqueda se le asigna un nivel de relevancia, que indica la relevancia del documento devuelto para la búsqueda. Cuando realizas una consulta a través de una llamada a la API, puedes establecer un umbral de relevancia. Establecer un umbral de relevancia alto puede reducir la cantidad de documentos que muestra una búsqueda.
Por ejemplo, si observas que la búsqueda devuelve demasiados documentos que no son lo suficientemente relevantes para tus usuarios, establece el umbral de relevancia en alto para reducir los resultados solo a los pocos que sean más pertinentes. Si el parámetro de configuración alto es demasiado restrictivo, prueba con el parámetro medio.
Tipos de datos y apps compatibles con el filtro de relevancia a nivel del documento
El filtro de relevancia a nivel del documento se puede aplicar a los almacenes de datos con los siguientes tipos de datos:
- Datos del sitio web con indexación avanzada de sitios web
- Datos no estructurados personalizados
- Datos estructurados personalizados
El filtro de relevancia a nivel del documento no funciona para los almacenes de datos con indexación básica de sitios web, datos de medios o datos de atención médica.
Además, el filtro de relevancia a nivel del documento no se puede usar con las apps de búsqueda combinada. Las apps de búsqueda combinada son apps que están conectadas a varios almacenes de datos.
Otros tipos de filtros
El filtro de relevancia a nivel del documento no es la única forma en que puedes filtrar los datos que muestran las búsquedas. También puedes usar expresiones de filtro para filtrar los resultados según los metadatos (en la indexación avanzada de sitios web y los almacenes de datos no estructurados con metadatos) y los valores de los campos (en los almacenes de datos estructurados).
Para obtener más información, consulta los siguientes recursos:
Si usas una expresión de filtro y el filtro de relevancia a nivel del documento, primero se aplica la expresión de filtro a los resultados y, luego, se aplica el filtro de relevancia a nivel del documento.
Antes de comenzar
Asegúrate de haber creado una app y un almacén de datos, y de haber transferido datos a tu almacén de datos. Para obtener más información, consulta Crea una app de búsqueda. Consulta también Tipos de datos y apps compatibles con el filtro de relevancia a nivel del documento.
Cómo buscar y filtrar los resultados por relevancia a nivel del documento
Para filtrar por relevancia, sigue estos pasos:
Busca el ID de tu app. Si ya tienes el ID de tu app, ve al siguiente paso.
En la consola de Google Cloud , ve a la página AI Applications.
Ve a Apps.
En la página Apps, busca el nombre de tu app y obtén su ID en la columna ID.
Para filtrar la búsqueda por relevancia a nivel del documento, usa el campo
relevanceThreshold
con el métodoengines.servingConfigs.search
.curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \ -d '{ "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search", "query": "QUERY", "relevanceThreshold": "RELEVANCE_THRESHOLD" }'
Reemplaza lo siguiente:
PROJECT_ID
: Es el ID de tu proyecto de Google Cloud .APP_ID
: Es el ID de la app de Vertex AI Search que deseas consultar.QUERY
: Es el texto de la búsqueda.RELEVANCE_THRESHOLD
: Uno de los siguientes:HIGH
,MEDIUM
,LOW
,LOWEST
.
Prueba varias búsquedas con diferentes umbrales para determinar la mejor configuración de umbral para tus datos y tu aplicación.