Filtrer les recherches par pertinence au niveau du document

Lorsque vous effectuez une recherche dans votre application Vertex AI Search, vous pouvez appliquer un seuil de pertinence afin que seuls les documents qui répondent à ce seuil soient renvoyés en tant que résultats. Cette page explique comment spécifier un seuil de pertinence afin de réduire le nombre de documents renvoyés dans les requêtes.

À propos du filtrage par pertinence au niveau du document

Chaque document renvoyé par une requête de recherche reçoit un niveau de pertinence, qui indique la pertinence du document renvoyé par rapport à la requête. Lorsque vous effectuez une requête via un appel d'API, vous pouvez définir un seuil de pertinence. Définir un seuil de pertinence élevé peut réduire le nombre de documents renvoyés par une requête.

Par exemple, si vous constatez que la recherche renvoie trop de documents dont la pertinence est insuffisante pour vos utilisateurs, définissez un seuil de pertinence élevé pour limiter les résultats aux quelques-uns qui sont les plus pertinents. Si le paramètre "Élevé" est trop restrictif, essayez le paramètre "Moyen".

Types de données et applications compatibles avec le filtre de pertinence au niveau du document

Le filtre de pertinence au niveau du document peut être appliqué aux data stores contenant les types de données suivants :

  • Données de site Web avec indexation avancée de site Web
  • Données non structurées personnalisées
  • Données structurées personnalisées

Le filtre de pertinence au niveau du document ne fonctionne pas pour les data stores avec indexation de base de sites Web, ni pour les données multimédias ou de santé.

De plus, le filtre de pertinence au niveau du document ne peut pas être utilisé avec les applications de recherche combinée. Les applications de recherche combinée sont des applications associées à plusieurs datastores.

Autres types de filtres

Le filtre de pertinence au niveau du document n'est pas la seule façon de filtrer les données renvoyées par les requêtes. Vous pouvez également utiliser des expressions de filtre pour filtrer les résultats en fonction des métadonnées (dans les datastores de données non structurées avec métadonnées et d'indexation avancée de sites Web) et des valeurs de champ (dans les datastores de données structurées).

Pour en savoir plus, consultez les sections suivantes :

Si vous utilisez à la fois une expression de filtre et le filtre de pertinence au niveau du document, l'expression de filtre est appliquée en premier aux résultats, puis le filtre de pertinence au niveau du document.

Avant de commencer

Assurez-vous d'avoir créé une application et data store, et d'avoir ingéré des données dans votre data store. Pour en savoir plus, consultez Créer une application de recherche. Consultez également Types de données et applications compatibles avec le filtre de pertinence au niveau du document.

Pour filtrer par pertinence, procédez comme suit :

  1. Trouvez l'ID de votre application. Si vous avez déjà votre ID d'application, passez à l'étape suivante.

    1. Dans la console Google Cloud , accédez à la page AI Applications.

      Accédez à "Applications".

    2. Sur la page Applications, recherchez le nom de votre application et récupérez son ID dans la colonne ID.

  2. Pour filtrer la recherche par pertinence au niveau du document, utilisez le champ relevanceThreshold avec la méthode engines.servingConfigs.search.

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    

    Remplacez les éléments suivants :

    • PROJECT_ID : ID de votre projet Google Cloud .
    • APP_ID : ID de l'application Vertex AI Search que vous souhaitez interroger.
    • QUERY : texte de la requête à rechercher.
    • RELEVANCE_THRESHOLD : l'une des valeurs suivantes : HIGH, MEDIUM, LOW, LOWEST.
  3. Testez plusieurs requêtes avec différents seuils pour déterminer les meilleurs paramètres de seuil pour vos données et votre application.