Classer les résultats de recherche sur le Web

Cette page explique comment trier les résultats d'une requête de recherche sur le Web par date.

  • Pour les data stores qui utilisent la recherche de base sur les sites Web, vous pouvez trier les résultats par date de page déduite par Google.
  • Pour les datastores qui utilisent l'indexation avancée des sites Web, vous pouvez trier les résultats par attributs de données personnalisés ou par dates de pages déduites par Google, qui sont ajoutés au schéma du data store. Pour en savoir plus, consultez Utiliser des données structurées pour l'indexation avancée de sites Web.

Avant de commencer

Assurez-vous de procéder comme suit :

Trier les résultats de recherche pour la recherche de base sur un site Web

Pour trier les résultats de recherche d'un data store de site Web avec la recherche de site Web de base, procédez comme suit :

REST

L'exemple suivant montre comment trier les résultats de recherche Web pour une application avec une recherche de site Web de base. Cet exemple utilise la méthode engines.servingConfigs.search :

  1. Trouvez l'ID de votre application. Si vous avez déjà votre ID d'application, passez à l'étape suivante.

    1. Dans la console Google Cloud , accédez à la page AI Applications.

      Accédez à "Applications".

    2. Sur la page Applications, recherchez le nom de votre application et récupérez son ID dans la colonne ID.

  2. Envoyez une requête de recherche et incluez le champ orderBy.

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
    "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "orderBy": "ORDER_BY"
    }'
    

    Remplacez les éléments suivants :

    • PROJECT_ID : ID de votre projet Google Cloud .
    • APP_ID : ID de l'application Vertex AI Search.
    • QUERY : texte de la requête à rechercher.
    • ORDER_BY : ordre dans lequel les résultats sont organisés. Par exemple, pour trier les pages Web par ordre chronologique, spécifiez date afin de renvoyer les pages Web triées par date déduite par Google. Pour en savoir plus sur la date de page déduite par Google, consultez l'article de blog Aider la recherche Google à connaître la date la plus précise pour votre page Web. L'ordre de tri par défaut est décroissant, ce qui signifie que les pages dont les dates sont les plus récentes sont renvoyées en premier. Pour obtenir un ordre de tri croissant, ajoutez :a à la valeur date : date:a.

Organiser les résultats de recherche pour l'indexation avancée de site Web

Pour trier les résultats de recherche d'un data store de site Web avec indexation avancée des sites Web, procédez comme suit :

REST

L'exemple suivant montre comment trier les résultats de recherche sur le Web pour une application avec indexation avancée de sites Web. Cet exemple utilise la méthode engines.servingConfigs.search :

  1. Trouvez l'ID de votre application. Si vous avez déjà votre ID d'application, passez à l'étape suivante.

    1. Dans la console Google Cloud , accédez à la page AI Applications.

      Accédez à "Applications".

    2. Sur la page Applications, recherchez le nom de votre application et récupérez son ID dans la colonne ID.

  2. Envoyez une requête de recherche et incluez le champ orderBy.

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
    "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "orderBy": "ORDER_BY"
    }'
    

    Remplacez les éléments suivants :

    • PROJECT_ID : ID de votre projet Google Cloud .
    • APP_ID : ID de l'application Vertex AI Search.
    • QUERY : texte de la requête à rechercher.
    • ORDER_BY : ordre dans lequel les résultats sont organisés. Le champ peut contenir des valeurs de type datetime, integer ou number. Pour les trier par ordre chronologique, spécifiez l'attribut de date personnalisée indiqué dans le schéma ou la date de page déduite par Google. Par exemple, pour trier les résultats par un attribut date_edited PageMap, vous pouvez spécifier le champ orderBy comme "orderBy": "date_edited". L'ordre de tri par défaut est croissant, ce qui signifie que les pages les plus anciennes sont renvoyées en premier. Pour obtenir les résultats dans l'ordre décroissant, ajoutez desc à la valeur de l'attribut personnalisé (par exemple, "orderBy":"date_edited desc").