Filtrare le ricerche in base alla pertinenza a livello di documento

Quando esegui ricerche nell'app Vertex AI Search, puoi applicare una soglia di pertinenza in modo che solo i documenti che soddisfano questa soglia vengano restituiti come risultati. Questa pagina spiega come specificare una soglia di pertinenza per ridurre il numero di documenti restituiti nelle query.

Informazioni sul filtro per pertinenza a livello di documento

A ogni documento restituito da una query di ricerca viene assegnato un livello di pertinenza, che indica la pertinenza del documento restituito alla query. Quando effettui una query tramite una chiamata API, puoi impostare una soglia di pertinenza. L'impostazione di una soglia di pertinenza elevata può ridurre il numero di documenti restituiti da una query.

Ad esempio, se noti che la ricerca restituisce troppi documenti di insufficiente pertinenza per i tuoi utenti, imposta la soglia di pertinenza su alta per limitare i risultati solo a quelli più pertinenti. Se l'impostazione Alta è troppo restrittiva, prova l'impostazione Media.

Tipi di dati e app supportati per il filtro di pertinenza a livello di documento

Il filtro di pertinenza a livello di documento può essere applicato ai datastore con i seguenti tipi di dati:

  • Dati del sito web con l'indicizzazione avanzata dei siti web
  • Dati non strutturati generici
  • Dati strutturati generici

Il filtro di pertinenza a livello di documento non funziona per i datastore con indicizzazione di siti web di base, dati multimediali o dati sanitari.

Inoltre, il filtro di pertinenza a livello di documento non può essere utilizzato con le app di ricerca combinata. Le app di ricerca combinata sono app collegate a più datastore.

Altri tipi di filtri

Il filtro di pertinenza a livello di documento non è l'unico modo per filtrare i dati restituiti dalle query. Puoi anche utilizzare le espressioni di filtro per filtrare i risultati in base ai metadati (nell'indicizzazione avanzata dei siti web e nei dati non strutturati con datastore di metadati) e ai valori di campo (nei datastore strutturati).

Per informazioni, vedi:

Se utilizzi sia un'espressione filtro sia il filtro di pertinenza a livello di documento, l'espressione filtro viene applicata prima ai risultati e poi il filtro di pertinenza a livello di documento.

Prima di iniziare

Assicurati di aver creato un'app e un datastore e di aver importato i dati nel datastore. Per ulteriori informazioni, vedi Creare un'app di ricerca. Consulta anche Tipi di dati e app supportati per il filtro di pertinenza a livello di documento.

Per filtrare in base alla pertinenza:

  1. Trova l'ID app. Se hai già l'ID app, vai al passaggio successivo.

    1. Nella console Google Cloud, vai alla pagina Agent Builder.

      Vai ad App

    2. Nella pagina App, trova il nome della tua app e recupera l'ID dall'app la colonna ID.

  2. Per filtrare la ricerca in base alla pertinenza a livello di documento, utilizza il campo relevanceThreshold con il metodo engines.servingConfigs.search.

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    
    • PROJECT_ID: l'ID del tuo progetto Google Cloud.
    • APP_ID: l'ID dell'app Vertex AI Search su cui vuoi eseguire una query.
    • QUERY: il testo della query da cercare.
    • RELEVANCE_THRESHOLD: uno dei seguenti: HIGH, MEDIUM, LOW, LOWEST.
  3. Testa più query con soglie diverse per determinare le impostazioni di soglia migliori per i tuoi dati e la tua applicazione.