依文件層級關聯性篩選搜尋結果

在 Vertex AI Search 應用程式中搜尋時,您可以套用相關性門檻,這樣系統就只會傳回符合此門檻的文件。本頁面說明如何指定關聯性門檻,以減少查詢中傳回的文件數量。

關於依文件層級關聯性篩選

每份由搜尋查詢傳回的文件都會附上相關程度等級,用來指出傳回文件與查詢的相關程度。透過 API 呼叫執行查詢時,您可以設定相關性門檻。設定高相關性門檻可減少查詢傳回的文件數量。

舉例來說,如果您發現搜尋結果會傳回太多與使用者查詢內容不夠相關的文件,請將相關性門檻設為高,以便將結果縮小到只剩下最相關的幾個。如果高設定過於嚴苛,請試試中等設定。

文件層級關聯性篩選器支援的資料類型和應用程式

文件層級相關性篩選器可套用至含有下列資料類型的資料庫:

  • 使用進階網站索引建立功能的網站資料
  • 自訂非結構化資料
  • 自訂結構化資料

文件層級關聯篩選器不適用於含有基本網站索引、媒體資料或醫療照護資料的資料儲存庫。

此外,文件層級關聯性篩選器無法與混合搜尋應用程式搭配使用。混合搜尋應用程式是指連結至多個資料儲存庫的應用程式。

其他類型的篩選器

文件層級關聯性篩選器並非篩選查詢傳回資料的唯一方式。您也可以使用篩選運算式,根據中繼資料 (在進階網站索引和非結構化資料中,搭配中繼資料資料儲存庫) 和欄位值 (在結構化資料儲存庫中) 篩選結果。

如需相關資訊,請參閱:

如果同時使用篩選運算式和文件層級關聯性篩選器,系統會先將篩選運算式套用至結果,然後再套用文件層級關聯性篩選器。

事前準備

請確認您已建立應用程式和資料儲存庫,並將資料擷取至資料儲存庫。詳情請參閱「建立搜尋應用程式」。此外,請參閱「支援文件層級關聯性篩選器的資料類型和應用程式」。

如要依據相關性篩選,請按照下列步驟操作:

  1. 找出應用程式 ID。如果您已取得應用程式 ID,請直接跳到下一個步驟。

    1. 前往 Google Cloud 控制台的「AI Applications」頁面。

      前往「應用程式」

    2. 在「Apps」頁面中找出應用程式名稱,然後從「ID」欄取得應用程式 ID。

  2. 如要依文件層級關聯性篩選搜尋結果,請使用 relevanceThreshold 欄位搭配 engines.servingConfigs.search 方法。

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    

    更改下列內容:

    • PROJECT_ID: Google Cloud 專案的 ID。
    • APP_ID:您要查詢的 Vertex AI Search 應用程式 ID。
    • QUERY:要搜尋的查詢文字。
    • RELEVANCE_THRESHOLD:下列其中一個:HIGHMEDIUMLOWLOWEST
  3. 請使用不同門檻測試多項查詢,找出最適合資料和應用程式的最佳門檻設定。