本頁面由 Cloud Translation API 翻譯而成。

取得摘要和擷取的內容

Vertex AI Search 可在每次搜尋回覆中提供搜尋摘要、擷取答案和擷取片段，提升搜尋結果品質。

摘要：摘要是從搜尋結果文件擷取的簡短文字，可預覽搜尋結果的內容。包括可在 UI 中呈現的命中醒目顯示。摘要通常會顯示在每筆搜尋結果下方，協助使用者評估該結果的關聯性和實用性。摘要適用於含有非結構化資料和網站資料的資料儲存庫 (包括基本網站搜尋和進階網站索引)。
擷取答案：擷取答案是指系統從文件中逐字擷取的文字，並隨搜尋結果一併傳回。這項資訊是直接從原始文件擷取而來。擷取式答案通常會顯示在網頁頂端附近，為使用者提供與查詢內容相關的簡短答案。擷取式答案適用於包含非結構化資料和具備進階網站索引建立功能的資料儲存庫。
擷取片段：擷取片段是隨每筆搜尋結果傳回的文字，擷取片段通常比擷取答案更詳細。擷取的片段可以做為查詢的答案，也可以用於執行後續處理工作，並做為大型語言模型的輸入內容，以生成答案或新文字。擷取片段適用於包含非結構化資料，以及具備進階網站索引建立功能的資料儲存庫。

範例

以下範例有助於說明摘要、擷取式答案和擷取式片段之間的差異。

查詢：「什麼是 Vertex AI Search？」

摘要：

為此，我們宣布推出全新 Vertex AI Search，開發人員可藉此快速開始建立機器人等生成式應用程式。
擷取式答案：

有了 Vertex AI Search，開發人員就能快速推出全新體驗，包括機器人、聊天介面、自訂搜尋引擎和數位助理等。開發人員可透過 API 存取 Google 的基礎模型，並使用現成範本，在幾小時，甚至是幾分鐘內，快速製作出生成式應用程式。
擷取區隔：
企業和政府也希望運用這項新 AI 技術，讓客戶、合作夥伴和員工的互動過程變得更有效率且更有幫助。為此，我們宣布推出全新的 Vertex AI Search。

有了 Vertex AI Search，開發人員就能快速推出全新體驗，包括機器人、聊天介面、自訂搜尋引擎和數位助理等。開發人員可透過 API 存取 Google 的基礎模型，並使用現成範本，在幾小時，甚至是幾分鐘內，快速製作出生成式應用程式。開發人員還可透過 Vertex AI Search 執行下列操作：
- 結合機構資料和資訊檢索技術，提供相關答案。
- 搜尋及回覆時，不只能使用文字。
- 結合自然對話和結構化流程。
- 不只是提供資訊，還要能交易。

事前準備

請根據應用程式類型完成下列先決條件：

非結構化應用程式：
- 程式碼片段則沒有相關規定。
- 如要使用擷取式答案和擷取式片段，請開啟「Enterprise 版功能」。
網站應用程式：
- 如要啟用摘要功能，請開啟：
  - Enterprise 版功能。
- 如要取得擷取式答案，請開啟：
  - Enterprise 版功能。
  - 進階網站索引。

文字片段

摘要是從每筆搜尋結果文件擷取的簡短文字，包括以粗體 HTML 標記醒目顯示相符結果，以便在使用者介面中預覽搜尋結果。通常，摘要會以預覽文字的形式顯示在搜尋結果下方，協助使用者判斷點選該搜尋結果是否有用。

摘要適用於網站和非結構化搜尋。

取得摘要

如何取得程式碼片段：

傳送搜尋要求，其中包含 ContentSearchSpec.SnippetSpec，並將 returnSnippet 設為 true。

以下 SnippetSpec 範例指定可為每筆搜尋結果傳回摘要。
```
"contentSearchSpec":
{
  "snippetSpec":
  {
    "returnSnippet": true
  }
}
```
- returnSnippet：如果設為 true，則傳回程式碼片段。

從搜尋回應取得摘要。摘要會與 derivedStructData.snippets 中的每筆搜尋結果一併傳回。

在本例中，文件是搜尋回應中的其中一項結果，結果會附上以粗體醒目顯示相符項的片段：

{
  "id": "54321",
  "document": {
    "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
    "id": "54321",
    "derivedStructData": {
      "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2008_google_annual_report.pdf",
      "snippets": [
        {
          "snippet": "Google Chrome. Google Chrome is an open-source browser that combines a minimal design with technologies to make the web faster, safer, and easier to navigate.",
          "snippet_status": "SUCCESS"
        }
      ]
    }
  }
}

snippet：包含為文件搜尋結果產生的摘要。命中醒目顯示功能會以粗體 HTML 標記表示。
snippet_status：如果系統產生摘要，這個欄位會以 SUCCESS 形式傳回。如果沒有產生任何摘要，這個欄位會傳回 NO_SNIPPET_AVAILABLE。

擷取式答案

擷取答案是指從文件中逐字擷取的文字片段。當文件在搜尋回應中做為搜尋結果傳回時，系統會一併傳回相關的擷取式答案。

擷取式答案可以是從搜尋結果文件擷取的文字，例如段落、表格或項目符號清單。擷取答案比擷取區段短。

如果需要精確的逐字回答，而非改寫的摘要，則可使用擷取式答案做為摘要式回應的替代方案。

如果資料儲存庫包含非結構化資料，且具備進階網站索引功能，即可提供擷取式答案。

取得擷取式答案

如要取得擷取式答案：

傳送使用 ContentSearchSpec.extractiveContentSpec 指定 maxExtractiveAnswerCount 的搜尋要求。

以下 extractiveContentSpec 範例指定可為每筆搜尋結果傳回答案。
```
"contentSearchSpec":
{
  "extractiveContentSpec": {
    "maxExtractiveAnswerCount": 1
  }
}
```
- maxExtractiveAnswerCount：每個搜尋結果要傳回的擷取答案數量。預設值為 0，最大值為 5。

從搜尋回應中取得擷取式答案。extractive_answers 中的每項搜尋結果都會附上擷取式答案。

在本範例中，文件是搜尋回應中的其中一個結果，且結果包含擷取式答案：

{
  "id": "54321",
  "document": {
    "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
    "id": "54321",
    "derivedStructData": {
      "extractive_answers": [
        {
          "pageNumber": "2",
          "content": "Google saw growth throughout the year both in our domestic business and internationally, both on Google owned sites and on the Google Network. Specifically, revenues from Google owned sites increased 101% on a year over year basis, from $792 million to $1.6 billion."
        }
      ],
      "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
    }
}
}

pageNumber：如果可以從文件中擷取頁碼，這個欄位會指出答案的擷取位置。
content：擷取答案的內容。

擷取區隔

擷取區段是指從搜尋結果文件逐字擷取的文字部分。擷取片段與擷取答案類似，但通常更完整且詳細。通常，擷取片段會做為您自有 LLM 的輸入內容，用來生成答案或新文字。

擷取片段可以包含多個段落，包括表格和項目符號清單等格式化文字。

如果資料儲存庫包含非結構化資料，且具備進階網站索引建立功能，即可使用擷取區隔。

擷取區隔選項

以下是可用的擷取區隔選項：

區隔數量：您可以指定最多 10 個要為每個搜尋結果傳回的擷取區隔。
關聯性分數：關聯性分數是根據查詢與擷取區隔的相似程度而定。您可以指定要傳回附帶關聯分數的擷取片段。分數範圍介於 -1.0 (較不相關) 至 1.0 (較相關) 之間。啟用關聯性分數可能會增加延遲時間。

注意： 系統會根據多項因素決定傳回結果的順序。雖然系統會將關聯性分數納入排名考量，但不會單獨依據這項分數決定搜尋結果排名。
相鄰區隔：您可以設定 numPreviousSegments 和 numNextSegments，從相關區隔的前後各取得最多 3 個區隔。相鄰的片段可為相關片段增加背景資訊，並提高準確度。

啟用相鄰區隔可能會增加延遲。

取得擷取式片段

下列步驟說明如何取得非結構化資料的擷取片段。您可以按照類似步驟，取得網站資料的擷取區隔。

傳送使用 ContentSearchSpec.extractiveContentSpec 指定 maxExtractiveSegmentCount 的搜尋要求。

以下 extractiveContentSpec 範例指定每個搜尋結果可傳回一個區隔。
```
"contentSearchSpec":
{
  "extractiveContentSpec": {
    "maxExtractiveSegmentCount": 1
  }
}
```
- maxExtractiveSegmentCount：每個搜尋結果要傳回的擷取片段數量。預設值為 0，最大值為 10。
其他選項：
- returnExtractiveSegmentScore：設為 true，即可在傳回每個區隔時，一併傳回相關分數。
- numPreviousSegments：要在相關區隔之前傳回的相鄰區隔數量。預設值為 0，最大值為 3。使用相鄰區隔可能會增加延遲時間。
- numNextSegments：相關區隔後要傳回的相鄰區隔數量。預設值為 0，最大值為 3。使用相鄰區隔可能會增加延遲時間。
如要進一步瞭解這些選項，請參閱擷取片段選項。

從搜尋回應中取得區隔。系統會在 extractive_segments 中傳回每個搜尋結果的區隔。

在本例中，文件是搜尋回應傳回的其中一個結果，且結果中包含區段：

{
  "id": "54321",
  "document": {
    "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
    "id": "54321",
    "derivedStructData": {
      "extractive_segments": [
        {
          "pageNumber": "2",
          "content": "Client\nGoogle Toolbar. Google Toolbar is a free application that adds a Google search box to web browsers (Internet\nExplorer and Firefox) and improves user web experience through features such as a pop-up blocker that blocks\npop-up advertising, an autofill feature that completes web forms with information saved on a user's computer, and\ncustomizable buttons that let users search their favorite web sites and stay updated on their favorite feeds.\n\nGoogle Chrome. Google Chrome is an open-source browser that combines a minimal design with\ntechnologies to make the web faster, safer, and easier to navigate.\nGoogle Pack. Google Pack is a free collection of safe, useful software programs from Google and other\ncompanies that improve the user experience online and on the desktop. It includes programs that help users\nbrowse the web faster, remove spyware and viruses.\n\nPicasa. Picasa is a free service that allows users to view, manage and share their photos. Picasa enables users\nto import, organize and edit their photos, and upload them to Picasa Web Albums where the photos can be shared\nwith others on the internet.\n\nGoogle Desktop. Google Desktop lets people perform a full-text search on the contents of their own\ncomputer, including email, files, instant messenger chats and web browser history. Users can view web pages they\nhave visited even when they are not online. Google Desktop also includes a customizable Sidebar that includes\nmodules for weather, stock tickers and news.\n\n5"
        }
      ],
      "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
    }
}
}

pageNumber：如果可以從文件中擷取頁碼，這個欄位會指出答案的擷取位置。
content：擷取片段的內容。

後續步驟

預覽搜尋結果