此页面由 Cloud Translation API 翻译。

评估搜索质量

在 Vertex AI Search 搜索体验中，您可以使用示例查询集评估自定义搜索应用的搜索结果质量。

您可以评估包含结构化数据、非结构化数据和网站数据的自定义搜索应用的性能。您无法评估具有多个数据存储区的应用的效果。

本页将介绍为何、何时以及如何使用评估方法来评估搜索质量。

概览

本部分介绍了执行搜索质量评估的原因和时间。如需了解如何执行搜索质量评估，请参阅搜索质量评估流程。

执行评估的原因

搜索质量评估可为您提供相关指标，帮助您执行以下任务：

从汇总层面评估搜索引擎的效果
在查询层面，查找模式以了解排名算法中可能存在的偏差或不足
比较历史评估结果，了解搜索配置更改的影响

如需查看指标列表，请参阅了解结果。

何时进行评估

Vertex AI Search 扩展了多种搜索配置，可提升搜索体验。在进行以下更改后，您可以执行搜索质量评估：

您还可以定期运行评估测试，因为搜索行为会定期更新。

关于示例查询集

示例查询集用于质量评估。示例查询集必须遵循其规定的格式，并且必须包含具有以下嵌套字段的查询条目：

查询：用于生成评估指标并确定搜索质量的查询。Google 建议使用反映用户搜索模式和行为的各种查询。
目标：预期作为示例查询的搜索结果的文档的 URI。如需了解结构化、非结构化和网站搜索应用的文档定义，请参阅文档。

将目标文档与搜索响应中检索到的文档进行比较后，系统会生成性能指标。系统会使用以下两种技术生成指标：
- 文档匹配：将目标文档的 URI 与检索到的文档的 URI 进行比较。这决定了搜索结果中是否包含预期文档。在比较过程中，评估 API 会尝试按以下顺序提取以下字段，并使用第一个可用值将目标与检索到的文档进行匹配：
  - 文档定义中的 structData 字段中的 cdoc_url
  - 文档定义中的 structData 字段中的 uri
  - 文档定义中的 derivedStructData 字段中的 link
  - 文档定义中的 derivedStructData 字段中的 url
- 页面匹配：如果您在样本目标中添加了页码，评估 API 会在页面级比较结果。此属性用于确定目标中提及的网页是否也会在搜索响应中被引用。您必须启用提取式答案，才能启用网页级匹配。评估 API 会将搜索结果中第一个提取式答案的网页进行匹配。

示例查询集的用途

针对特定数据存储区的所有搜索质量评估使用相同的示例查询集，可确保以一致可靠的方式衡量搜索质量结果。这也有助于建立公平且可重复的系统。

系统会将每次评估的结果与每个样本查询的目标结果进行比较，以计算不同的指标，例如召回率、准确率和归一化贴现累计增益 (NDCG)。这些定量指标用于对不同搜索配置的结果进行排名。

配额和限制

以下限制适用于示例查询集：

每个示例查询集最多可包含 20,000 个查询。

以下配额适用于示例查询集：

您最多可以为每个项目创建 100 个示例查询集，为每个组织创建 500 个示例查询集。

如需了解详情，请参阅配额和限制。

查询集格式示例

以 JSON 格式构建查询集时，该查询集必须符合以下架构。查询集可以包含多个查询条目，每个查询条目中包含一个查询。如果以换行符分隔的 JSON (NDJSON) 格式呈现，每个查询条目都必须位于新的一行。

从 BigQuery 和 Cloud Storage 导入

以下部分提供了从 BigQuery 和 Cloud Storage 导入数据的示例查询集模板。

非结构化数据

使用以下模板以 JSON 格式起草一个示例查询文件，以评估包含元数据的非结构化数据。

{
  "queryEntry": {
    "query": "SAMPLE_QUERY",
    "targets": [
      {
        "uri": "gs://PATH/TO/CLOUD/STORAGE/LOCATION_1.docx"
      },
      {
        "uri": "gs://PATH/TO/CLOUD/STORAGE/LOCATION_2.pdf",
        "pageNumbers": [
        PAGE_NUMBER_1,
        PAGE_NUMBER_2
        ]
      },
      {
        "uri": "CDOC_URL"
      }
    ]
  }
}

替换以下内容：

SAMPLE_QUERY：用于测试评估搜索质量的查询
PATH/TO/CLOUD/STORAGE/LOCATION：预期结果所在的 Cloud Storage 位置的路径。这是文档定义中 derivedStructData 字段的 link 字段的值。
PAGE_NUMBER_1：一个可选字段，用于指明 PDF 文件中包含查询预期回答的页码。当文件包含多个页面时，此功能非常有用。
CDOC_URL：一个可选字段，用于指明 Vertex AI Search 数据存储区架构中文档元数据的自定义文档 ID cdoc_url 字段。

结构化数据

使用以下模板以 JSON 格式起草一个示例查询文件，以评估 BigQuery 中的结构化数据。

{
  "queryEntry": {
    "query": "SAMPLE_QUERY",
    "targets": [
      {
        "uri": "CDOC_URL"
      }
    ]
  }
}

替换以下内容：

SAMPLE_QUERY：用于测试评估搜索质量的查询
CDOC_URL：一个必需字段，用于指明 Vertex AI Search 数据存储区架构中结构化数据字段的自定义 cdoc_url 字段。

网站数据

使用以下模板以 JSON 格式起草一个示例查询文件，以评估网站内容。

{
  "queryEntry": {
    "query": "SAMPLE_QUERY",
    "targets": [
      {
        "uri": "WEBSITE_URL"
      }
    ]
  }
}

替换以下内容：

SAMPLE_QUERY：用于测试评估搜索质量的查询
WEBSITE_URL：查询的目标网站。

以下是 JSON 和 NDJSON 格式的示例查询集：

JSON

[
  {
    "queryEntry": {
      "query": "2018 Q4 Google revenue",
      "targets": [
        {
          "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2018Q4_alphabet_earnings_release.pdf"
        },
        {
          "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/201802024_alphabet_10K.pdf"
        }
      ]
    }
  },
  {
    "queryEntry": {
      "query": "2019 Q4 Google revenue",
      "targets": [
        {
          "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2019Q4_alphabet_earnings_release.pdf"
        }
      ]
    }
  }
]

NDJSON

{"queryEntry":{"query":"2018 Q4 Google revenue","targets":[{"uri":"gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2018Q4_alphabet_earnings_release.pdf"},{"uri":"gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/201802024_alphabet_10K.pdf"}]}}
{"queryEntry":{"query":"2019 Q4 Google revenue","targets":[{"uri":"gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2019Q4_alphabet_earnings_release.pdf"}]}}

从本地文件系统导入

以下部分提供了从本地文件系统导入的示例查询集模板。

非结构化数据

使用以下模板以 JSON 格式起草一个示例查询文件，以评估包含元数据的非结构化数据。

{
  "inlineSource": {
    "sampleQueries": [
      {
        "queryEntry": {
          "query": "SAMPLE_QUERY",
          "targets": [
            {
              "uri": "gs://PATH/TO/CLOUD/STORAGE/LOCATION_1.docx"
            },
            {
              "uri": "gs://PATH/TO/CLOUD/STORAGE/LOCATION_2.pdf",
              "pageNumbers": [
                PAGE_NUMBER_1,
                PAGE_NUMBER_2
              ]
            },
            {
              "uri": "CDOC_URL"
            }
          ]
        }
      }
    ]
  }
}

替换以下内容：

SAMPLE_QUERY：用于测试评估搜索质量的查询
PATH/TO/CLOUD/STORAGE/LOCATION：要查询的非结构化数据文件所在的 Cloud Storage 位置的路径。这是文档定义中 derivedStructData 字段的 link 字段的值。
PAGE_NUMBER_1：一个可选字段，用于指明 PDF 文件中可找到查询所需回答的页码。如果文件包含多个页面，此参数会非常有用。
CDOC_URL：一个可选字段，用于指明 Vertex AI Search 数据存储区架构中文档元数据的自定义文档 ID cdoc_url 字段。

结构化数据

使用以下模板以 JSON 格式起草一个示例查询文件，以评估 BigQuery 中的结构化数据。

{
  "inlineSource": {
    "sampleQueries": [
      {
        "queryEntry": {
          "query": "SAMPLE_QUERY",
          "targets": [
            {
              "uri": "CDOC_URL"
            }
          ]
        }
      }
    ]
  }
}

替换以下内容：

SAMPLE_QUERY：用于测试评估搜索质量的查询
CDOC_URL：一个必需字段，用于指明 Vertex AI Search 数据存储区架构中结构化数据字段的自定义 cdoc_url 字段。

网站数据

使用以下模板以 JSON 格式起草一个示例查询文件，以评估网站内容。

{
  "inlineSource": {
    "sampleQueries": [
      {
        "queryEntry": {
          "query": "SAMPLE_QUERY",
          "targets": [
            {
              "uri": "WEBSITE_URL"
            }
          ]
        }
      }
    ]
  }
}

替换以下内容：

SAMPLE_QUERY：用于测试评估搜索质量的查询
WEBSITE_URL：查询的目标网站。

以下是一个示例查询集：

JSON

{
  "inlineSource": {
    "sampleQueries": [
      {
        "queryEntry": {
          "query": "2018 Q4 Google revenue",
          "targets": [
            {
              "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2018Q4_alphabet_earnings_release.pdf"
            },
            {
              "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/201802024_alphabet_10K.pdf"
            }
          ]
        }
      },
      {
        "queryEntry": {
          "query": "2019 Q4 Google revenue",
          "targets": [
            {
              "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2019Q4_alphabet_earnings_release.pdf"
            }
          ]
        }
      }
    ]
  }
}

评估搜索质量的流程

搜索质量评估流程如下：

创建示例查询集。
导入符合规定 JSON 格式的示例查询。
运行搜索质量评估。
了解结果。

以下部分介绍了如何使用 REST API 方法执行这些步骤。

准备工作

以下限制适用：
- 在给定时间，每个项目只能有一个有效的评估。
以下配额适用：
- 每个项目每天最多可发起 5 次评估请求。如需了解详情，请参阅配额和限制。
如需获取网页级指标，您必须启用提取式回答。

创建示例查询集

您可以创建一组示例查询，并使用这些查询来评估给定数据存储区的搜索回答质量。如需创建示例查询集，请执行以下操作。

REST

以下示例展示了如何使用 sampleQuerySets.create 方法创建示例查询集。

创建示例查询集。

curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/sampleQuerySets?sampleQuerySetId=SAMPLE_QUERY_SET_ID" \
    -d '{
  "displayName": "SAMPLE_QUERY_SET_DISPLAY_NAME"
}'

替换以下内容：

PROJECT_ID：您的 Google Cloud 项目的 ID。
SAMPLE_QUERY_SET_ID：示例查询集的自定义 ID。
SAMPLE_QUERY_SET_DISPLAY_NAME：示例查询集的自定义名称。

响应

您应该收到类似以下内容的 JSON 响应：

{
  "name": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID",
  "displayName": "SAMPLE_QUERY_SET_DISPLAY_NAME",
  "createTime": "CREATION_DATETIME"
}

导入示例查询数据

创建示例查询集后，导入示例查询数据。如需导入示例查询数据，您可以执行以下任一操作：

从 Cloud Storage 导入：从 Cloud Storage 位置导入 NDJSON 文件。
从 BigQuery 导入：从 BigQuery 表中导入 BigQuery 数据。如需从 NDJSON 文件创建 BigQuery 表，请参阅从 Cloud Storage 加载 JSON 数据。
从本地文件系统导入：在本地文件系统中创建示例查询集，然后导入该查询集。

Cloud Storage

创建符合示例查询集格式的示例查询集。
使用 sampleQueries.import 方法从 Cloud Storage 位置导入包含示例查询集的 JSON 文件。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/sampleQueries:import" \
-d '{
  "gcsSource": {
    "inputUris": ["INPUT_FILE_PATH"],
  },
  "errorConfig": {
    "gcsPrefix": "ERROR_DIRECTORY"
  }
}'
```
替换以下内容：
- PROJECT_ID：您的 Google Cloud 项目的 ID。
- SAMPLE_QUERY_SET_ID：您在创建示例查询集期间定义的示例查询集的自定义 ID。
- INPUT_FILE_PATH：示例查询集的 Cloud Storage 位置的路径。
- ERROR_DIRECTORY：一个可选字段，用于指定 Cloud Storage 位置的路径，当发生导入错误时，系统会将错误文件记录到该位置。Google 建议将此字段留空或移除 errorConfig 字段，以便 Vertex AI Search 自动创建临时位置。
响应

您应该收到类似以下内容的 JSON 响应。记下 OPERATION_ID 的值。您需要在下一步中使用此值来轮询相应长时间运行的操作 (LRO) 的状态。
```
{
  "name": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1beta.ImportSampleQueriesMetadata"
  }
}
```

使用 operations.get 方法获取长时间运行的操作 (LRO) 的状态。

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/operations/OPERATION_ID"

响应

您应该收到类似以下内容的 JSON 响应。如果存在错误且导入失败，响应会显示 failureCount 字段，以指明未能导入的示例查询数量。

{
 "name": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/operations/OPERATION_ID",
 "metadata": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1beta.ImportSampleQueriesMetadata",
   "createTime": "CREATE_TIME",
   "updateTime": "UPDATE_TIME",
   "successCount": "SUCCESS_COUNT",
   "totalCount": "TOTAL_COUNT"
 },
 "done": true,
 "response": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1beta.ImportSampleQueriesResponse",
   "errorConfig": {
     "gcsPrefix": "gs://PROJECT_NUMBER_us_import/ERROR_CONFIG_FOLDER"
   }
 }
}

BigQuery

创建符合示例查询集格式的示例查询集。
使用 sampleQueries.import 方法从 BigQuery 位置导入包含示例查询集的 JSON 文件。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/sampleQueries:import" \
-d '{
  "bigquerySource": {
    "projectId": "PROJECT_ID",
    "datasetId":"DATASET_ID",
    "tableId": "TABLE_ID"
  },
  "errorConfig": {
    "gcsPrefix": "ERROR_DIRECTORY"
  }
}'
```
替换以下内容：
- PROJECT_ID：您的 Google Cloud 项目的 ID。
- SAMPLE_QUERY_SET_ID：您在创建示例查询集期间定义的示例查询集的自定义 ID。
- DATASET_ID：包含示例查询集的 BigQuery 数据集的 ID。
- TABLE_ID：包含示例查询集的 BigQuery 表的 ID。
- ERROR_DIRECTORY：一个可选字段，用于指定 Cloud Storage 位置的路径，当发生导入错误时，系统会将错误文件记录到该位置。Google 建议将此字段留空或移除 `errorConfig` 字段，以便 Vertex AI Search 可以自动创建临时位置。
响应

您应该收到类似以下内容的 JSON 响应。记下 OPERATION_ID 的值。您需要在下一步中使用此值来轮询相应长时间运行的操作 (LRO) 的状态。
```
{
  "name": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1beta.ImportSampleQueriesMetadata"
  }
}
```

使用 operations.get 方法获取长时间运行的操作 (LRO) 的状态。

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/operations/OPERATION_ID"

响应

您应该收到类似以下内容的 JSON 响应。如果存在错误且导入失败，响应会显示 failureCount 字段，以指明未能导入的示例查询数量。

{
 "name": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/operations/OPERATION_ID",
 "metadata": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1beta.ImportSampleQueriesMetadata",
   "createTime": "CREATE_TIME",
   "updateTime": "UPDATE_TIME",
   "successCount": "SUCCESS_COUNT",
   "totalCount": "TOTAL_COUNT"
 },
 "done": true,
 "response": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1beta.ImportSampleQueriesResponse",
   "errorConfig": {
     "gcsPrefix": "gs://PROJECT_ID_us_import/ERROR_CONFIG_FOLDER"
   }
 }
}

本地文件系统

创建符合示例查询集格式的示例查询集。

使用 sampleQueries.import 方法从本地文件系统位置导入包含示例查询集的 JSON 文件。

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/sampleQueries:import" \
--data @PATH/TO/LOCAL/FILE.json

替换以下内容：

PROJECT_ID：您的 Google Cloud 项目的 ID。
SAMPLE_QUERY_SET_ID：您在创建示例查询集期间定义的示例查询集的自定义 ID。
PATH/TO/LOCAL/FILE.json：包含示例查询集的 JSON 文件的路径。

响应

您应该收到类似以下内容的 JSON 响应。记下 OPERATION_ID 的值。您需要在下一步中使用此值来轮询相应长时间运行的操作 (LRO) 的状态。

{
  "name": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1beta.ImportSampleQueriesMetadata"
  }
}

使用 operations.get 方法获取长时间运行的操作 (LRO) 的状态。

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/operations/OPERATION_ID"

响应

您应该收到类似以下内容的 JSON 响应。如果存在错误且导入失败，响应会显示 failureCount 字段，以指明未能导入的示例查询数量。

{
 "name": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/operations/OPERATION_ID",
 "metadata": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1beta.ImportSampleQueriesMetadata",
   "createTime": "CREATE_TIME",
   "updateTime": "UPDATE_TIME",
   "successCount": "SUCCESS_COUNT",
   "totalCount": "TOTAL_COUNT"
 },
 "done": true,
 "response": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1beta.ImportSampleQueriesResponse",
   "errorConfig": {
     "gcsPrefix": "gs://PROJECT_ID_us_import/ERROR_CONFIG_FOLDER"
   }
 }
}

运行搜索质量评估

将示例查询数据导入示例查询集后，请按照以下步骤运行搜索质量评估。

REST

发起搜索质量评估。

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/evaluations" \
-d '{
 "evaluationSpec": {
   "querySetSpec": {
     "sampleQuerySet": "projects/PROJECT_ID/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID"
   },
   "searchRequest": {
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search"
   }
 }
}'

替换以下内容：

PROJECT_ID：您的 Google Cloud 项目的 ID。
SAMPLE_QUERY_SET_ID：您在创建示例查询集时定义的示例查询集的自定义 ID。
APP_ID：您要评估其搜索质量的 Vertex AI Search 应用的 ID。

响应

您应该收到类似以下内容的 JSON 响应。记下 EVALUATION_ID 的值。您需要在下一步中使用此值来轮询评估的状态，评估是一项长时间运行的操作 (LRO)。

{
 "name": "projects/PROJECT_NUMBER/locations/global/operations/OPERATION_ID",
 "done": true,
 "response": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.Evaluation",
   "name": "projects/PROJECT_NUMBER/locations/global/evaluations/EVALUATION_ID",
   "evaluationSpec": {
     "querySetSpec": {
       "sampleQuerySet": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID"
     },
     "searchRequest": {
       "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search"
     }
   },
   "state": "PENDING"
 }
}

监控评估进度。

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/evaluations/EVALUATION_ID"

替换以下内容：

PROJECT_ID：您的 Google Cloud 项目的 ID。
EVALUATION_ID：评估作业的 ID，在您启动评估时，该 ID 已在上一步中返回。

响应

您应该收到类似以下内容的 JSON 响应。在评估完成之前，评估状态会显示为 PENDING。

{
"name": "projects/PROJECT_NUMBER/locations/global/evaluations/EVALUATION_ID",
"evaluationSpec": {
  "querySetSpec": {
    "sampleQuerySet": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID"
  },
  "searchRequest": {
    "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search"
  }
},
"state": "PENDING"
"createTime": "CREATION_DATETIME"
}

检索汇总结果。

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/evaluations/EVALUATION_ID"

替换以下内容：

PROJECT_ID：您的 Google Cloud 项目的 ID。
EVALUATION_ID：评估作业的 ID，在您启动评估时，该 ID 已在上一步中返回。

响应

您应该收到类似以下内容的 JSON 响应。在评估完成之前，评估状态会显示为 PENDING。

{
 "name": "projects/PROJECT_NUMBER/locations/global/evaluations/EVALUATION_ID",
 "evaluationSpec": {
   "querySetSpec": {
     "sampleQuerySet": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID"
   },
   "searchRequest": {
     "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search"
   }
 },
 "qualityMetrics": {
   "docRecall": {
     "top1": DOC_RECALL_TOP_1,
     "top3": DOC_RECALL_TOP_3,
     "top5": DOC_RECALL_TOP_5,
     "top10": DOC_RECALL_TOP_10
   },
   "docPrecision": {
     "top1": DOC_PRECISION_TOP_1,
     "top3": DOC_PRECISION_TOP_3,
     "top5": DOC_PRECISION_TOP_5,
     "top10": DOC_PRECISION_TOP_10
   },
   "docNdcg": {
     "top1": DOC_NDCG_TOP_1,
     "top3": DOC_NDCG_TOP_3,
     "top5": DOC_NDCG_TOP_5,
     "top10": DOC_NDCG_TOP_10
   },
   "pageRecall": {
     "top1": PAGE_RECALL_TOP_1,
     "top3": PAGE_RECALL_TOP_3,
     "top5": PAGE_RECALL_TOP_5,
     "top10": PAGE_RECALL_TOP_10
   },
   "pageNdcg": {
     "top1": PAGE_NDCG_TOP_1,
     "top3": PAGE_NDCG_TOP_3,
     "top5": PAGE_NDCG_TOP_5,
     "top10": PAGE_NDCG_TOP_10
    }
  },
 "state": "SUCCEEDED",
 "error": {},
 "createTime": "CREATION_DATETIME",
 "endTime": "END_DATETIME"
}

检索查询级结果。

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/evaluations/EVALUATION_ID:listResults"

替换以下内容：

PROJECT_ID：您的 Google Cloud 项目的 ID。
EVALUATION_ID：评估作业的 ID，在您启动评估时，该 ID 已在上一步中返回。

响应

您应该收到类似以下内容的 JSON 响应。在评估完成之前，评估状态会显示为 PENDING。

{
 "evaluationResults": [
   {
     "sampleQuery": {
       "name": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/sampleQueries/QUERY_ID_1",
       "queryEntry": {
         "query": "SAMPLE_QUERY_1",
         "targets": [
           {
             "uri": "URI_1"
           }
         ]
       }
     },
     "qualityMetrics": {
       "docRecall": {
         "top1": DOC_RECALL_TOP_1,
         "top3": DOC_RECALL_TOP_3,
         "top5": DOC_RECALL_TOP_5,
         "top10": DOC_RECALL_TOP_10
       },
       "docPrecision": {
         "top1": DOC_PRECISION_TOP_1,
         "top3": DOC_PRECISION_TOP_3,
         "top5": DOC_PRECISION_TOP_5,
         "top10": DOC_PRECISION_TOP_10
       },
       "docNdcg": {
         "top1": DOC_NDCG_TOP_1,
         "top3": DOC_NDCG_TOP_3,
         "top5": DOC_NDCG_TOP_5,
         "top10": DOC_NDCG_TOP_10
       },
       "pageRecall": {
         "top1": PAGE_RECALL_TOP_1,
         "top3": PAGE_RECALL_TOP_3,
         "top5": PAGE_RECALL_TOP_5,
         "top10": PAGE_RECALL_TOP_10
       },
       "pageNdcg": {
         "top1": PAGE_NDCG_TOP_1,
         "top3": PAGE_NDCG_TOP_3,
         "top5": PAGE_NDCG_TOP_5,
         "top10": PAGE_NDCG_TOP_10
        }
      }
   },
   {
     "sampleQuery": {
       "name": "projects/PROJECT_NUMBER/locations/global/sampleQuerySets/SAMPLE_QUERY_SET_ID/sampleQueries/QUERY_ID_2",
       "queryEntry": {
         "query": "SAMPLE_QUERY_2",
         "targets": [
           {
             "uri": "URI_2"
           }
         ]
       }
     },
     "qualityMetrics": {
       "docRecall": {
         "top1": DOC_RECALL_TOP_1,
         "top3": DOC_RECALL_TOP_3,
         "top5": DOC_RECALL_TOP_5,
         "top10": DOC_RECALL_TOP_10
       },
       "docPrecision": {
         "top1": DOC_PRECISION_TOP_1,
         "top3": DOC_PRECISION_TOP_3,
         "top5": DOC_PRECISION_TOP_5,
         "top10": DOC_PRECISION_TOP_10
       },
       "docNdcg": {
         "top1": DOC_NDCG_TOP_1,
         "top3": DOC_NDCG_TOP_3,
         "top5": DOC_NDCG_TOP_5,
         "top10": DOC_NDCG_TOP_10
       },
       "pageRecall": {
         "top1": PAGE_RECALL_TOP_1,
         "top3": PAGE_RECALL_TOP_3,
         "top5": PAGE_RECALL_TOP_5,
         "top10": PAGE_RECALL_TOP_10
       },
       "pageNdcg": {
         "top1": PAGE_NDCG_TOP_1,
         "top3": PAGE_NDCG_TOP_3,
         "top5": PAGE_NDCG_TOP_5,
         "top10": PAGE_NDCG_TOP_10
        }
      }
   }
 ]
}

了解结果

下表介绍了评估结果中返回的指标。

名称	说明	要求
`docRecall`	每个文档在各种前 k 名截断水平下的召回率。召回率是指检索到的相关文档占所有相关文档的比例。例如，`top5` 值表示以下含义：对于单个查询，如果在前 5 个结果中检索到 5 个相关文档中的 3 个，则 `docRecall` 可计算为 3/5 或 0.6。	示例查询必须包含 URI 字段。
`pageRecall`	各个网页在不同前 k 名截止水平下的召回率。召回率是指检索到的相关网页占所有相关网页的比例。例如，`top5` 值表示以下含义：对于单个查询，如果在前 5 个结果中检索到 5 个相关网页中的 3 个，则 `pageRecall` 可计算为 3/5 = 0.6	示例查询必须包含 URI 和网页字段。必须启用提取式回答。
`docNdcg`	每个文档在各种 top-k 截止水平下的归一化折扣累计增益 (NDCG)。 NDCG 用于衡量排名质量，并为排名靠前的结果赋予更高的相关性。您可以根据归一化 CDG 为每个查询计算 NDCG 值。	示例查询必须包含 URI 字段。
`pageNdcg`	每个网页的归一化折扣累计增益 (NDCG)，采用各种 top-k 截止水平。 NDCG 用于衡量排名质量，并为排名靠前的结果赋予更高的相关性。您可以根据归一化 CDG 为每个查询计算 NDCG 值。	示例查询必须包含 URI 和网页字段。必须启用提取式回答。
`docPrecision`	每个文档的精确度，在各种 top-k 截止水平下。精确率是指检索到的相关文档所占的比例。例如，`top3` 值表示以下含义：对于单个查询，如果前 5 个检索到的文档中有 4 个相关，则 `docPrecision` 值可计算为 4/5 或 0.8。	示例查询必须包含 URI 字段。

根据这些受支持的指标的值，您可以执行以下任务：

分析汇总指标：
- 检查平均召回率、精确率和归一化折扣累计增益 (NDCG) 等总体指标。
- 这些指标可提供有关搜索引擎效果的概览。
查看查询级结果：
- 深入分析各个搜索查询，找出搜索引擎表现良好或欠佳的具体方面。
- 在结果中寻找规律，以了解排名算法中可能存在的偏差或缺点。
比较不同时间段的结果：
- 定期运行评估，以跟踪搜索质量随时间的变化。
- 使用历史数据来确定趋势，并评估您对搜索引擎所做的任何更改的影响。

后续步骤

使用 Cloud Scheduler 设置定期质量评估。如需了解详情，请参阅对 HTTP 目标使用身份验证。

评估搜索质量 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

概览

执行评估的原因

何时进行评估

关于示例查询集

示例查询集的用途

配额和限制

查询集格式示例

从 BigQuery 和 Cloud Storage 导入

非结构化数据

结构化数据

网站数据

JSON

NDJSON

从本地文件系统导入

非结构化数据

结构化数据

网站数据

JSON

评估搜索质量的流程

准备工作

创建示例查询集

REST

响应

导入示例查询数据

Cloud Storage

响应

响应

BigQuery

响应

响应

本地文件系统

响应

响应

运行搜索质量评估

REST

响应

响应

响应

响应

了解结果

后续步骤

评估搜索质量