檢查媒體推薦內容的資料品質

本頁面說明如何判斷媒體資料的各項指標是否符合相關要求門檻。

關於檢查媒體資料品質

近期使用者事件對媒體推薦非常重要,因此您必須定期檢查擷取的資料和使用者事件品質。您可以查看媒體推薦應用程式的「Optimization」分頁,判斷您可以對資料進行哪些改善,以便針對品質較高的推薦內容進行最佳化。

如果指標未達門檻,則指標會顯示警告狀態。接著,你必須查看指標及其說明,判斷應採取哪些行動來改善媒體品質。

所有模型和目標都必須通過一般品質指標門檻。部分模型和目標設有額外的應用程式專屬品質指標和門檻。使用相同資料儲存庫的所有應用程式,其一般品質指標都相同,但應用程式專屬的品質指標則會因應用程式模型和目標而異。

如要瞭解推薦模型和目標,請參閱「關於媒體應用程式推薦類型」。

檢查資料品質

控制台

如要檢查媒體推薦資料的品質,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「AI Applications」頁面。

    AI 應用程式

  2. 按一下要檢查資料品質的媒體推薦應用程式名稱。

  3. 在導覽選單中,依序點選「資料品質」和「最佳化」分頁標籤。這個頁面會顯示與應用程式相關聯的資料的各種指標狀態。

  4. 請查看頁面頂端的「一般品質」和「應用程式專屬品質」狀態。如果一或多個指標超出閾值,頁面頂端的摘要狀態會顯示為警告。

    兩個指標表格 (一般品質應用程式專屬品質) 會列出個別指標。

    最佳化分頁會顯示一般品質 doc_with_same_title_percentage 的警告指標

  5. 在指標表格中,按一下「查看詳細資料」,即可進一步瞭解警告狀態中的任何指標。

  6. 選用:如要查看符合規定的指標門檻,請按一下「查看詳細資料」。指標表中不會顯示符合規定的指標門檻。

REST

使用 requirements:checkRequirement 方法檢查媒體推薦資料的品質,如下所示。

如要透過指令列檢查品質,請按照下列步驟操作:

  1. 找出資料儲存庫 ID。如果您已取得資料儲存庫 ID,請略過至下一個步驟。

    1. 前往 Google Cloud 控制台的「AI Applications」頁面,然後在導覽選單中按一下「資料儲存庫」

      前往「資料儲存庫」頁面

    2. 點按資料儲存庫的名稱。

    3. 在資料儲存庫的「資料」頁面中,取得資料儲存庫 ID。

  2. 執行下列 curl 指令,瞭解媒體推薦內容是否符合一般指標的門檻:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-GFE-SSL: yes" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/requirements:checkRequirement" \
    -d '{
          "location": "projects/PROJECT_ID/locations/global",
          "requirementType": "discoveryengine.googleapis.com/media_recs/general/all/warning",
          "resources": [
            {
              "labels": {
                "branch_id": "0",
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/Branch"
            },
            {
              "labels": {
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/DataStore"
            }
          ]
        }'
    

    更改下列內容:

    • PROJECT_ID: Google Cloud 專案的 ID。
    • DATA_STORE_ID:Vertex AI Search 資料儲存庫的 ID。
  3. 查看輸出內容:

    1. 尋找 result 的值:

      • 如果值為 SUCCESS,表示資料符合一般規定,請繼續執行步驟 4。

      • 如果值為 WARNING,請繼續執行步驟 b。

      • 如果輸出內容中沒有 result,可能的原因有以下幾種:

        • 要求中的 PROJECT_IDDATA_STORE_ID 有誤。

        • 部分指標值無法使用。請在 6 小時後再試一次,或向客戶工程師尋求協助。

    2. 尋找運算式 (requirement.Condition.Expression):如果這個運算式評估為 false,表示資料有問題。

      指標的值位於 requirementCondition.metricResults.value 欄位中。警告門檻值位於 thresholdBindings.thresholdValues 欄位中。description 欄位可協助您瞭解指標的用途。

      舉例來說,doc_with_same_title_percentage 的值為 30.47,而 doc_with_same_title_percentage_threshold 的警告門檻為 1。資料儲存庫中的標題太多個相同,因此發生資料問題,需要進行調查。

  4. 如果推薦應用程式使用的模型和目標組合出現在這個表格中,您也需要呼叫檢查需求方法,並使用模型和目標的值進行更新:

    模型 目標 MODEL_OBJ
    你可能會喜歡的其他內容 轉換率 oyml/cvr
    為您推薦 轉換率 rfy/cvr
    更多類似內容 轉換率 mlt/cvr
    最熱門 轉換率 mp/cvr
    你可能會喜歡的其他內容 各工作階段的觀看時長 oyml/wdps
    為您推薦 各工作階段的觀看時長 rfy/wdps
    更多類似內容 各工作階段的觀看時長 mlt/wdps

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-GFE-SSL: yes" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/requirements:checkRequirement" \
    -d '{
          "location": "projects/PROJECT_ID/locations/global",
          "requirementType": "discoveryengine.googleapis.com/media_recs/MODEL_OBJ/warning",
          "resources": [
            {
              "labels": {
                "branch_id": "0",
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/Branch"
            },
            {
              "labels": {
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/DataStore"
            }
          ]
        }'
    

    更改下列內容:

    • PROJECT_ID: Google Cloud 專案的 ID。
    • DATA_STORE_ID:Vertex AI Search 資料儲存庫的 ID。
    • MODEL_OBJ:請參閱上表,為推薦應用程式選擇正確的值。
  5. 查看輸出內容:

    1. 尋找 result 的值:

      • 如果值為 SUCCESS,表示資料已足夠。

      • 如果值為 WARNING,請繼續執行步驟 b。

      • 如果輸出內容中沒有 result,可能的原因有以下幾種:

        • 要求中的 PROJECT_IDDATA_STORE_ID 有誤。

        • 部分指標值無法使用。請在 6 小時後再試一次,或向客戶工程師尋求協助。

    2. 查看運算式 (requirement.Condition.Expression)。如果這個運算式評估為 false,表示資料有問題。

      指標的值可在 requirementCondition.metricResults.value 欄位中找到,警告閾值值則位於 thresholdBindings.thresholdValues 欄位中。description 欄位可協助您瞭解指標的用途。