監控已部署的索引

Vertex AI 提供兩項指標,用於監控已部署索引的 IndexEndpoint

  • aiplatform.googleapis.com/matching_engine/current_shards

    DeployedIndex 的分割數量。當資料新增和刪除時,向量搜尋引擎會自動重新分割索引,以便發揮最佳效能。這項指標代表已部署索引的目前分片數量。

  • aiplatform.googleapis.com/matching_engine/current_replicas

    DeployedIndex 使用的活躍複本伺服器總數。為了配合查詢量,Vector Search 會根據部署索引時指定的最低和最高副本設定,自動關閉或啟用副本伺服器。

    如果索引包含多個區塊,則可使用不同數量的複本伺服器提供每個區塊的服務。這項指標是指定索引的所有分片中副本伺服器的總數。

後續步驟