索引設定參數

如要設定相似搜尋的索引,您必須設定下列欄位。

如需設定索引的操作說明,請參閱「設定索引參數」。

欄位
contentsDeltaUri

string

允許插入、更新或刪除 Vector Search Index 的內容。字串必須是有效的 Cloud Storage 目錄路徑,例如 gs://BUCKET_NAME/PATH_TO_INDEX_DIR/

如果您在呼叫 IndexService.UpdateIndex 時設定此欄位,則在同一個呼叫中,系統無法同時更新其他 Index 欄位。瞭解 如何建立個別資料檔案的結構

isCompleteOverwrite

boolean

如果在呼叫 IndexService.UpdateIndex 時,此欄位與 contentsDeltaUri 一併設定,Index 的現有內容就會由 contentsDeltaUri 的資料取代。將這個欄位設為 true 時,整個索引會完全覆寫為您提供的新中繼資料檔案。

config

NearestNeighborSearchConfig

Vector Search Index 的設定。

NearestNeighborSearchConfig

欄位
dimensions

int32

這是必要旗標,輸入向量的維度數量。僅用於稠密嵌入。

approximateNeighborsCount

int32

如果使用樹狀 AH 演算法,則為必要屬性。

執行確切重新排序之前,要透過近似搜尋尋找的預設鄰點數量。精確重新排序是一種程序,其中會使用較耗時的距離計算,重新排序近似搜尋演算法傳回的結果。

ShardSize ShardSize

每個分割區的大小。索引資料量大時,系統會根據指定的分割大小進行分割。在服務期間,每個區塊都會在個別節點上提供服務,並獨立調整。

distanceMeasureType

DistanceMeasureType

最鄰近搜尋所使用的距離度量。

featureNormType

FeatureNormType

要針對各個向量執行的正規化類型。

algorithmConfig oneOf:

Vector Search 用於高效率搜尋的演算法設定。僅用於稠密嵌入。

  • TreeAhConfig:使用 tree-AH 演算法的設定選項。詳情請參閱這篇網誌文章「使用 TensorFlow Recommenders 和向量搜尋擴大深度擷取功能
  • BruteForceConfig:這個選項會針對每個查詢在資料庫中實作標準線性搜尋。沒有可設定的欄位來進行暴力搜尋。如要選取這個演算法,請為 BruteForceConfig 傳遞空物件。

DistanceMeasureType

列舉
SQUARED_L2_DISTANCE 歐幾里得 (L2) 距離
L1_DISTANCE 曼哈頓 (L1) 距離
DOT_PRODUCT_DISTANCE 預設值。定義為點積的負值。
COSINE_DISTANCE 餘弦距離。強烈建議您使用 DOT_PRODUCT_DISTANCE + UNIT_L2_NORM,而不要使用 COSINE 距離。我們的演算法已針對 DOT_PRODUCT 距離進行最佳化,如將點積距離與 UNIT_L2_NORM 搭配使用,在數學上就等同於餘弦距離,並能產生相同的排名。

ShardSize

列舉
SHARD_SIZE_SMALL 每個分割區 2 GiB
SHARD_SIZE_MEDIUM 每個分割區 20 GiB
SHARD_SIZE_LARGE 每個分割區 50 GiB

FeatureNormType

列舉
UNIT_L2_NORM 單位 L2 正規化類型。
NONE 預設值。未指定規格化類型。

TreeAhConfig

這些是 tree-AH 演算法要選取的欄位。

欄位
fractionLeafNodesToSearch double
分葉節點的預設比率,任何查詢都有可能因此而經搜尋。必須介於 0.0 到 1.0 之間 (不含頭尾值)。如未設定,則預設值為 0.05。
leafNodeEmbeddingCount int32
每個分葉節點的嵌入項目數量。如未設定,則預設值為 1000。
leafNodesToSearchPercent int32
已淘汰,請改用 fractionLeafNodesToSearch

分葉節點的預設比率,任何查詢都有可能因此而經搜尋。必須介於 1 到 100 之間 (含 1 和 100)。如未設定,則預設值為 10 (代表 10%)。

BruteForceConfig

這個選項會針對每項查詢,在資料庫中實作標準線性搜尋。沒有可設定的欄位可用於暴力搜尋。如要選取此演算法,請將 BruteForceConfig 的空物件傳遞至 algorithmConfig