如要設定相似搜尋的索引,您必須設定下列欄位。
如需設定索引的操作說明,請參閱「設定索引參數」。
NearestNeighborSearch
欄位 | |
---|---|
contentsDeltaUri |
允許插入、更新或刪除 Vector Search 如果您在呼叫 |
isCompleteOverwrite |
如果在呼叫 |
config |
Vector Search |
NearestNeighborSearchConfig
欄位 | |
---|---|
dimensions |
這是必要旗標,輸入向量的維度數量。僅用於稠密嵌入。 |
approximateNeighborsCount |
如果使用樹狀 AH 演算法,則為必要屬性。 執行確切重新排序之前,要透過近似搜尋尋找的預設鄰點數量。精確重新排序是一種程序,其中會使用較耗時的距離計算,重新排序近似搜尋演算法傳回的結果。 |
ShardSize |
ShardSize
每個分割區的大小。索引資料量大時,系統會根據指定的分割大小進行分割。在服務期間,每個區塊都會在個別節點上提供服務,並獨立調整。 |
distanceMeasureType |
最鄰近搜尋所使用的距離度量。 |
featureNormType |
要針對各個向量執行的正規化類型。 |
algorithmConfig |
oneOf:
Vector Search 用於高效率搜尋的演算法設定。僅用於稠密嵌入。
|
DistanceMeasureType
列舉 | |
---|---|
SQUARED_L2_DISTANCE |
歐幾里得 (L2) 距離 |
L1_DISTANCE |
曼哈頓 (L1) 距離 |
DOT_PRODUCT_DISTANCE |
預設值。定義為點積的負值。 |
COSINE_DISTANCE |
餘弦距離。強烈建議您使用 DOT_PRODUCT_DISTANCE + UNIT_L2_NORM,而不要使用 COSINE 距離。我們的演算法已針對 DOT_PRODUCT 距離進行最佳化,如將點積距離與 UNIT_L2_NORM 搭配使用,在數學上就等同於餘弦距離,並能產生相同的排名。 |
ShardSize
列舉 | |
---|---|
SHARD_SIZE_SMALL |
每個分割區 2 GiB |
SHARD_SIZE_MEDIUM |
每個分割區 20 GiB |
SHARD_SIZE_LARGE |
每個分割區 50 GiB |
FeatureNormType
列舉 | |
---|---|
UNIT_L2_NORM |
單位 L2 正規化類型。 |
NONE |
預設值。未指定規格化類型。 |
TreeAhConfig
這些是 tree-AH 演算法要選取的欄位。
欄位 | |
---|---|
fractionLeafNodesToSearch |
double |
分葉節點的預設比率,任何查詢都有可能因此而經搜尋。必須介於 0.0 到 1.0 之間 (不含頭尾值)。如未設定,則預設值為 0.05。 | |
leafNodeEmbeddingCount |
int32 |
每個分葉節點的嵌入項目數量。如未設定,則預設值為 1000。 | |
leafNodesToSearchPercent |
int32 |
已淘汰,請改用 fractionLeafNodesToSearch 。分葉節點的預設比率,任何查詢都有可能因此而經搜尋。必須介於 1 到 100 之間 (含 1 和 100)。如未設定,則預設值為 10 (代表 10%)。 |
BruteForceConfig
這個選項會針對每項查詢,在資料庫中實作標準線性搜尋。沒有可設定的欄位可用於暴力搜尋。如要選取此演算法,請將 BruteForceConfig
的空物件傳遞至 algorithmConfig
。