本頁面將介紹 Vertex AI RAG Engine 支援的向量資料庫。您也可以瞭解如何將向量資料庫 (向量儲存庫) 連結至 RAG 語料庫。
向量資料庫在 RAG 應用程式擷取功能中扮演關鍵角色。向量資料庫提供專用方式,可儲存及查詢向量嵌入項目,也就是文字或其他資料的數學表示法,可擷取語意和關係。有了向量嵌入功能,RAG 系統就能快速且準確地在龐大的知識庫中找到最相關的資訊,即使是複雜或細微的查詢也沒問題。結合嵌入模型後,向量資料庫可克服 LLM 的限制,提供更準確、相關且完整的回覆。
支援的向量資料庫
建立 RAG 語料庫時,Vertex AI RAG Engine 會提供企業級 RagManagedDb
做為預設向量資料庫,無須額外佈建或管理。RagManagedDb
提供 KNN 和 ANN 搜尋選項,並允許切換至基本層級,以便快速進行原型設計和實驗。如要進一步瞭解如何在 RagManagedDb
上選擇擷取策略或更新層級,請參閱「使用 RagManagedDb
搭配 RAG」。如要讓 Vertex AI RAG Engine 自動為您建立及管理向量資料庫,請參閱「建立 RAG 語料庫」。
除了預設的 RagManagedDb
,Vertex AI RAG 引擎還可讓您在 RAG 語料庫中佈建及使用向量資料庫。在這種情況下,您必須負責向量資料庫的生命週期和可擴充性。
比較向量資料庫選項
本表列出 Vertex AI RAG Engine 支援的向量資料庫選項,並提供連結至說明如何在 RAG 語料庫中使用向量資料庫的頁面。
向量資料庫 | 優點 | 最適合用於 | 缺點 | 支援的距離指標 | 搜尋類型 | 推出階段 |
---|---|---|---|---|---|---|
RagManagedDb (預設) 是區域分散的可擴充資料庫服務,可提供極高的一致性和高可用性,並可用於向量搜尋。
easy simple fast quick |
|
|
|
cosine |
KNN (預設) 和 ANN | 預覽 |
Vector Search 是 Vertex AI 中的向量資料庫服務,可針對機器學習工作進行最佳化。 |
|
|
|
cosine dot-product |
ANN | 通用版 |
Vertex AI 特徵儲存庫是一種代管服務,可用來整理、儲存及提供機器學習特徵。 |
|
|
|
cosine dot-product L2 squared |
ANN | 預覽 |
Weaviate 是開放原始碼向量資料庫,具有彈性和模組化特性。 |
|
|
|
cosine dot-product L2 squared hamming manhattan |
ANN + 混合搜尋支援 | 預覽 |
Pinecone 是全代管的雲端原生向量資料庫,專為高效能相似度搜尋而設計。 |
|
|
|
cosine euclidean dot-product |
ANN | 通用版 |
後續步驟
- 如要建立 RAG 語料庫,請參閱「建立 RAG 語料庫範例」。
- 如要列出所有 RAG 語料庫,請參閱「列出 RAG 語料庫的範例」。