Vertex AI RAG 引擎中的向量資料庫選項

本頁面將介紹 Vertex AI RAG Engine 支援的向量資料庫。您也可以瞭解如何將向量資料庫 (向量儲存庫) 連結至 RAG 語料庫。

向量資料庫在 RAG 應用程式擷取功能中扮演關鍵角色。向量資料庫提供專用方式,可儲存及查詢向量嵌入項目,也就是文字或其他資料的數學表示法,可擷取語意和關係。有了向量嵌入功能,RAG 系統就能快速且準確地在龐大的知識庫中找到最相關的資訊,即使是複雜或細微的查詢也沒問題。結合嵌入模型後,向量資料庫可克服 LLM 的限制,提供更準確、相關且完整的回覆。

支援的向量資料庫

建立 RAG 語料庫時,Vertex AI RAG Engine 會提供企業級 RagManagedDb 做為預設向量資料庫,無須額外佈建或管理。RagManagedDb 提供 KNN 和 ANN 搜尋選項,並允許切換至基本層級,以便快速進行原型設計和實驗。如要進一步瞭解如何在 RagManagedDb 上選擇擷取策略或更新層級,請參閱「使用 RagManagedDb 搭配 RAG」。如要讓 Vertex AI RAG Engine 自動為您建立及管理向量資料庫,請參閱「建立 RAG 語料庫」。

除了預設的 RagManagedDb,Vertex AI RAG 引擎還可讓您在 RAG 語料庫中佈建及使用向量資料庫。在這種情況下,您必須負責向量資料庫的生命週期和可擴充性。

比較向量資料庫選項

本表列出 Vertex AI RAG Engine 支援的向量資料庫選項,並提供連結至說明如何在 RAG 語料庫中使用向量資料庫的頁面。

向量資料庫 優點 最適合用於   缺點 支援的距離指標 搜尋類型 推出階段
RagManagedDb (預設) 是區域分散的可擴充資料庫服務,可提供極高的一致性和高可用性,並可用於向量搜尋。 easy simple fast quick
  • 無須進行設定。
  • 適合企業規模和小型用途。
  • 一致性極高。
  • 高可用性。
  • 低延遲。
  • 非常適合處理交易工作負載。
  • 產生大量文件。
  • 建構企業級 RAG。
  • 快速開發概念驗證。
  • 提供低佈建和維護負擔。
  • 搭配聊天機器人使用。
  • 建構 RAG 應用程式。
  • 為獲得最佳回憶率,ANN 功能要求在資料發生重大變更後重建索引。
cosine KNN (預設) 和 ANN 預覽
Vector Search 是 Vertex AI 中的向量資料庫服務,可針對機器學習工作進行最佳化。
  • 與其他 Google Cloud 服務整合。
  • Google Cloud 基礎架構可提供擴充性和可靠性。
  • 採用即付即用定價模式。
  • 產生大量文件。
  • 建構企業級 RAG。
  • 管理向量資料庫基礎架構。
  • 現有 Google Cloud 客戶或任何想使用多項 Google Cloud 服務的使用者。
  • 更新不會立即反映。
  • 使用 Google Cloud受制於相同供應商。
  • 視用途而定,可能會更貴。
cosine

dot-product
ANN 通用版
Vertex AI 特徵儲存庫是一種代管服務,可用來整理、儲存及提供機器學習特徵。
  • 可與 Vertex AI 和其他 Google Cloud 服務整合。
  • Google Cloud 基礎架構可提供擴充性和可靠性。
  • 運用現有的 BigQuery 基礎架構。
  • 產生大量文件。
  • 建構企業級 RAG。
  • 管理向量資料庫基礎架構。
  • 現有 Google Cloud 客戶或想使用多項 Google Cloud 服務的客戶。
  • 只有在手動同步後,變更才會顯示在線上商店中。
  • 使用 Google Cloud受制於相同供應商。
cosine

dot-product

L2 squared
ANN 預覽
Weaviate 是開放原始碼向量資料庫,具有彈性和模組化特性。
  • 支援各種資料類型,並提供內建的圖表功能。
  • 提供開放原始碼和充滿活力的社群。
  • 高度靈活且可自訂。
  • 支援各種資料類型和模組,適用於不同的模態,例如文字和圖片。
  • 可選擇 Google Cloud、AWS 和 Azure 等雲端服務供應商。
  • 產生大量文件。
  • 建構企業級 RAG。
  • 管理向量資料庫基礎架構。
  • 現有 Weaviate 客戶。
  • 更新不會立即反映。
  • 設定和管理程序可能較為複雜。
  • 成效可能會因設定而異。
cosine

dot-product

L2 squared

hamming

manhattan
ANN + 混合搜尋支援 預覽
Pinecone 是全代管的雲端原生向量資料庫,專為高效能相似度搜尋而設計。
  • 快速上手。
  • 具備優異的擴充性和效能。
  • 專注於向量搜尋,並使用篩選和中繼資料搜尋等進階功能。
  • 可選擇 Google Cloud、AWS 和 Azure 等雲端服務供應商。
  • 產生大量文件。
  • 建構企業級 RAG。
  • 管理向量資料庫基礎架構。
  • 現有的 Pinecone 客戶。
  • 更新不會立即反映。
  • 可能比其他選項更為昂貴。
  • 配額和限制會限制規模和效能。
  • 對底層基礎架構的控管程度有限。
cosine

euclidean

dot-product
ANN 通用版

後續步驟