Vertex AI 特徵儲存庫 (舊版) 提供集中式存放區,可供整理、儲存及提供機器學習特徵。組織可透過中央特徵儲存庫,大規模分享、探索及重複使用機器學習功能,進而加快開發及部署新機器學習應用程式的速度。
Vertex AI 特徵儲存庫 (舊版) 是全代管解決方案,可管理及擴充儲存空間和運算資源等基礎架構。這項解決方案可讓資料科學家專注於特徵運算邏輯,不必擔心將特徵部署到正式環境時會遇到哪些挑戰。
Vertex AI 特徵儲存庫 (舊版) 是 Vertex AI 的整合部分,您可以單獨使用 Vertex AI 特徵儲存庫 (舊版),也可以將其納入 Vertex AI 工作流程。舉例來說,您可以從 Vertex AI 特徵儲存庫 (舊版) 擷取資料,在 Vertex AI 中訓練自訂或 AutoML 模型。
Vertex AI 特徵儲存庫 (舊版) 是 Vertex AI 特徵儲存庫的前身。如要進一步瞭解 Vertex AI 特徵儲存庫,請參閱 Vertex AI 特徵儲存庫說明文件。
總覽
使用 Vertex AI 特徵儲存庫 (舊版) 建立及管理特徵儲存庫、實體類型和特徵。特徵儲存庫是特徵及其值的頂層容器。設定特徵儲存庫後,獲准的使用者即可新增及分享特徵,不必尋求額外的工程支援。使用者可以定義特徵,然後從各種資料來源匯入 (擷取) 特徵值。進一步瞭解 Vertex AI 特徵儲存庫 (舊版) 資料模型和資源。
任何獲得授權的使用者都能從特徵商店搜尋及擷取值。舉例來說,您可以找出特徵,然後進行批次匯出,取得用於建立機器學習模型的訓練資料。您也可以即時擷取特徵值,快速執行線上預測。
優點
使用 Vertex AI 特徵儲存庫 (舊版) 前,您可能已計算特徵值,並將其儲存在各種位置,例如 BigQuery 中的資料表,以及 Cloud Storage 中的檔案。此外,您可能已建構及管理個別解決方案,用於儲存及使用特徵值。相較之下,Vertex AI 特徵儲存庫 (舊版) 提供統一的解決方案,可處理批次和線上儲存作業,以及提供機器學習特徵。以下各節將詳細說明 Vertex AI 特徵儲存庫 (舊版) 的優點。
在機構內共用功能
如果您在特徵商店中產生特徵,可以快速與他人共用,用於訓練或提供作業。團隊不必為不同的專案或用途重新設計功能,此外,由於您可以從中央存放區管理及提供功能,因此能確保整個機構的一致性,並減少重複作業,尤其是高價值功能。
Vertex AI 特徵儲存庫 (舊版) 提供搜尋和篩選功能,方便其他人發掘及重複使用現有特徵。您可以查看各項功能的相關中繼資料,判斷功能的品質和使用模式。舉例來說,您可以查看特徵的有效值實體比例 (也稱為「特徵涵蓋範圍」),以及特徵值的統計分布。
代管解決方案,可大規模放送線上廣告
Vertex AI 特徵儲存庫 (舊版) 提供代管解決方案,可線上提供特徵 (低延遲提供),這對於及時進行線上預測至關重要。您不必建構及運作低延遲資料服務基礎架構,Vertex AI 特徵儲存庫 (舊版) 會為您完成這項工作,並視需要擴充。您會編寫產生特徵的邏輯,但會卸載提供特徵的作業。所有這些管理作業都包含在內,可減少建構新功能時的阻力,讓資料科學家專心工作,不必擔心部署問題。
降低訓練/應用偏差
當您在正式環境中使用的特徵資料分布,與用於訓練模型的特徵資料分布不同時,就會發生訓練/應用偏差。這種偏移通常會導致模型在訓練期間的效能,與實際工作環境中的效能有所差異。以下範例說明 Vertex AI 特徵儲存庫 (舊版) 如何解決訓練/服務偏差的潛在來源:
- Vertex AI 特徵儲存庫 (舊版) 可確保特徵值只會匯入特徵儲存庫一次,且訓練和提供模型時都會重複使用相同值。如果沒有特徵商店,您可能會在訓練和服務之間,使用不同的程式碼路徑產生特徵。因此,訓練和提供模型時,特徵值可能有所不同。
- Vertex AI 特徵儲存庫 (舊版) 提供時間點查詢功能,可擷取用於訓練的歷史資料。透過這些查詢,您就能只擷取預測前可用的特徵值,而非預測後的值,藉此減少資料外洩的風險。
如要進一步瞭解如何偵測訓練/服務偏差,請參閱「查看特徵值異常」。
偵測偏移
Vertex AI 特徵儲存庫 (舊版) 可協助您偵測特徵資料分布隨時間發生的重大變化,也就是所謂的漂移。Vertex AI 特徵儲存庫 (舊版) 會持續追蹤匯入特徵儲存庫的特徵值分布情形。特徵漂移增加時,您可能需要重新訓練使用受影響特徵的模型。如要進一步瞭解如何偵測漂移,請參閱「查看特徵值異常狀況」。
配額與限制
Vertex AI 特徵儲存庫 (舊版) 會強制執行配額和限制,協助您設定用量限制來管理資源,並預防用量意外暴增的情況,進而保障 Google Cloud 使用者社群的權益。為避免遇到非預期的限制,請在「配額和限制」頁面中查看 Vertex AI 特徵儲存庫 (舊版) 配額。舉例來說,Vertex AI 特徵儲存庫 (舊版) 會針對線上服務節點數量和每分鐘可提出的線上服務要求數量設定配額。
資料保留
Vertex AI 特徵儲存庫 (舊版) 會保留特徵值,直到資料保留期限為止。這項限制是根據與特徵值相關聯的時間戳記,而非值匯入的時間。Vertex AI 特徵儲存庫 (舊版) 排程會刪除時間戳記超過上限的值。
定價
Vertex AI 特徵儲存庫 (舊版) 的價格取決於多項因素,例如您儲存的資料量,以及使用的特徵儲存庫線上節點數量。建立 featurestore 後,系統就會立即開始收費。詳情請參閱 Vertex AI 特徵儲存庫 (舊版) 定價。
後續步驟
- 瞭解 Vertex AI 特徵儲存庫 (舊版) 的資料模型和資源。
- 瞭解如何設定專案,以及為 Vertex AI 特徵儲存庫 (舊版) 設定 Identity and Access Management 權限。
- 在「配額與限制」頁面查看 Vertex AI 特徵儲存庫 (舊版) 配額。