Vertex AI 可讓您透過簡單的程序和介面,使用表格資料執行機器學習。您可以為表格資料問題建立下列模型類型:
- 「二元分類」模型可預測二元成果 (兩個類別之一)。這個模型類型可用於是非題。舉例來說,您可能想建構二元分類模型,預測客戶是否會購買訂閱。一般來說,二元分類問題需要的資料量少於其他模型類型。
- 「多元分類」模型可由三個以上的分離類別預測一種類別。請使用這個模型類型進行分類。舉例來說,零售商可能會想建構多元分類模型,將客戶區分為不同人物角色。
- 「迴歸」模型可預測連續值。舉例來說,如果您是零售商,可能會想建構迴歸模型,預測客戶下個月的消費金額。
- 預測模型可預測一連串值。舉例來說,身為零售商,您可能會想預測未來 3 個月的產品每日需求,以便提前適當地備妥產品庫存。
如要瞭解如何使用表格資料進行機器學習,請參閱「表格資料簡介」。如要進一步瞭解 Vertex AI 解決方案,請參閱「用於分類和迴歸的 Vertex AI 解決方案」和「用於預測的 Vertex AI 解決方案」。
公平性注意事項
Google 致力遵循負責任的 AI 做法。為此,我們設計 AutoML 等 ML 產品時,會以「公平性」和「以人為本的機器學習」等核心原則為依歸。如要進一步瞭解建構自有 ML 系統時,如何減輕偏見的最佳做法,請參閱包容性機器學習指南 - AutoML。
分類和迴歸的 Vertex AI 解決方案
Vertex AI 提供下列分類和迴歸解決方案:
端對端 AutoML 的資料表工作流程
端對端 AutoML 的 Tabular 工作流程是用於分類和迴歸工作的完整 AutoML 管道。這項功能與 AutoML API 類似,但可讓您選擇要控制和自動執行的項目。您可以為管道中的每個步驟設定控制項,而非為整個管道設定控制項。管道控制項包括:
- 資料分割
- 特徵工程
- 架構搜尋
- 模型訓練
- 模型集成
- 模型精煉
優點
- 支援大型資料集,大小為數 TB,最多可包含 1000 個欄。
- 您可以限制架構類型的搜尋空間或略過架構搜尋,提高穩定性並縮短訓練時間。
- 您可以手動選取用於訓練和架構搜尋的硬體,提升訓練速度。
- 可讓您透過蒸餾或變更集合大小,縮減模型大小並改善延遲時間。
- 您可以在強大的管道圖表介面中檢查每個 AutoML 元件,查看轉換後的資料表、評估的模型架構,以及更多詳細資料。
- 每個 AutoML 元件都享有更高的彈性和透明度,例如可自訂參數、硬體、查看程序狀態和記錄等。
如要進一步瞭解 Tabular Workflows,請參閱「Vertex AI 中的 Tabular Workflows」。如要進一步瞭解端對端 AutoML 的 Tabular Workflow,請參閱「端對端 AutoML 的 Tabular Workflow」。
TabNet 適用的 Tabular Workflow
TabNet 適用的 Tabular Workflow 是用於訓練分類或迴歸模型的管道。TabNet 會運用順序注意力,選擇每個決策步驟要以哪些特徵進行推論。這麼做可提升解讀性,並提高學習效率,因為學習能力會用於最顯著的特徵。
優點
- 根據資料集大小、推論類型和訓練預算,自動選取適當的超參數搜尋空間。
- 已整合 Vertex AI。經過訓練的模型是 Vertex AI 模型。您可以立即執行批次推論,或部署模型以進行線上推論。
- 提供內在的模型可解釋性。您可以深入瞭解 TabNet 用於做出決策的特徵。
- 支援 GPU 訓練。
如要進一步瞭解 Tabular Workflows,請參閱「Vertex AI 中的 Tabular Workflows」。如要進一步瞭解 TabNet 適用的 Tabular Workflow,請參閱「TabNet 適用的 Tabular Workflow」。
廣度和深度學習適用的 Tabular Workflow
廣度和深度學習適用的 Tabular Workflow 是用來訓練分類或迴歸模型的管道。「廣度和深度」會一同訓練廣度線性模型和深層類神經網路,兼具記憶和一般化的能力。在某些線上實驗中,結果顯示與僅 wide 和僅 deep 模型相比,Wide & Deep 大幅提升了 Google 商店應用程式獲取次數。
優點
- 已整合 Vertex AI。經過訓練的模型是 Vertex AI 模型。您可以立即執行批次推論,或部署模型以進行線上推論。
如要進一步瞭解 Tabular Workflows,請參閱「Vertex AI 中的 Tabular Workflows」。如要進一步瞭解廣度和深度學習適用的 Tabular Workflow,請參閱「廣度和深度學習適用的 Tabular Workflow」。
使用 AutoML 進行分類和迴歸
Vertex AI 提供整合式全代管管道,可用於端對端分類或迴歸工作。Vertex AI 會搜尋最佳超參數組合,並使用多組超參數訓練多個模型,然後從一組頂尖模型中建立單一最終模型。Vertex AI 會考量神經網路和提升樹狀圖的模型類型。
優點
- 操作簡單:系統會為您選擇模型類型、模型參數和硬體。
詳情請參閱「分類和迴歸總覽」。
Vertex AI 預測解決方案
Vertex AI 提供下列預測解決方案:
預測的表格工作流程
預測的「表格工作流程」是預測工作完整的管道。這項工具與 AutoML API 類似,但可讓您選擇要控制和自動化的項目。您可以為管道中的每個步驟設定控制項,而非為整個管道設定控制項。管道控制項包括:
- 資料分割
- 特徵工程
- 架構搜尋
- 模型訓練
- 模型集成
優點
- 支援大型資料集,大小上限為 1 TB,最多可包含 200 個欄。
- 您可以限制架構類型的搜尋空間或略過架構搜尋,提高穩定性並縮短訓練時間。
- 您可以手動選取用於訓練和架構搜尋的硬體,提升訓練速度。
- 您可以變更集合大小,縮減模型大小並改善延遲時間。
- 您可以在強大的管道圖表介面中檢查每個元件,查看轉換後的資料表、評估的模型架構,以及更多詳細資料。
- 每個元件都會享有更高的彈性和透明度,例如能夠自訂參數、硬體、查看程序狀態和記錄等。
如要進一步瞭解 Tabular Workflows,請參閱「Vertex AI 中的 Tabular Workflows」。如要進一步瞭解預測的「表格工作流程」,請參閱「預測的『表格工作流程』」一文。
使用 AutoML 進行預測
Vertex AI 提供整合式全代管管道,可用於端對端預測工作。Vertex AI 會搜尋最佳超參數組合,使用多組超參數訓練多個模型,然後從多個頂尖模型的集合中建立單一最終模型。您可以選擇時序稠密編碼器 (TiDE)、時序融合轉換器 (TFT)、AutoML (L2L) 和 Seq2Seq+ 做為模型訓練方法。Vertex AI 只會將神經網路視為模型類型。
優點
- 使用簡單:系統會為您選擇模型參數和硬體。
詳情請參閱「預測總覽」。
使用 BigQuery ML ARIMA_PLUS 進行預測
BigQuery ML ARIMA_PLUS 是一種單變量預測模型。由於統計模型的訓練速度比以類神經網路為基礎的模型快,如果您需要快速執行多次模型訓練,或是需要以低成本基準來評估其他模型,建議您訓練 BigQuery ML ARIMA_PLUS 模型。
與 Prophet 一樣,BigQuery ML ARIMA_PLUS 會嘗試將每個時間序列分解為趨勢、季節和節日,並使用這些模型推論的匯總資料產生預測結果。不過,兩者之間有許多差異,其中之一是 BQML ARIMA+ 會使用 ARIMA 模擬趨勢元件,而 Prophet 會嘗試使用區塊邏輯或線性模型擬合曲線。
Google Cloud 提供管道,可訓練 BigQuery ML ARIMA_PLUS 模型,以及從 BigQuery ML ARIMA_PLUS 模型取得批次推論的管道。這兩個管道都是 Google Cloud 管道元件 (GCPC) 中的 Vertex AI 管道例項。
優點
- 使用簡單:系統會為您選擇模型參數和硬體。
- 快速:模型訓練可提供低成本基準,用於比較其他模型。
詳情請參閱「使用 ARIMA+ 進行預測」。
使用 Prophet 進行預測
Prophet 是 Meta 維護的預測模型。如要瞭解演算法的詳細資訊,請參閱 Prophet 論文;如要進一步瞭解程式庫,請參閱說明文件。
與 BigQuery ML ARIMA_PLUS 一樣,Prophet 會嘗試將每個時間序列分解為趨勢、季節和節日,並使用這些模型推論的匯總資料產生預測結果。不過,兩者有一個重要的差異,那就是 BQML ARIMA+ 會使用 ARIMA 模擬趨勢元件,而 Prophet 會嘗試使用區塊邏輯或線性模型擬合曲線。
Google Cloud 提供訓練 Prophet 模型的管道,以及從 Prophet 模型取得批次推論的管道。這兩個管道都是 Google Cloud 管道元件 (GCPC) 中的 Vertex AI 管道例項。
將 Prophet 與 Vertex AI 整合後,您可以執行以下操作:
- 使用 Vertex AI 的資料分割和時間窗口策略。
- 讀取儲存在 Cloud Storage 中的 BigQuery 資料表或 CSV 檔案中的資料。Vertex AI 預期每個資料列的格式與 Vertex AI 預測 相同。
雖然 Prophet 是多變量模型,但 Vertex AI 只支援單變量版本。
優點
- 彈性:您可以選用用於訓練的硬體,提升訓練速度
詳情請參閱「使用 Prophet 進行預測」。
後續步驟
- 瞭解如何使用表格資料進行機器學習。
- 瞭解如何運用 AutoML 進行分類和迴歸。
- 瞭解如何使用 AutoML 進行預測。
- 瞭解使用 Prophet 進行預測。
- 瞭解如何使用 BigQuery ML ARIMA_PLUS 進行預測。
- 瞭解表格式工作流程。