BigQuery ML 模型權重簡介

本文說明 BigQuery ML 如何支援機器學習 (ML) 模型的模型權重可發現性。

機器學習模型是在訓練資料上執行機器學習演算法後儲存的構件。這個模型代表預測所需的規則、數字和任何其他演算法專屬資料結構。以下列舉幾個例子:

  • 線性迴歸模型由具有特定值的係數向量組成。
  • 決策樹模型由一或多個包含特定值的 if-then 陳述式樹狀結構組成。
  • 深度神經網路模型由圖形結構組成,其中包含具有特定值的向量或權重矩陣。

在 BigQuery ML 中,模型權重一詞用來描述模型的組成元件。

如要瞭解每個模型類型支援的 SQL 陳述式和函式,請參閱「每個模型的端對端使用者歷程」。

BigQuery ML 中的模型權重功能

BigQuery ML 提供多種函式,可用於擷取不同模型的模型權重。

模型類別 模型類型 模型權重函式 功能的作用
監督式模型 線性與邏輯迴歸 ML.WEIGHTS 擷取特徵係數和截距。
非監督式模型 Kmeans ML.CENTROIDS 擷取所有群集中心的功能係數。
矩陣分解 ML.WEIGHTS 擷取所有潛在因數的權重。它們代表兩個已分解的矩陣:使用者矩陣和項目矩陣。
PCA ML.PRINCIPAL_COMPONENTS 擷取所有主成分 (也稱為特徵向量) 的特徵係數。
ML.PRINCIPAL_COMPONENT_INFO 擷取每個主成分的統計資料,例如特徵值。
時間序列模型 ARIMA_PLUS ML.ARIMA_COEFFICIENTS 擷取 ARIMA 模型的係數,用於模擬輸入時間序列的趨勢元件。如要瞭解其他元件 (例如時間序列中的季節性模式) 的相關資訊,請使用 ML.ARIMA_EVALUATE

BigQuery ML 不支援下列模型類型的模型權重函式:

如要查看所有模型類型 (AutoML Tables 模型除外) 的權重,請將模型從 BigQuery ML 匯出至 Cloud Storage。接著,您可以使用 XGBoost 程式庫將強化樹狀圖和隨機森林模型的樹狀結構視覺化,或是使用 TensorFlow 程式庫將深度神經網路和寬廣深度模型的圖形結構視覺化。目前沒有方法可取得 AutoML Tables 模型的模型權重資訊。

如要進一步瞭解如何匯出模型,請參閱 EXPORT MODEL 陳述式匯出 BigQuery ML 模型以進行線上預測