特徵供應

本文件說明可用於 BigQuery ML 模型訓練和推論的功能選項。無論選擇哪種選項,您都必須先將功能儲存在 BigQuery 資料表中。

時間點正確性

用於訓練模型的資料通常會內建時間依賴性。建立時間敏感特徵的特徵資料表時,請加入時間戳記欄,代表每個資料列在特定時間的實際特徵值。接著,您可以在查詢這些地圖資料表的資料時使用時間點查詢函式,確保在訓練和服務之間不會發生資料外洩。這項程序可確保時間點正確性。

請使用下列函式,在擷取時間敏感型地圖項目時指定時間點截止時間:

在 BigQuery ML 中提供功能

如要在 BigQuery ML 中訓練模型及執行批次推論作業,您可以使用「時間點正確性」一節所述的其中一個時間點查詢函式來擷取特徵。您可以將這些函式加入訓練時 CREATE MODEL 陳述式的 query_statement 子句,或是放送時適當的資料表值函式 (例如 ML.PREDICT) 的 query_statement 子句。

使用 Vertex AI 特徵儲存庫提供特徵

如要為在 Vertex AI 中註冊的 BigQuery ML 模型提供特徵,您可以使用 Vertex AI 特徵儲存庫。Vertex AI 特徵儲存庫會在 BigQuery 的特徵資料表上運作,以低延遲的方式管理及提供特徵。您可以使用線上服務即時擷取特徵,用於線上預測,也可以使用離線服務擷取特徵,用於模型訓練。

如要進一步瞭解如何準備 BigQuery 特徵資料,以便在 Vertex AI 特徵儲存庫中使用,請參閱「準備資料來源」。