適用於 AutoML 文字使用者的 Gemini

AutoML Text 已淘汰。 本頁面提供 AutoML Text 和 Gemini 的比較,協助 AutoML Text 使用者瞭解如何使用 Gemini。

請查看適用於您用途的表格,並瞭解可能影響工作流程的變更。

一般使用情形

這些差異適用於所有 Gemini 使用者。

作業 AutoML text Gemini
訓練資料格式 除了文字實體擷取功能外,您可以使用 CSV 或 JSON Lines 檔案,內含內嵌文字片段或參照 TXT 類型的文件。實體擷取功能僅支援 JSON Lines 檔案。 您只能使用 JSON Line 檔案。檔案中的每一行都應代表單一訓練範例。您可以下載範例資料集,微調 Gemini 模型。檔案應儲存在 Cloud Storage 中。
資料集註解 註解會分組為 AnnotationSet 物件。 您可以對同一個資料集使用不同的註解集。 Gemini 不適用於資料集註解。
資料集匯入 您可以在 CSV 的選用資料欄中指定 ML 用途值,與資料位於同一列;或在 JSON Lines 中以標記形式指定,與資料位於同一 JSON 物件。如果您未指定機器學習用途值,系統會自動分割資料,用於訓練、測試和驗證。
如要進行情緒分析,CSV 檔案的每列最後一個資料欄必須包含情緒最大值。
您需要兩個不同的 JSONL 檔案,一個用於訓練,另一個用於驗證。驗證檔案為選填項目。驗證檔案應包含 10 到 256 個範例。
儲存空間費用 建立資料集時,資料會載入專案的 Cloud Storage。之後會向你收取這個儲存空間的使用費。 瞭解詳情 建立資料集時,資料會載入專案的 Cloud Storage。之後會向你收取這個儲存空間的使用費。 瞭解詳情
資料標籤 你可以使用網址提供標籤說明。註解是 Dataset 物件的一部分,無法使用 API 操作。 Gemini 不適用資料標籤。
模型部署 您會建立 Endpoint 物件,提供用於提供線上推論的資源。接著將模型部署至端點。 如要要求推論,請呼叫 predict() 方法。 微調 Gemini 後,模型會儲存在 Vertex AI Model Registry 中,並自動建立端點。您可以使用 Python SDK、REST API 或控制台,要求從微調模型進行線上推論。您可先擷取微調端點,然後使用 generate_content() 方法要求推論。
使用專案編號或專案 ID project-numberproject-id 都可在 Vertex AI 中運作。 Gemini 使用 project-id
可信度分數 AutoML 文字支援信賴度分數。 Gemini 不支援信賴度分數。

API 使用者

如要進一步瞭解 API,請參閱 Vertex AI Generative AI Tuning API 參考說明文件

作業或實體 AutoML text Gemini
建立模型 您會建立 TrainingPipeline 物件,該物件會傳回訓練工作。 您建立 Supervised Fine Tuning job,該工作會傳回微調工作。
使用用戶端程式庫 每個 API 資源都有不同的 API 用戶端。 您可以使用 Python SDK、REST API 或控制台,為 Gemini 建立監督式微調工作。
要求推論 您可以在 Endpoint 資源上呼叫 predict() 方法,要求推論。 如要要求推論,請先擷取微調後的端點,然後使用 generate_content 方法。
線上推論端點 在下列指令中,將 REGION 替換為推論模型所在的區域。
REGION-aiplatform.googleapis.com。 例如:
us-central1-aiplatform.googleapis.com
在下列程式碼中,請將 TUNING_JOB_REGION 替換為執行微調工作的區域。
TUNING_JOB_REGION-aiplatform.googleapis.com。 例如:
us-central1-aiplatform.googleapis.com
結構定義和定義檔 部分要求和回應欄位定義於結構定義和定義檔案中。資料格式是使用預先定義的結構定義檔案定義。這可讓 API 和資料格式更具彈性。 要求內文模型參數回應內文與未調整的 Gemini 模型相同。請參閱要求範例
主機名稱 aiplatform.googleapis.com aiplatform.googleapis.com
區域主機名稱 這是必要旗標,例如:
us-central1-aiplatform.googleapis.com
這是必要旗標,例如:
us-central1-aiplatform.googleapis.com

後續步驟