本頁面說明如何使用 Google Cloud 控制台或 Vertex AI API,從圖像資料集訓練 AutoML 物件偵測模型。
訓練 AutoML 模型
Google Cloud 控制台
在 Google Cloud 控制台的 Vertex AI 專區中,前往「Datasets」頁面。
按一下要用來訓練模型的資料集名稱,開啟資料集詳細資料頁面。
按一下「訓練新模型」。
選取訓練方法
「AutoML」AutoML。在「選擇模型使用位置」部分,選擇模型主機位置:
雲端、 邊緣或 Vertex AI Vision。按一下「繼續」。
輸入模型的名稱。
如要手動設定訓練資料的分割方式,請展開「進階選項」,然後選取資料分割選項。瞭解詳情。
按一下「開始訓練」。
模型訓練作業可能需要花費數小時,視資料的大小和複雜度以及您指定的訓練預算而定。您可以關閉這個分頁,稍後再返回查看。模型訓練完成後,您會收到電子郵件通知。
API
請選取下方對應您語言或環境的分頁:
REST
使用任何要求資料之前,請先替換以下項目:
- LOCATION:資料集所在的區域,以及建立模型的位置。例如:
us-central1
。 - PROJECT:您的專案 ID。
- TRAININGPIPELINE_DISPLAYNAME:必填。trainingPipeline 的顯示名稱。
- DATASET_ID:資料集的 ID 編號,用於訓練。
fractionSplit
:選用。機器學習使用資料時,可以採用多種分割選項之一。對於fractionSplit
,值的總和必須為 1。例如:-
{"trainingFraction": "0.7","validationFraction": "0.15","testFraction": "0.15"}
-
- MODEL_DISPLAYNAME*:TrainingPipeline 上傳 (建立) 的模型顯示名稱。
- MODEL_DESCRIPTION*:模型的說明。
- modelToUpload.labels*:任何一組鍵/值組合,用於整理模型。例如:
- "env": "prod"
- "tier": "backend"
- MODELTYPE†:要訓練的雲端託管模型類型。選項如下:
CLOUD_1
- 最適合在 Google Cloud 中使用的模型,且無法匯出。相較於上述 CLOUD_HIGH_ACCURACY_1 和 CLOUD_LOW_LATENCY_1 模型,這項模型的預測品質和延遲時間都會更高。CLOUD_HIGH_ACCURACY_1
- 最適合在 Google Cloud 中使用的模型,且無法匯出。這個模型的延遲時間預計會較長,但預測品質應會高於其他雲端模型。CLOUD_LOW_LATENCY_1
- 專為在 Google Cloud 中使用而設計的模型,無法匯出。這個模型的延遲時間應較短,但預測品質可能會低於其他雲端模型。
- NODE_HOUR_BUDGET†:實際訓練費用會等於或低於這個值。雲端模型的預算必須介於 20,000 至 900,000 毫秒節點小時 (含) 之間。 預設值為 216,000,代表實際時間的一天的長度,假設使用 9 個節點。
- PROJECT_NUMBER:系統自動產生的專案編號
* | 您在 trainingTaskDefinition 中指定的結構定義檔案說明,會說明這個欄位的用途。 |
† | 您在 trainingTaskDefinition 中指定的結構定義檔案會宣告並說明這個欄位。 |
HTTP 方法和網址:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/trainingPipelines
JSON 要求主體:
{ "displayName": "TRAININGPIPELINE_DISPLAYNAME", "inputDataConfig": { "datasetId": "DATASET_ID", "fractionSplit": { "trainingFraction": "DECIMAL", "validationFraction": "DECIMAL", "testFraction": "DECIMAL" } }, "modelToUpload": { "displayName": "MODEL_DISPLAYNAME", "description": "MODEL_DESCRIPTION", "labels": { "KEY": "VALUE" } }, "trainingTaskDefinition": "gs://google-cloud-aiplatform/schema/trainingjob/definition/automl_image_object_detection_1.0.0.yaml", "trainingTaskInputs": { "modelType": ["MODELTYPE"], "budgetMilliNodeHours": NODE_HOUR_BUDGET } }
如要傳送要求,請選擇以下其中一個選項:
curl
將要求主體儲存在名為 request.json
的檔案中,然後執行下列指令:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/trainingPipelines"
PowerShell
將要求主體儲存在名為 request.json
的檔案中,然後執行下列指令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/trainingPipelines" | Select-Object -Expand Content
回應內容包含規格和 TRAININGPIPELINE_ID 相關資訊。
Java
在試用這個範例之前,請先按照 Vertex AI 快速入門:使用用戶端程式庫中的操作說明設定 Java。詳情請參閱 Vertex AI Java API 參考說明文件。
如要向 Vertex AI 進行驗證,請設定應用程式預設憑證。詳情請參閱「為本機開發環境設定驗證機制」。
Node.js
在試用這個範例之前,請先按照 Vertex AI 快速入門:使用用戶端程式庫中的操作說明設定 Node.js。詳情請參閱 Vertex AI Node.js API 參考說明文件。
如要向 Vertex AI 進行驗證,請設定應用程式預設憑證。詳情請參閱「為本機開發環境設定驗證機制」。
Python 適用的 Vertex AI SDK
如要瞭解如何安裝或更新 Python 適用的 Vertex AI SDK,請參閱「安裝 Python 適用的 Vertex AI SDK」。 詳情請參閱 Vertex AI SDK for Python API 參考說明文件。
使用 REST 控管資料分割
您可以控制訓練資料如何在訓練集、驗證集和測試集之間分割。使用 Vertex AI API 時,請使用 Split
物件來決定資料分割方式。Split
物件可納入 InputConfig
物件,做為多種物件類型之一,每種物件都提供不同的訓練資料分割方式。您只能選取一種方法。
-
FractionSplit
:- TRAINING_FRACTION:訓練資料用於訓練集的比例。
- VALIDATION_FRACTION:用於驗證集的訓練資料比例。不適用於影片資料。
- TEST_FRACTION:要用於測試集的訓練資料比例。
如果指定任何分數,則必須指定所有分數。分數總和必須為 1.0。分數的預設值會因資料類型而異。瞭解詳情。
"fractionSplit": { "trainingFraction": TRAINING_FRACTION, "validationFraction": VALIDATION_FRACTION, "testFraction": TEST_FRACTION },
-
FilterSplit
: - TRAINING_FILTER:系統會使用符合這項篩選條件的資料項目來建立訓練集。
- VALIDATION_FILTER:符合此篩選條件的資料項目會用於驗證集。影片資料必須為「-」。
- TEST_FILTER:系統會使用符合這項篩選條件的資料項目來建立測試集。
這些篩選器可搭配 ml_use
標籤或您套用至資料的任何標籤使用。進一步瞭解如何使用ml-use 標籤和其他標籤篩選資料。
以下範例說明如何使用 filterSplit
物件搭配 ml_use
標籤,並納入驗證集:
"filterSplit": { "trainingFilter": "labels.aiplatform.googleapis.com/ml_use=training", "validationFilter": "labels.aiplatform.googleapis.com/ml_use=validation", "testFilter": "labels.aiplatform.googleapis.com/ml_use=test" }