本頁面由 Cloud Translation API 翻譯而成。

Hello 自訂訓練：訓練自訂圖片分類模型

如要瞭解詳情，請在所選環境中執行下列筆記本：

「使用 Python 適用的 Vertex AI SDK 訓練及部署自訂圖片分類模型，以進行批次預測。」：
在 Colab 中開啟 | 在 Colab Enterprise 中開啟 | 在 Vertex AI Workbench 中開啟 | 在 GitHub 上查看
「使用 Python 適用的 Vertex AI SDK 訓練及部署自訂圖片分類模型，以進行線上預測。」：
在 Colab 中開啟 | 在 Colab Enterprise 中開啟 | 在 Vertex AI Workbench 中開啟 | 在 GitHub 上查看

本頁說明如何在 Vertex AI 上執行 TensorFlow Keras 訓練應用程式。這個模型會訓練圖片分類模型，以便依類型分類花朵。

本教學課程包含多個頁面：

各頁面都假設您已按照本教學課程先前頁面的指示操作。

本文的其餘部分假設您使用在本教學課程第一頁中建立的相同 Cloud Shell 環境。如果原始 Cloud Shell 工作階段已關閉，請按照下列步驟返回環境：

In the Google Cloud console, activate Cloud Shell.

Activate Cloud Shell
在 Cloud Shell 工作階段中，執行下列指令：
```
cd hello-custom-sample
```

執行自訂訓練管道

本節說明如何使用上傳至 Cloud Storage 的訓練套件，執行 Vertex AI 自訂訓練管道。

在 Google Cloud 控制台的 Vertex AI 專區中，前往「訓練 pipeline」頁面。

前往訓練管線
按一下「建立」，開啟「訓練新模型」窗格。
在「選擇訓練方法」步驟中，執行下列操作：
1. 在「Dataset」(資料集) 下拉式清單中，選取「No managed dataset」(沒有代管資料集)。這個訓練應用程式會從 TensorFlow Datasets 程式庫載入資料，而不是從代管的 Vertex AI 資料集載入。
2. 確認已選取「Custom training (advanced)」(自訂訓練 (進階))。
按一下「繼續」。
在「模型詳細資料」步驟的「名稱」欄位中，輸入 hello_custom。按一下「繼續」。
在「訓練容器」步驟中，提供 Vertex AI 所需的資訊，以便使用您上傳至 Cloud Storage 的訓練套件：
1. 選取「預先建構的容器」。
2. 在「Model framework」(模型架構) 下拉式清單中，選取「TensorFlow」。
3. 在「Model framework version」(模型架構版本) 下拉式清單中選取「2.3」。
4. 在「Package location」(套件位置) 欄位中輸入 cloud-samples-data/ai-platform/hello-custom/hello-custom-sample-v1.tar.gz。
5. 在「Python module」(Python 模組) 欄位中，輸入 trainer.task。trainer 是 tarball 中的 Python 套件名稱，而 task.py 則包含訓練程式碼。因此，trainer.task 是您要 Vertex AI 執行的模組名稱。
6. 在「Model output directory」(模型輸出目錄) 欄位中，按一下「Browse」(瀏覽)。在「選取資料夾」窗格中執行下列操作：
  1. 前往 Cloud Storage bucket。
  2. 按一下「建立新資料夾」圖示。
  3. 將新資料夾命名為 output。然後按一下「建立」。
  4. 按一下「選取」。
  確認該欄位的值為 gs://BUCKET_NAME/output，其中 BUCKET_NAME 是 Cloud Storage bucket 的名稱。
  
  這個值會傳遞至 Vertex AI 的 baseOutputDirectory API 欄位，設定多個環境變數，供訓練應用程式執行時存取。
  
  舉例來說，如果將這個欄位設為 gs://BUCKET_NAME/output，Vertex AI 會將 AIP_MODEL_DIR 環境變數設為 gs://BUCKET_NAME/output/model。訓練結束時，Vertex AI 會使用 AIP_MODEL_DIR 目錄中的任何構件建立模型資源。
  
  進一步瞭解這個欄位設定的環境變數。
按一下「繼續」。
在選用的「超參數」步驟中，請務必取消勾選「啟用超參數調整」核取方塊。本教學課程不會使用超參數調整功能。然後點按「繼續」。
在「運算和價格」步驟中，為自訂訓練工作分配資源：
1. 在「Region」(區域) 下拉式清單中，選取「us-central1 (Iowa)」(us-central1 (愛荷華州))。
2. 在「Machine type」(機器類型) 下拉式清單中，選取「Standard」(標準) 部分的「n1-standard-4」。
請勿為本教學課程新增任何加速器或工作站集區。按一下「Continue」(繼續)。
在「預測容器」步驟中，提供 Vertex AI 預測服務所需的資訊：
1. 選取「預先建構的容器」。
2. 在「預先建構的容器設定」部分，執行下列操作：
  1. 在「Model framework」(模型架構) 下拉式清單中，選取「TensorFlow」。
  2. 在「Model framework version」(模型架構版本) 下拉式清單中選取「2.3」。
  3. 在「Accelerator type」(加速器類型) 下拉式清單中，選取「None」(無)。
  4. 確認「模型目錄」欄位的值為 gs://BUCKET_NAME/output，其中 BUCKET_NAME 是 Cloud Storage bucket 的名稱。這與您在上一個步驟中提供的「模型輸出目錄」值相符。
3. 將「Predict schemata」(預測結構定義) 區段中的欄位留空。
按一下「開始訓練」，啟動自訂訓練管道。

您現在可以在「訓練」頁面中，查看名為 hello_custom 的新訓練管線。(你可能需要重新整理頁面)。訓練管道主要會執行兩項作業：

訓練管道會建立名為 hello_custom-custom-job 的自訂工作資源。稍待片刻，您就能在「訓練」部分的「自訂工作」頁面中查看這項資源：

前往「Custom jobs」(自訂工作) 頁面

自訂工作會使用您在本節中指定的運算資源，執行訓練應用程式。
自訂工作完成後，訓練管道會在 Cloud Storage bucket 的 output/model/ 目錄中，找出訓練應用程式建立的構件。並使用這些構件建立模型資源。

監控訓練

如要查看訓練記錄，請執行下列操作：

在 Google Cloud 控制台的 Vertex AI 專區，前往「Custom jobs」(自訂工作) 頁面。

前往「Custom jobs」(自訂工作) 頁面
如要查看剛建立的 CustomJob 詳細資料，請點選清單中的 hello_custom-custom-job。
在工作詳細資料頁面中，按一下「查看記錄」。

查看訓練好的模型

自訂訓練管道完成後，您可以在 Google Cloud 控制台的 Vertex AI 專區中，於「模型」頁面找到訓練好的模型。

前往「模型」

模型名稱為 hello_custom。

後續步驟

請按照本教學課程的下一頁操作，透過訓練好的 ML 模型提供預測結果。

設定專案和環境

透過自訂圖片分類模型提供預測結果