設定 Vertex AI TensorBoard 時,必須具備下列項目:
建立具備必要權限的服務帳戶
如要將 Vertex AI TensorBoard 與自訂訓練整合,您必須附加服務帳戶。
建立服務帳戶:
gcloud --project=PROJECT_ID iam service-accounts create USER_SA_NAME
更改下列內容:
PROJECT_ID
:您要建立服務帳戶的專案 ID。USER_SA_NAME
:您要建立的服務帳戶專屬名稱。
Vertex AI 訓練服務會使用新的服務帳戶存取 Google Cloud 服務和資源。視需要使用下列指令授予這些角色:
SA_EMAIL="USER_SA_NAME@PROJECT_ID.iam.gserviceaccount.com" gcloud projects add-iam-policy-binding PROJECT_ID \ --member="serviceAccount:${SA_EMAIL}" \ --role="roles/storage.admin" gcloud projects add-iam-policy-binding PROJECT_ID \ --member="serviceAccount:${SA_EMAIL}" \ --role="roles/aiplatform.user"
建立 Cloud Storage 值區來儲存 Vertex AI TensorBoard 記錄
您需要 Cloud Storage 值區來儲存訓練指令碼產生的 Vertex AI TensorBoard 記錄。值區必須是地區 (即非多地區或雙地區),且下列資源必須位於相同的地區:
- Cloud Storage 值區
- Vertex AI 訓練工作
- Vertex AI TensorBoard 執行個體
您可以使用現有值區,而不需要按照本文所述的步驟建立值區。使用現有值區時,值區的位置必須與 Vertex AI TensorBoard 執行個體建立的位置相同。
GCS_BUCKET_NAME="PROJECT_ID-tensorboard-logs-LOCATION_ID"
gcloud storage buckets create "gs://${GCS_BUCKET_NAME}" --location=LOCATION_ID
將 LOCATION_ID 替換為 Vertex AI TensorBoard 執行個體建立的位置,例如 us-central1
。
GCS_BUCKET_NAME
可用於使用 REST 建立自訂訓練工作。
建立 Vertex AI TensorBoard 執行個體
您必須先建立 Vertex AI TensorBoard 執行個體 (這是用於儲存 Vertex AI TensorBoard 實驗的區域資源),才能以視覺化方式呈現實驗。有兩種方法。您可以使用預設執行個體,也可以手動建立執行個體。您可以在專案和區域中建立多個執行個體,但大多數使用者只需要一個執行個體。
使用預設的 Vertex AI TensorBoard 執行個體
初始化 Vertex AI 實驗時,系統會自動建立預設的 TensorBoard 例項。這個後端 TensorBoard 會與 Vertex AI 實驗建立關聯,並用於所有後續的 Vertex AI 實驗執行作業。您可以直接從實驗中擷取 tensorboard_resource_name
。這是開始使用 Vertex AI TensorBoard 最簡單的方式,應該能滿足大多數使用者的需求。
Python 適用的 Vertex AI SDK
使用 Python 適用的 Vertex AI SDK 建立 Vertex AI TensorBoard 實驗,並使用預設執行個體。從實驗中擷取 tensorboard_resource_name
。請參閱 Vertex AI SDK 參考文件中的 init 和 Experiment。
Python 適用的 Vertex AI SDK
experiment_name
:實驗名稱。experiment_description
:實驗說明。project
:您要建立 TensorBoard 例項的專案PROJECT_ID
。location
:TensorBoard 例項的建立位置。Vertex AI TensorBoard 的位置是區域。請務必選取支援 Vertex AI TensorBoard 的區域 。
手動建立 Vertex AI TensorBoard 執行個體
您可以手動建立 Vertex AI TensorBoard。這對使用者來說很有幫助,因為使用者可以更輕鬆地使用 Google Cloud 控制台,或是需要使用 CMEK 啟用 TensorBoard 的使用者 (請參閱 CMEK),或是想要使用多個 TensorBoard 的使用者。您可以在初始化 Vertex AI 實驗、啟動實驗執行作業或設定訓練程式碼時,直接指定這個例項。
Python 適用的 Vertex AI SDK
使用 Python 適用的 Vertex AI SDK 建立 Vertex AI TensorBoard 執行個體。
Python 適用的 Vertex AI SDK
project
:您要建立 TensorBoard 例項的專案PROJECT_ID
。display_name
:Vertex AI TensorBoard 執行個體的描述性名稱。location
:TensorBoard 例項的建立位置。Vertex AI TensorBoard 的位置是區域。請務必選取支援 Vertex AI TensorBoard 的區域
Google Cloud CLI
使用 Google Cloud CLI 建立 Vertex AI TensorBoard 執行個體。
- 安裝 gcloud CLI
- 執行
gcloud init
來初始化 Google Cloud CLI。 - 如要確認安裝作業是否完成,請探索指令。
gcloud ai tensorboards --help
指令包括create
、describe
、list
、update
和delete
。如有需要,您可以按照這些步驟設定專案和位置的預設值,再繼續操作。
- 驗證 gcloud CLI。
gcloud auth application-default login
- 提供專案名稱和顯示名稱,建立 Vertex AI TensorBoard 執行個體。在專案中首次執行這個步驟時,可能需要幾分鐘的時間才能完成。請記下下列指令結尾顯示的 Vertex AI TensorBoard 執行個體名稱 (例如:
projects/123/locations/us-central1/tensorboards/456
)。後續步驟會用到這項資訊。
gcloud ai tensorboards create --display-name DISPLAY_NAME \ --project PROJECT_NAME
替換下列內容:
PROJECT_NAME
:您要建立 TensorBoard 執行個體的專案。DISPLAY_NAME
:TensorBoard 執行個體的描述性名稱。
Google Cloud 控制台
如果您想加密 Vertex AI TensorBoard 資料,請務必在建立執行個體時啟用 CMEK 金鑰。
請按照下列步驟,使用 Google Cloud 控制台建立啟用 CMEK 的 Vertex AI TensorBoard 執行個體。
- 如果您是 Vertex AI 新手,或要開始新專案,請設定專案和開發環境。
- 在 Google Cloud 控制台的 Vertex AI 專區中,前往「Experiments」頁面。
前往「實驗」頁面 - 前往「TensorBoard 執行個體」分頁。
- 按一下頁面頂端的「建立」。
- 從「Region」下拉式清單中選取位置。
- (選用) 新增說明。
- (選用) 在「Encryption」下方,選取「Customer-managed encryption key (CMEK)」,然後選取客戶管理的金鑰。
- 按一下「建立」,建立 TensorBoard 執行個體。
Terraform
以下範例使用 google_vertex_ai_tensorboard
Terraform 資源建立未加密的 Vertex AI TensorBoard 執行個體。
如要瞭解如何套用或移除 Terraform 設定,請參閱「基本 Terraform 指令」。
Terraform
刪除 TensorBoard 執行個體
刪除 TensorBoard 執行個體會刪除該 TensorBoard 和所有相關聯的 TensorBoard 實驗和 TensorBoard 執行作業。與執行個體相關聯的 Vertex AI 實驗不會遭到刪除。
如要刪除 Vertex AI Experiments 及其相關的 Vertex AI TensorBoard 實驗,請參閱「刪除實驗」。
Python 適用的 Vertex AI SDK
使用 Python 適用的 Vertex AI SDK 刪除 Vertex AI TensorBoard 執行個體。
Python 適用的 Vertex AI SDK
tensorboard_resource_name
:提供 TensorBoard 資源名稱。project
:TensorBoard 執行個體所在的PROJECT_ID
。location
:TensorBoard 執行個體所在的位置。
Google Cloud 控制台
如要使用 Google Cloud 控制台刪除 Vertex AI TensorBoard 執行個體,請按照下列步驟操作。
- 在 Google Cloud 控制台的 Vertex AI 專區中,前往「Experiments」頁面。
前往「實驗」頁面 - 選取「TensorBoard 執行個體」分頁標籤。畫面上會顯示 TensorBoard 執行個體清單。
- 選取 並按一下「刪除」
相關字詞
這些字詞 (「TensorBoard 資源名稱」和「TensorBoard 執行個體 ID」) 在許多範例中都有提及。
TensorBoard 資源名稱
TensorBoard 資源名稱可用於完整識別 Vertex AI TensorBoard 執行個體。格式如下:
projects/PROJECT_ID_OR_NUMBER/locations/REGION/tensorboards/TENSORBOARD_INSTANCE_ID
使用 gcloud CLI 或 Vertex AI SDK 建立 TensorBoard 時,記錄訊息會顯示 TensorBoard 資源名稱,也可以為預留位置提供適當的值來建立 TensorBoard。
Python 適用的 Vertex AI SDK
您可以使用 Vertex AI SDK 從 Vertex AI 實驗中擷取 TensorBoard 資源名稱。
Python 適用的 Vertex AI SDK
experiment_name
:實驗名稱。project
:實驗的PROJECT_ID
。location
:實驗所在的位置。
TensorBoard 執行個體 ID
TensorBoard 執行個體 ID 是與 TensorBoard 執行個體相關聯的產生 ID 值。如要找出 TENSORBOARD_INSTANCE_ID
,請前往 Google Cloud 控制台的「Experiments」頁面「Vertex AI」專區,然後選取「TensorBoard Instances」分頁標籤。
您也可以從 TensorBoard 資源名稱擷取執行個體 ID。