我的工作負載並未啟動
嘗試開始遷移作業時,可能會發生錯誤,導致工作負載無法正確啟動。
如果發生錯誤導致工作負載無法正確啟動,請先嘗試本文所述的疑難排解步驟,再與支援團隊聯絡。
新增從 Google Container Registry 提取映像檔所需的權限
叢集必須從 Google Container Registry (GCR) 提取工作負載映像檔,才能啟動工作負載,但有時可能會因缺少權限而失敗。
如要找出這項問題,請按照下列步驟操作:
前往 Google Cloud 控制台的「Object browser」頁面。
選取您的叢集。
在「Object Kinds」清單中選取「Pod」。
在顯示的 Pod 清單中,找出與工作負載相對應的 Pod,然後按一下 Pod 名稱,即可開啟 Pod 詳細資料。
如果「Pod 詳細資料」頁面上出現顯示
failed to pull and unpack image
和403 forbidden
錯誤的橫幅,表示缺少提取工作負載映像檔所需的權限。
如要解決這個問題,請執行下列步驟:
將名為「Storage Object Viewer」的角色新增至專案中的預設 Compute Engine 服務帳戶。
接著,刪除叢集中的 Pod。
系統會自動建立新的 Pod,取代已刪除的 Pod。
您已遷移的工作負載現在應該可供存取。
停用 GKE Autopilot 叢集
自「遷移至容器」功能推出以來,系統預設會啟用 GKE Autopilot 叢集的使用權限。因此,如果沒有特別指定,任何為遷移至容器而建立的新遷移作業都會使用 GKE Autopilot 叢集。
請嘗試停用 GKE Autopilot 叢集,然後再次啟動遷移工作負載。
如要停用 GKE Autopilot 叢集,請按照下列步驟將 v2kServiceManager
設為 false
:
-
在
MIGRATION_NAME.yaml
檔案中,找出v2kServiceManager
,並將其設為false
。變更:
v2kServiceManager: true
to:
v2kServiceManager: false
儲存檔案。
使用 Migrate to Containers 重新啟動遷移作業。
如果工作負載在停用 GKE Autopilot 叢集後仍無法正確啟動,請與支援管道聯絡。