Vertex AI Workbench 執行個體簡介
Vertex AI Workbench 執行個體是以 Jupyter 筆記本為基礎的開發環境,可支援整個數據資料學工作流程。您可以透過 Vertex AI Workbench 執行個體的 Jupyter 筆記本,與 Vertex AI 和其他 Google Cloud 服務互動。
Vertex AI Workbench 整合功能和其他功能可讓您更輕鬆地存取資料、加快資料處理速度、安排筆記本執行作業等。
Vertex AI Workbench 執行個體已預先安裝 JupyterLab,並預先安裝一套深度學習套件,支援 TensorFlow 和 PyTorch 架構。您可以設定只使用 CPU 或已啟用 GPU 的執行個體。
Vertex AI Workbench 執行個體支援與 GitHub 存放區同步。Vertex AI Workbench 執行個體受到 Google Cloud 驗證和授權保護。
存取資料
您不必離開 JupyterLab 使用者介面,也能存取資料。
在 Vertex AI Workbench 執行個體的 JupyterLab 導覽選單中,您可以使用 Cloud Storage 整合功能瀏覽可存取的資料和其他檔案。請參閱「在 JupyterLab 中存取 Cloud Storage 值區和檔案」一文。
您也可以使用 BigQuery 整合功能瀏覽可存取的資料表、編寫查詢、預覽結果,以及將資料載入筆記本。請參閱「在 JupyterLab 中查詢 BigQuery 資料表中的資料」。
執行筆記本執行作業
使用執行程式,以一次性執行或依排程執行筆記本檔案。選擇要執行的特定環境和硬體。筆記本的程式碼會在 Vertex AI 自訂訓練中執行,讓您更輕鬆地進行分散式訓練、最佳化超參數,或排程持續訓練工作。
您可以在執行作業中使用參數,對每次執行作業進行特定變更。舉例來說,您可以指定要使用的不同資料集、變更模型的學習率,或變更模型的版本。
您也可以設定筆記本,讓筆記本依週期性排程執行。即使執行個體已關閉,Vertex AI Workbench 仍會執行筆記本檔案並儲存結果,供您查看及與他人分享。
分享洞察資料
執行的筆記本會儲存在 Cloud Storage 值區中,因此您可以授予結果存取權,與其他人分享洞察資料。請參閱上一節關於執行筆記本執行作業的說明。
保護執行個體
以下各節說明可協助您保護 Vertex AI Workbench 執行個體安全的支援功能。
虛擬私有雲
您可以使用預設的 Google 代管網路部署 Vertex AI Workbench 執行個體,該網路會使用預設的虛擬私有雲網路和子網路。您可以指定要與執行個體搭配使用的虛擬私人雲端網路,而非預設網路。
由客戶管理的加密金鑰 (CMEK)
根據預設, Google Cloud 會使用 Google 管理的加密金鑰,自動在資料處於靜態狀態時加密資料。如果您有與保護資料的金鑰相關的特定法規遵循或法規要求,可以使用客戶管理的加密金鑰 (CMEK) 搭配 Vertex AI Workbench 執行個體。詳情請參閱「客戶管理的加密金鑰」。
機密運算
您可以使用機密運算功能,為使用中的資料加密。如要使用機密運算,請在建立 Vertex AI Workbench 執行個體時啟用機密 VM 服務。如要開始使用,請參閱「使用機密運算建立執行個體」。
閒置執行個體的自動關機功能
為協助您管理成本,Vertex AI Workbench 執行個體預設會在閒置一段特定時間後關閉。你可以變更時間長度或關閉這項功能。詳情請參閱「閒置時關機」。
新增 conda 環境
Vertex AI Workbench 執行個體會使用以 conda 環境為基礎的核心。您可以將 conda 環境新增至 Vertex AI Workbench 執行個體,該環境會以核心的形式顯示在執行個體的 JupyterLab 介面中。
新增 conda 環境後,您就能使用預設 Vertex AI Workbench 執行個體中不支援的核心。舉例來說,您可以為 R 和 Apache Beam 新增 conda 環境。或者,您也可以為特定可用架構的舊版新增 conda 環境,例如 TensorFlow、PyTorch 或 Python。
詳情請參閱「新增 conda 環境」。
自訂容器
您可以根據自訂容器建立 Vertex AI Workbench 執行個體。以 Google 提供的基本容器映像檔開始,並視需求加以修改。然後根據自訂容器建立執行個體。
詳情請參閱「使用自訂容器建立執行個體」。
Dataproc 整合
您可以在 Dataproc 叢集中執行筆記本,快速處理資料。叢集設定完成後,您可以在叢集中執行筆記本檔案,而無須離開 JupyterLab 使用者介面。詳情請參閱「建立支援 Dataproc 的執行個體」。
使用第三方憑證建立執行個體
您可以使用 Workforce Identity Federation 提供的第三方憑證,建立及管理 Vertex AI Workbench 執行個體。員工身分聯盟會使用您的外部身分提供者 (IdP),透過 Proxy 授予一組使用者存取 Vertex AI Workbench 執行個體的權限。
您可以將人力資源池主要使用者指派給 Vertex AI Workbench 執行個體的服務帳戶,藉此授予 Vertex AI Workbench 執行個體存取權。
詳情請參閱「使用第三方憑證建立執行個體」。
Vertex AI Workbench 執行個體的標記
Vertex AI Workbench 執行個體的基礎 VM 是 Compute Engine VM。您可以透過 Compute Engine VM 為 Vertex AI Workbench 執行個體新增及管理資源標記。
建立 Vertex AI Workbench 執行個體時,Vertex AI Workbench 會附加 Compute Engine 資源標記 vertex-workbench-instances:prod=READ_ONLY
。這個資源標記僅供內部使用。
如要進一步瞭解如何管理 Compute Engine 執行個體的標記,請參閱「管理資源的標記」。
限制
規劃專案時,請考量 Vertex AI Workbench 執行個體的下列限制:
不支援第三方 JupyterLab 擴充功能。
當您使用 Access Context Manager 和 Chrome Enterprise 進階版,以情境感知存取權控制項保護 Vertex AI Workbench 執行個體時,系統會在使用者驗證執行個體時評估存取權。舉例來說,如果使用者首次存取 JupyterLab,且之後每次存取時網頁瀏覽器的 Cookie 已過期,系統就會評估存取權。
如果您使用非由 Google 提供的基本容器 (
gcr.io/deeplearning-platform-release/workbench-container:latest
) 衍生的自訂容器,就會增加與 Google 服務發生相容性問題的風險,因此不受支援。請改為修改基本容器,建立符合需求的自訂容器,然後使用自訂容器建立執行個體。Vertex AI Workbench 執行個體會預期來自
cloud-notebooks-managed
專案的圖片。您可以在 Google Cloud 控制台的建立頁面中查看映像檔名稱清單。雖然您可以使用自訂虛擬機器 (VM) 映像檔或深度學習 VM 映像檔搭配 Vertex AI Workbench 執行個體,但 Vertex AI Workbench 不會針對使用這些映像檔時發生的異常行為或故障提供任何支援。系統不支援使用使用者管理型筆記本映像檔或代管筆記本映像檔建立 Vertex AI Workbench 執行個體。
您無法使用 Google Cloud 主控台或 Compute Engine API 編輯 Vertex AI Workbench 執行個體的基礎 VM。如要編輯 Vertex AI Workbench 執行個體的基礎 VM,請使用 Notebooks API 中的
projects.locations.instances.patch
方法,或 Google Cloud SDK 中的gcloud workbench instances update
指令。在使用 VPC Service Controls 的執行個體中,系統不支援使用執行緒。
如要搭配 Vertex AI Workbench 執行個體使用加速器,您需要的加速器類型必須在執行個體的區域中提供。如要瞭解各區域的加速器供應情形,請參閱GPU 地區和區域供應情形。