代管筆記本簡介
Vertex AI Workbench 代管筆記本執行個體是 Google 代管的環境,提供整合和功能,可協助您設定並在以 Jupyter 筆記本為基礎的端對端正式環境中工作。
代管筆記本執行個體預先封裝 JupyterLab,且預先安裝了一組深度學習套件,包括支援 TensorFlow 和 PyTorch 架構。受管理的筆記本執行個體支援 GPU 加速器,並可與 GitHub 存放區同步。您的代管型筆記本執行個體受到 Google Cloud 驗證和授權功能保護。
Google 管理的運算基礎架構
Vertex AI Workbench 代管型筆記本執行個體是 Google 代管的 Jupyter 筆記本運算基礎架構。
建立受管理的 Notebook 執行個體時,系統會將其部署為租用戶專案中的 Google 管理虛擬機器 (VM) 執行個體。
您的代管筆記本執行個體包含許多常見的資料科學架構環境,例如 TensorFlow 和 PyTorch。您也可以將自訂容器映像檔新增至受管理的 Notebook 執行個體。這些環境可做為可執行筆記本檔案的核心。
在某個核心中執行筆記本時,Vertex AI Workbench 會啟動對應的容器,在其中建立 Jupyter 工作階段,然後使用該 Jupyter 工作階段在容器上執行筆記本。
這個由 Google 管理的運算基礎架構包含整合和功能,可協助您從頭到尾導入數據科學和機器學習工作流程。詳情請參閱下文。
使用自訂容器
您可以將自訂 Docker 容器映像檔新增至受管理的 Notebook 執行個體,在符合需求的自訂環境中執行 Notebook 程式碼。
這些自訂容器可直接透過 JupyterLab 使用者介面,以及預先安裝的架構使用。詳情請參閱「在受管理的筆記本執行個體中新增自訂容器」。
以筆記本為基礎的工作流程
您可以使用受管理的筆記本執行個體,在 JupyterLab 使用者介面中執行工作流程導向的作業。
透過 JupyterLab 控制硬體和架構
在代管型筆記本執行個體中,您可以在 JupyterLab 使用者介面中指定程式碼要執行的運算資源。舉例來說,您可以設定所需的 vCPU 或 GPU 數量、所需的 RAM 數量,以及要用來執行程式的架構。您可以先編寫程式碼,然後選擇如何執行程式碼,而無須離開 JupyterLab 或重新啟動執行個體。如要快速測試程式碼,您可以縮小硬體規模,然後再將其擴大,以便針對更多資料執行程式碼。
存取資料
您不必離開 JupyterLab 使用者介面,也能存取資料。
在受管理的 Notebook 執行個體上,您可以在 JupyterLab 的導覽選單中使用 Cloud Storage 整合功能,瀏覽您有權存取的資料和其他檔案。請參閱「在 JupyterLab 中存取 Cloud Storage 值區和檔案」一文。
您也可以使用 BigQuery 整合功能瀏覽可存取的資料表、編寫查詢、預覽結果,以及將資料載入筆記本。請參閱「在 JupyterLab 中查詢 BigQuery 資料表中的資料」。
執行筆記本執行作業
使用執行程式,以一次性執行或依排程執行筆記本檔案。選擇要執行的特定環境和硬體。筆記本的程式碼會在 Vertex AI 自訂訓練中執行,這麼一來,您就能更輕鬆地進行分散式訓練、最佳化超參數,或排程持續訓練工作。請參閱「使用執行程式執行筆記本檔案」一文。
您可以在執行作業中使用參數,針對每次執行作業進行特定變更。舉例來說,您可以指定要使用的不同資料集、變更模型的學習率,或變更模型的版本。
您也可以設定筆記本以週期性時間表執行。即使執行個體已關閉,Vertex AI Workbench 仍會執行筆記本檔案並儲存結果,供您查看及與他人分享。
分享洞察資料
執行的筆記本會儲存在 Cloud Storage 值區中,因此您可以授予結果存取權,與其他人分享洞察資料。請參閱上一節關於執行筆記本執行作業的說明。
保護執行個體
您可以使用預設的 Google 代管網路部署受管理的 Notebook 執行個體,該網路會使用預設的虛擬私有雲網路和子網路。您可以指定要與執行個體搭配使用的虛擬私人雲端網路,而非預設網路。詳情請參閱「設定網路」一文。您可以使用 VPC Service Controls,為受管理的 Notebook 執行個體提供額外的安全性。
如要在服務範圍內使用受管理的筆記本,請參閱「在服務範圍內使用受管理的筆記本執行個體」。
根據預設, Google Cloud 會使用 Google 管理的加密金鑰,自動在資料處於靜態狀態時加密資料。如果您有與保護資料的金鑰相關的特定法規或法規要求,可以將客戶自行管理的加密金鑰 (CMEK) 與受管理的 Notebook 執行個體搭配使用。詳情請參閱「使用客戶管理的加密金鑰」。
閒置執行個體的自動關機功能
為協助您控管成本,代管型筆記本執行個體預設會在閒置一段特定時間後關閉。你可以變更時間長度或關閉這項功能。詳情請參閱閒置關機。
Dataproc 整合
您可以在 Dataproc 叢集中執行筆記本,快速處理資料。叢集設定完成後,您可以在叢集中執行筆記本檔案,而無須離開 JupyterLab 使用者介面。詳情請參閱「在 Dataproc 叢集中執行代管型筆記本執行個體」。
限制
規劃專案時,請考量受管理筆記本的下列限制:
代管筆記本執行個體由 Google 管理,因此無法像 Vertex AI Workbench 使用者自行管理的筆記本執行個體那樣進行自訂。如果使用者需要對環境進行大量控管,使用者自行管理的筆記本執行個體會是較理想的選擇。詳情請參閱「使用者管理的筆記本簡介」。
不支援第三方 JupyterLab 擴充功能。
Dataproc JupyterLab 外掛程式不支援代管型筆記本,但您可以在 Vertex AI Workbench 執行個體中使用這項外掛程式。請參閱「建立支援 Dataproc 的執行個體」一文。
受管理的筆記本執行個體不允許使用者擁有
sudo
存取權。當您使用 Access Context Manager 和 Chrome Enterprise Premium,透過情境感知存取權控制項保護受管理的 Notebook 執行個體時,系統會在使用者驗證執行個體時評估存取權。舉例來說,如果使用者首次存取 JupyterLab,且之後每次存取時網頁瀏覽器的 Cookie 已過期,系統就會評估存取權。
如要搭配受管理的筆記本執行個體使用加速器,所需的加速器類型必須在執行個體的區域中提供。如要瞭解各區域的加速器供應情形,請參閱GPU 地區和區域供應情形。