Vertex AI Workbench 实例简介

Vertex AI Workbench 实例是基于 Jupyter 笔记本的开发环境,适用于整个数据科学工作流。您可以从 Vertex AI Workbench 实例的 Jupyter 笔记本中与 Vertex AI 和其他 Google Cloud 服务进行交互。

借助 Vertex AI Workbench 集成和功能,您可以更轻松地访问数据、更快地处理数据、安排笔记本运行等。

Vertex AI Workbench 实例预封装了 JupyterLab,并预安装了深度学习软件包套件,并且都支持 TensorFlow 和 PyTorch 框架。您可以配置仅限 CPU 的实例或支持 GPU 的实例。

Vertex AI Workbench 实例支持与 GitHub 代码库同步。Vertex AI Workbench 实例受 Google Cloud 身份验证和授权功能的保护。

数据的访问权限

您无需离开 JupyterLab 界面即可访问数据。

在 Vertex AI Workbench 实例上的 JupyterLab 导航菜单中,您可以使用 Cloud Storage 集成来浏览您有权访问的数据和其他文件。 请参阅从 JupyterLab 访问 Cloud Storage 存储桶和文件

您还可以使用 BigQuery 集成功能浏览您有权访问的表、编写查询、预览结果以及将数据加载到笔记本中。请参阅从 JupyterLab 查询 BigQuery 表中的数据

执行笔记本运行

使用执行程序将笔记本文件作为一次性执行来运行或按时间表来运行。选择要在其中运行执行的特定环境和硬件。您的笔记本代码将在 Vertex AI 自定义训练上运行,这样可让您更轻松地执行分布式训练、优化超参数或安排持续训练作业。

您可以在执行中使用参数,以便对每次运行进行特定更改。例如,您可以指定使用其他数据集、更改模型的学习速率,或更改模型的版本。

您还可以将笔记本设置为定期运行。即使您的实例已关停,Vertex AI Workbench 也会运行您的笔记本文件并保存结果以供您查看并与他人分享。

共享数据分析

执行的笔记本运行存储在 Cloud Storage 存储桶中,因此您可以通过授予对结果的访问权限来共享您的数据分析。请参阅关于执行笔记本运行的上一部分

保护您的实例

您可以使用默认的 Google 管理的网络部署 Vertex AI Workbench 实例,该网络使用默认 VPC 网络和子网。您也可以不使用默认网络,而是指定用于实例的 VPC 网络。

默认情况下,Google Cloud 会使用 Google 管理的加密密钥自动加密静态数据。如果您对保护数据的密钥有特定的合规性或监管要求,则可以将客户管理的加密密钥 (CMEK) 用于 Vertex AI Workbench 实例。 如需了解详情,请参阅客户管理的加密密钥

空闲实例自动关停

为帮助管理费用,默认情况下,Vertex AI Workbench 实例在空闲一段时间后会关停。您可以更改时长或关闭此功能。如需了解详情,请参阅空闲机器关停

添加 conda 环境

Vertex AI Workbench 实例使用基于 conda 环境的内核。 您可以将 conda 环境添加到 Vertex AI Workbench 实例,该环境在实例的 JupyterLab 界面中显示为内核。

添加 conda 环境后,您便可以使用默认的 Vertex AI Workbench 实例中没有的内核。例如,您可以为 R 和 Apache Beam 添加 conda 环境。或者,您可以为特定旧版可用框架(例如 TensorFlow、PyTorch 或 Python)添加 conda 环境。

如需了解详情,请参阅添加 conda 环境

自定义容器

您可以基于自定义容器创建 Vertex AI Workbench 实例。从 Google 提供的基础容器映像入手,并根据您的需求进行修改。然后,根据您的自定义容器创建实例。

如需了解详情,请参阅使用自定义容器创建实例

Dataproc 集成

您可以通过在 Dataproc 集群上运行笔记本来快速处理数据。设置集群后,您可以在不离开 JupyterLab 界面的情况下在集群中运行笔记本文件。如需了解详情,请参阅创建已启用 Dataproc 的实例

使用第三方凭据创建实例

您可以使用 Workforce Identity Federation 提供的第三方凭据创建和管理 Vertex AI Workbench 实例。员工身份联合使用外部身份提供方 (IdP) 通过代理为一组用户授予对 Vertex AI Workbench 实例的访问权限。

通过向 Vertex AI Workbench 实例的服务账号分配员工池主账号,即可授予对 Vertex AI Workbench 实例的访问权限。

如需了解详情,请参阅使用第三方凭据创建实例

Vertex AI Workbench 实例的标记

Vertex AI Workbench 实例的底层虚拟机是 Compute Engine 虚拟机。您可以通过 Vertex AI Workbench 实例的 Compute Engine 虚拟机向其添加和管理资源标记。

创建 Vertex AI Workbench 实例时,Vertex AI Workbench 会附加 Compute Engine 资源标记 vertex-workbench-instances:prod=READ_ONLY。此资源标记仅供内部使用。

如需详细了解如何管理 Compute Engine 实例的标记,请参阅管理资源的标记

限制

在规划项目时,请考虑 Vertex AI Workbench 实例的以下限制:

  • 不支持第三方 JupyterLab 扩展程序。

  • 使用 Access Context ManagerChrome 企业进阶版通过情境感知访问权限控制保护 Vertex AI Workbench 实例时,系统会在每次用户向实例进行身份验证时评估其访问权限。例如,系统会在用户首次访问 JupyterLab 时评估访问权限,还会在之后每次访问时评估访问权限(如果用户网络浏览器的 Cookie 过期)。

  • 使用未从 Google 提供的基础容器 (gcr.io/deeplearning-platform-release/workbench-container:latest) 派生的自定义容器会增加与我们服务的兼容性问题风险,并且不受支持。您可以改为修改基础容器,以创建符合您需求的自定义容器,然后使用自定义容器创建实例

  • Vertex AI Workbench 实例需要来自 cloud-notebooks-managed 项目的映像。您可以在 Google Cloud 控制台中的创建页面上查看映像名称列表。虽然可以将自定义虚拟机 (VM) 映像或 Deep Learning VM 映像与 Vertex AI Workbench 实例搭配使用,但 Vertex AI Workbench 不会对使用这些映像时出现的意外行为或故障提供任何支持。

  • 不支持使用用户管理的笔记本映像或托管式笔记本映像创建 Vertex AI Workbench 实例。

  • 您无法使用 Google Cloud 控制台或 Compute Engine API 修改 Vertex AI Workbench 实例的底层虚拟机。如需修改 Vertex AI Workbench 实例的底层虚拟机,请使用 Notebooks API 中的 projects.locations.instances.patch 方法或 Google Cloud SDK 中的 gcloud workbench instances update命令。

  • 在使用 VPC Service Controls 的实例中,不支持使用执行程序

  • 不支持修改 Vertex AI Workbench 实例的网络标记。

  • 如需将加速器与 Vertex AI Workbench 实例搭配使用,所需的加速器类型必须在实例的可用区中可用。如需了解各可用区的加速器可用性,请参阅 GPU 区域和可用区可用性

后续步骤