커스텀 컨테이너를 사용하여 인스턴스 만들기

이 페이지에서는 커스텀 컨테이너를 기반으로 Vertex AI Workbench 인스턴스를 만드는 방법을 설명합니다.

개요

Vertex AI Workbench 인스턴스는 Google에서 제공하는 기본 컨테이너 중 하나에서 파생된 커스텀 컨테이너를 사용할 수 있습니다. 이러한 기본 컨테이너를 수정하여 커스텀 컨테이너 이미지를 만들고 이러한 커스텀 컨테이너를 사용하여 Vertex AI Workbench 인스턴스를 만들 수 있습니다.

기본 컨테이너는 호스트 가상 머신(VM)에서 Container-Optimized OS로 구성됩니다. 호스트 이미지는 cos-stable 이미지 계열에서 빌드됩니다.

제한사항

프로젝트를 계획할 때 다음 제한사항을 고려하세요.

커스텀 컨테이너는 Google에서 제공하는 기본 컨테이너에서 파생되어야 합니다. 기본 컨테이너에서 파생되지 않은 컨테이너를 사용하면 호환성 문제가 발생할 위험이 증가하고 Vertex AI Workbench 인스턴스 사용을 지원하는 기능이 제한됩니다.
Vertex AI Workbench 인스턴스에서는 컨테이너를 두 개 이상 사용할 수 없습니다.
사용자 관리 노트북과 관리형 노트북의 커스텀 컨테이너에 지원되는 메타데이터는 Vertex AI Workbench 인스턴스와 함께 사용될 때 다르게 작동할 수 있습니다.
커스텀 컨테이너를 호스팅하는 VM은 Container-Optimized OS에서 실행되므로 호스트 머신과 상호작용하는 방식이 제한됩니다. 예를 들어 Container-Optimized OS에는 패키지 관리자가 포함되어 있지 않습니다. 즉, 호스트에서 작동하는 패키지를 마운트가 있는 컨테이너에서 수행해야 합니다. 이는 관리형 노트북 인스턴스와 사용자 관리 노트북 인스턴스에서 마이그레이션된 시작 후 스크립트에 영향을 미칩니다. 여기서 호스트 머신에는 Container-Optimized OS보다 훨씬 많은 도구가 포함되어 있습니다.
Vertex AI Workbench 인스턴스는 커스텀 컨테이너를 실행하는 데 nerdctl(containerd CLI)를 사용합니다. 이는 이미지 스트리밍 서비스와의 호환성을 위해 필요합니다. 메타데이터 값을 통해 추가된 모든 컨테이너 파라미터는 nerdctl에서 지원하는 사항을 준수해야 합니다.
Vertex AI Workbench 인스턴스는 Artifact Registry 또는 공개 컨테이너 저장소에서 가져오도록 구성됩니다. 인스턴스를 비공개 저장소에서 가져오도록 구성하려면 containerd에서 사용하는 사용자 인증 정보를 수동으로 구성해야 합니다.

기본 컨테이너

표준 기본 컨테이너

표준 기본 컨테이너는 모든 Vertex AI Workbench 기능을 지원하며 다음을 포함합니다.

사전 설치된 데이터 과학 패키지
Deep Learning Containers와 유사한 Cuda 라이브러리
Dataproc 및 BigQuery 통합과 같은Google Cloud JupyterLab 통합
curl 또는 git과 같은 일반적인 시스템 패키지
메타데이터 기반 JupyterLab 구성
Micromamba 기반 커널 관리

사양

표준 기본 컨테이너 사양은 다음과 같습니다.

기본 이미지: nvidia/cuda:12.6.1-cudnn-devel-ubuntu24.04
이미지 크기: 약 22GB
URI: us-docker.pkg.dev/deeplearning-platform-release/gcr.io/workbench-container:latest

슬림 기본 컨테이너

슬림 기본 컨테이너는 인스턴스에 대한 프록시 연결을 허용하는 최소 구성 집합을 제공합니다. 다음을 제외하고 표준 Vertex AI Workbench 기능과 패키지는 포함되지 않습니다.

JupyterLab
메타데이터 기반 JupyterLab 구성
Micromamba 기반 커널 관리

추가 패키지나 JupyterLab 확장 프로그램을 독립적으로 설치하고 관리해야 합니다.

사양

슬림 기본 컨테이너 사양은 다음과 같습니다.

기본 이미지: marketplace.gcr.io/google/ubuntu24.04
이미지 크기: 약 2GB
URI: us-docker.pkg.dev/deeplearning-platform-release/gcr.io/workbench-container-slim:latest

시작하기 전에

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Make sure that billing is enabled for your Google Cloud project.

Enable the Notebooks API.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Make sure that billing is enabled for your Google Cloud project.

Enable the Notebooks API.

Enable the API

필요한 역할

커스텀 컨테이너로 Vertex AI Workbench 인스턴스를 만드는 데 필요한 권한을 얻으려면 관리자에게 다음 IAM 역할을 부여해 달라고 요청하세요.

사용자 계정에 대한 Notebooks 실행자(roles/notebooks.runner)
Artifact Registry 저장소에서 이미지를 가져오기: 서비스 계정에 대한 Artifact Registry 리더(roles/artifactregistry.reader)

역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.

커스텀 컨테이너 만들기

Vertex AI Workbench 인스턴스에서 사용할 커스텀 컨테이너를 만들려면 다음 안내를 따르세요.

Google에서 제공하는 기본 컨테이너 이미지에서 파생된 파생 컨테이너를 만듭니다.
컨테이너를 빌드하고 Artifact Registry로 내보냅니다. Vertex AI Workbench 인스턴스를 만들 때 컨테이너 URI를 사용합니다. 예를 들어 URI는 gcr.io/PROJECT_ID/IMAGE_NAME과 같이 표시될 수 있습니다.

인스턴스 만들기

Google Cloud 콘솔 또는 Google Cloud CLI를 사용하여 커스텀 컨테이너를 기반으로 Vertex AI Workbench 인스턴스를 만들 수 있습니다.

콘솔

커스텀 컨테이너를 기반으로 Vertex AI Workbench 인스턴스를 만들려면 다음을 수행합니다.

Google Cloud 콘솔에서 인스턴스 페이지로 이동합니다.

인스턴스로 이동
새로 만들기를 클릭합니다.
새 인스턴스 대화상자에서 고급 옵션을 클릭합니다.
인스턴스 만들기 대화상자의 환경 섹션에서 커스텀 컨테이너 사용을 선택합니다.
Docker 컨테이너 이미지에서 선택을 클릭합니다.
컨테이너 이미지 선택 대화상자에서 사용하려는 컨테이너 이미지로 이동한 후 선택을 클릭합니다.
(선택사항) 시작 후 스크립트에 사용하려는 시작 후 스크립트의 경로를 입력합니다.
(선택사항) 인스턴스 메타데이터를 추가합니다. 자세한 내용은 커스텀 컨테이너 메타데이터를 참조하세요.
(선택사항) 네트워킹 섹션에서 네트워크 설정을 맞춤설정합니다. 자세한 내용은 네트워크 구성 옵션을 참조하세요.
인스턴스 만들기 대화상자의 나머지 부분을 완료한 후 만들기를 클릭합니다.

Vertex AI Workbench에서 인스턴스를 만들고 자동으로 시작합니다. 인스턴스를 사용할 수 있으면 Vertex AI Workbench에서 JupyterLab 열기 링크를 활성화합니다.

gcloud

아래의 명령어 데이터를 사용하기 전에 다음을 바꿉니다.

INSTANCE_NAME: Vertex AI Workbench 인스턴스의 이름입니다. 문자로 시작해야 하고 이어서 최대 62자의 소문자, 숫자 또는 하이픈(-)이 와야 하며 하이픈으로 끝나서는 안 됩니다.
PROJECT_ID: 프로젝트 ID입니다.
LOCATION: 인스턴스를 배치할 영역
CUSTOM_CONTAINER_PATH: 컨테이너 이미지 저장소의 경로(예: gcr.io/PROJECT_ID/IMAGE_NAME)
METADATA: 이 인스턴스에 적용할 커스텀 메타데이터. 예를 들어 시작 후 스크립트를 지정하려면 post-startup-script 메타데이터 태그를 다음 형식으로 사용할 수 있습니다. "--metadata=post-startup-script=gs://BUCKET_NAME/hello.sh"

다음 명령어를 실행합니다.

Linux, macOS 또는 Cloud Shell

gcloud workbench instances create INSTANCE_NAME \
    --project=PROJECT_ID \
    --location=LOCATION \
    --container-repository=CUSTOM_CONTAINER_URL \
    --container-tag=latest \
    --metadata=METADATA

Windows(PowerShell)

gcloud workbench instances create INSTANCE_NAME `
    --project=PROJECT_ID `
    --location=LOCATION `
    --container-repository=CUSTOM_CONTAINER_URL `
    --container-tag=latest `
    --metadata=METADATA

Windows(cmd.exe)

gcloud workbench instances create INSTANCE_NAME ^
    --project=PROJECT_ID ^
    --location=LOCATION ^
    --container-repository=CUSTOM_CONTAINER_URL ^
    --container-tag=latest ^
    --metadata=METADATA

명령줄에서 인스턴스를 만드는 명령어에 대한 자세한 내용은 gcloud CLI 문서를 참조하세요.

Vertex AI Workbench에서 인스턴스를 만들고 자동으로 시작합니다. 인스턴스를 사용할 수 있으면 Vertex AI Workbench에서 Google Cloud 콘솔에 JupyterLab 열기 링크를 활성화합니다.

네트워크 구성 옵션

커스텀 컨테이너가 있는 Vertex AI Workbench 인스턴스는 일반 네트워크 옵션 외에도 Artifact Registry 서비스에 액세스할 수 있어야 합니다.

VPC의 공개 IP 액세스를 사용 중지한 경우 비공개 Google 액세스를 사용 설정했는지 확인합니다.

이미지 스트리밍 사용 설정

커스텀 컨테이너 호스트는 Google Kubernetes Engine(GKE)의 이미지 스트리밍과 상호작용하도록 프로비저닝됩니다. 이미지 스트리밍은 컨테이너를 더 빠르게 가져오고 대용량 컨테이너가 GKE 원격 파일 시스템에 캐시되면 대용량 컨테이너의 초기화 시간을 줄입니다.

이미지 스트리밍을 사용 설정하기 위한 요구사항은 요구사항을 참조하세요. Container File System API를 사용 설정하면 Vertex AI Workbench 인스턴스에서 이미지 스트리밍을 사용할 수 있는 경우가 많습니다.

Container File System API 사용 설정

호스트 VM에서 커스텀 컨테이너를 실행하는 방법

호스트 VM은 Docker를 사용하여 커스텀 컨테이너를 실행하는 대신 Kubernetes 네임스페이스 아래의 nerdctl을 사용하여 컨테이너를 로드하고 실행합니다. 이렇게 하면 Vertex AI Workbench에서 커스텀 컨테이너에 이미지 스트리밍을 사용할 수 있습니다.

# Runs the custom container.
sudo /var/lib/google/nerdctl/nerdctl --snapshotter=gcfs -n k8s.io run --name payload-container

설치 예시: 커스텀 기본 커널이 있는 커스텀 컨테이너

다음 예시에서는 pip 패키지가 사전 설치된 새 커널을 만드는 방법을 보여줍니다.

새 커스텀 컨테이너를 만듭니다.

FROM us-docker.pkg.dev/deeplearning-platform-release/gcr.io/workbench-container:latest

ENV MAMBA_ROOT_PREFIX=/opt/micromamba

RUN micromamba create -n ENVIRONMENT_NAME -c conda-forge python=PYTHON_VERSION -y

SHELL ["micromamba", "run", "-n", "ENVIRONMENT_NAME", "/bin/bash", "-c"]

RUN micromamba install -c conda-forge pip -y
RUN pip install PACKAGE
RUN pip install ipykernel
RUN python -m ipykernel install --prefix /opt/micromamba/envs/ENVIRONMENT_NAME --name ENVIRONMENT_NAME --display-name KERNEL_NAME
# Creation of a micromamba kernel automatically creates a python3 kernel
# that must be removed if it's in conflict with the new kernel.
RUN rm -rf "/opt/micromamba/envs/ENVIRONMENT_NAME/share/jupyter/kernels/python3"

새 컨테이너를 Artifact Registry에 추가합니다.

gcloud auth configure-docker REGION-docker.pkg.dev
docker build -t REGION-docker.pkg.dev/PROJECT_ID/REPOSITORY_NAME/IMAGE_NAME .
docker push REGION-docker.pkg.dev/PROJECT_ID/REPOSITORY_NAME/IMAGE_NAME:latest

인스턴스를 만듭니다.

gcloud workbench instances create INSTANCE_NAME  \
    --project=PROJECT_ID \
    --location=ZONE \
    --container-repository=REGION-docker.pkg.dev/PROJECT_ID/IMAGE_NAME \
    --container-tag=latest

커스텀 컨테이너 영구 커널

Vertex AI Workbench 커스텀 컨테이너는 데이터 디스크를 각 컨테이너 내 /home/USER 디렉터리에만 마운트합니다. 여기서 jupyter는 기본 사용자입니다. 즉, /home/USER 외부의 모든 변경사항은 일시적이며 다시 시작 후에는 유지되지 않습니다. 특정 커널에 설치된 패키지가 유지되어야 하는 경우 /home/USER 디렉터리에 커널을 만들면 됩니다.

/home/USER 디렉터리에 커널을 만들려면 다음 안내를 따르세요.

micromamba 환경을 만듭니다.

micromamba create -p /home/USER/ENVIRONMENT_NAME -c conda-forge python=3.11 -y
micromamba activate /home/USER/ENVIRONMENT_NAME
pip install ipykernel
pip install -r ~/requirement.txt
python -m ipykernel install --prefix "/home/USER/ENVIRONMENT_NAME" --display-name "Example Kernel"

다음을 바꿉니다.

USER: 사용자 디렉터리 이름(기본값: jupyter)
ENVIRONMENT_NAME: 환경의 이름입니다.
PYTHON_VERSION: Python 버전(예: 3.11)

커널이 새로고침될 때까지 30초~1분 정도 기다립니다.

기본 컨테이너 시작 업데이트

Vertex AI Workbench 인스턴스의 기본 컨테이너(us-docker.pkg.dev/deeplearning-platform-release/gcr.io/workbench-container:latest)는 /run_jupyter.sh를 실행하여 JupyterLab을 시작합니다.

파생 컨테이너에서 컨테이너 시작을 수정하는 경우 /run_jupyter.sh를 추가하여 JupyterLab 기본 구성을 실행해야 합니다.

다음은 Dockerfile을 수정하는 방법의 예시입니다.

# DockerFile
FROM us-docker.pkg.dev/deeplearning-platform-release/gcr.io/workbench-container:latest

CP startup_file.sh /
# Ensure that you have the correct permissions and startup is executable.
RUN chmod 755 /startup_file.sh && \
    chown jupyter:jupyter /startup_file.sh

# Override the existing CMD directive from the base container.
CMD ["/startup_file.sh"]

# /startup_file.sh

echo "Running startup scripts"
...

/run_jupyter.sh

기본 컨테이너 내에서 JupyterLab 구성 업데이트

기본 컨테이너에서 JupyterLab 구성을 수정해야 하는 경우에는 다음을 수행해야 합니다.

JupyterLab이 포트 8080으로 구성되어 있는지 확인합니다. 프록시 에이전트는 모든 요청을 포트 8080으로 전달하도록 구성되어 있으며 Jupyter 서버에서 올바른 포트를 리슨하지 않으면 인스턴스에 프로비저닝 문제가 발생합니다.
jupyterlab micromamba 환경에서 JupyterLab 패키지를 수정합니다. Google은 종속 항목이 커널 환경과 충돌하지 않도록 JupyterLab과 해당 플러그인을 실행하는 별도의 패키지 환경을 제공합니다. JupyterLab 확장 프로그램을 추가로 설치하려면 jupyterlab 환경 내에 설치해야 합니다. 예를 들면 다음과 같습니다.
```
# DockerFile
FROM us-docker.pkg.dev/deeplearning-platform-release/gcr.io/workbench-container:latest
RUN micromamba activate jupyterlab && \
  jupyter nbextension install nbdime
```

커스텀 컨테이너 메타데이터

Vertex AI Workbench 인스턴스에 적용할 수 있는 표준 메타데이터 목록 외에도 커스텀 컨테이너가 있는 인스턴스에는 페이로드 컨테이너 인스턴스화를 관리할 수 있도록 다음 메타데이터가 포함됩니다.

기능	설명	메타데이터 키	허용되는 값과 기본값
컨테이너 이미지에서 Cloud Storage FUSE 사용 설정	`/dev/fuse`를 컨테이너에 마운트하고 컨테이너에서 사용할 수 있도록 `gcsfuse`를 사용 설정합니다.	`container-allow-fuse`	`true`: Cloud Storage FUSE를 사용 설정합니다. `false`(기본값): Cloud Storage FUSE를 사용 설정하지 않습니다.
추가 컨테이너 실행 파라미터	`nerdctl run`에 추가 컨테이너 파라미터를 추가합니다. 여기서 `nerdctl`은 Containerd CLI입니다.	`container-custom-params`	컨테이너 실행 파라미터 문자열입니다. 예를 들면 `--v /mnt/disk1:/mnt/disk1`입니다.
추가 컨테이너 환경 플래그	환경 변수를 `/mnt/stateful_partition/workbench/container_env` 아래의 플래그에 저장하고 `nerdctl run`에 추가합니다.	`container-env-file`	컨테이너 환경 변수 문자열입니다. 예를 들면 `CONTAINER_NAME=derivative-container`입니다.

커스텀 컨테이너 업그레이드

인스턴스가 처음 시작되면 custom-container-payload 메타데이터에 저장된 URI에서 컨테이너 이미지를 가져옵니다. :latest 태그를 사용하면 다시 시작할 때마다 컨테이너가 업데이트됩니다. custom-container-payload 메타데이터 값은 보호된 메타데이터 키이므로 이 값을 직접 수정할 수 없습니다.

인스턴스의 커스텀 컨테이너 이미지를 업데이트하려면 Google Cloud CLI, Terraform 또는 Notebooks API에서 지원하는 다음 방법을 사용하면 됩니다.

gcloud

다음 명령어를 사용하여 Vertex AI Workbench 인스턴스에서 커스텀 컨테이너 이미지 메타데이터를 업데이트할 수 있습니다.

gcloud workbench instances update INSTANCE_NAME \
    --container-repository=CONTAINER_URI \
    --container-tag=CONTAINER_TAG

Terraform

Terraform 구성에서 container_image 필드를 변경하여 컨테이너 페이로드를 업데이트할 수 있습니다.

Terraform 구성을 적용하거나 삭제하는 방법은 기본 Terraform 명령어를 참조하세요.

resource "google_workbench_instance" "default" {
  name     = "workbench-instance-example"
  location = "us-central1-a"

  gce_setup {
    machine_type = "n1-standard-1"
    container_image {
      repository = "us-docker.pkg.dev/deeplearning-platform-release/gcr.io/workbench-container"
      family  = "latest"
    }
  }
}

Notebooks API

instances.patch 메서드를 사용하고 updateMask에서 gce_setup.container_image.repository 및 gce_setup.container_image.tag를 변경합니다.

진단도구 실행

진단 도구는 다양한 Vertex AI Workbench 서비스의 상태를 검사하고 확인합니다. 자세한 내용은 진단 도구에서 수행하는 태스크를 참조하세요.

커스텀 컨테이너를 사용하여 Vertex AI Workbench 인스턴스를 만들면 사용자가 실행할 수 있는 호스트 환경에서 진단 도구를 스크립트로 사용할 수 없습니다. 대신 바이너리로 컴파일되고 Container-Optimized OS 환경에서 진단 서비스를 실행하기 위해 빌드된 Google 런타임 컨테이너에 로드됩니다. Container-Optimized OS 개요를 참조하세요.

진단 도구를 실행하려면 다음 단계를 완료합니다.

ssh를 사용하여 Vertex AI Workbench 인스턴스에 연결합니다.

SSH 터미널에서 다음 명령어를 실행합니다.

sudo docker exec diagnostic-service ./diagnostic_tool

추가 명령어 옵션을 보려면 다음 명령어를 실행합니다.
```
sudo docker exec diagnostic-service ./diagnostic_tool --help
```

진단 도구 옵션에 대한 자세한 내용은 상태 모니터링 문서를 참조하세요.

REST API를 사용하여 진단 도구를 실행하려면 REST API 참고 리소스를 참조하세요.

인스턴스에 액세스

프록시 URL을 통해 인스턴스에 액세스할 수 있습니다.

인스턴스가 생성되고 활성 상태가 되면 gcloud CLI를 사용하여 프록시 URL을 가져올 수 있습니다.

아래의 명령어 데이터를 사용하기 전에 다음을 바꿉니다.

INSTANCE_NAME: Vertex AI Workbench 인스턴스 이름
PROJECT_ID: 프로젝트 ID입니다.
LOCATION: 인스턴스가 있는 영역입니다.

다음 명령어를 실행합니다.

Linux, macOS 또는 Cloud Shell

gcloud workbench instances describe INSTANCE_NAME \
--project=PROJECT_ID \
--location=LOCATION | grep proxy-url

Windows(PowerShell)

gcloud workbench instances describe INSTANCE_NAME `
--project=PROJECT_ID `
--location=LOCATION | grep proxy-url

Windows(cmd.exe)

gcloud workbench instances describe INSTANCE_NAME ^
--project=PROJECT_ID ^
--location=LOCATION | grep proxy-url

proxy-url: 7109d1b0d5f850f-dot-datalab-vm-staging.googleusercontent.com

describe 명령어는 프록시 URL을 반환합니다. 인스턴스에 액세스하려면 웹브라우저에서 프록시 URL을 엽니다.

명령줄에서 인스턴스를 설명하는 명령어에 대한 자세한 내용은 gcloud CLI 문서를 참조하세요.