Google Kubernetes Engine(GKE)에서 Ray 연산자 사용 설정


이 페이지에서는 Google Kubernetes Engine(GKE)용 Ray 연산자를 사용 설정하여 KubeRay API를 사용하여 Ray 클러스터를 확장하고 관리하는 방법을 보여줍니다. Ray 및 KubeRay에 대한 자세한 내용은 GKE의 Ray 개요를 참조하세요.

시작하기 전에

시작하기 전에 다음 태스크를 수행했는지 확인합니다.

  • Google Kubernetes Engine API를 사용 설정합니다.
  • Google Kubernetes Engine API 사용 설정
  • 이 태스크에 Google Cloud CLI를 사용하려면 gcloud CLI를 설치한 후 초기화합니다. 이전에 gcloud CLI를 설치한 경우 gcloud components update를 실행하여 최신 버전을 가져옵니다.

클러스터에 Ray 연산자 사용 설정

Google Cloud CLI, Google Cloud 콘솔 또는 Terraform을 사용하여 신규 또는 기존 Autopilot 또는 Standard GKE 클러스터에서 Ray 연산자를 사용 설정할 수 있습니다.

콘솔

  1. Google Cloud 콘솔에서 Google Kubernetes Engine 페이지로 이동합니다.

    Google Kubernetes Engine으로 이동

  2. 만들기를 클릭하고 Standard 또는 Autopilot 섹션에서 구성을 클릭합니다.

  3. Standard의 경우 탐색창의 클러스터에서 기능을 클릭합니다. Autopilot의 경우 고급 설정을 클릭합니다.

  4. AI 및 머신러닝 섹션에서 Ray 연산자 사용 설정 체크박스를 선택합니다.

  5. 만들기를 클릭합니다.

gcloud

--addons=RayOperator 옵션을 사용하여 클러스터를 만듭니다.

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

다음을 바꿉니다.

  • CLUSTER_NAME: 새 클러스터의 이름입니다.
  • VERSION: GKE 버전. 1.30.0-gke.1747000 이상이어야 합니다. --release-channel 옵션을 사용하여 출시 채널을 선택할 수도 있습니다. 출시 채널은 기본 버전이 1.30.0-gke.1747000 이상이어야 합니다.

--update-addons=RayOperator=ENABLED 옵션과 함께 gcloud container clusters update 명령어를 사용하여 기존 클러스터에서 Ray 연산자를 사용 설정할 수 있습니다.

Terraform

다음 Terraform 예에서는 Standard 클러스터를 만들고 구성합니다.

resource "google_container_cluster" "ray-cluster" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }

  # Set `deletion_protection` to `true` will ensure that one cannot
  # accidentally delete this instance by use of Terraform.
  deletion_protection = false
}

Terraform 사용에 대한 자세한 내용은 GKE에 대한 Terraform 지원을 참조하세요.

버전 관리

Ray 연산자는 해당하는 KubeRay 버전과 함께 다음 GKE 마이너 버전에서 사용할 수 있습니다.

GKE 마이너 버전 KubeRay 버전
1.31 v1.2
1.30 v1.1
1.29 v1.1

Ray 연산자가 사용 설정되었는지 확인

gcloud CLI 또는 Google Cloud 콘솔을 사용하여 Autopilot 또는 표준 GKE 클러스터에서 Ray 연산자가 사용 설정되었는지 확인할 수 있습니다.

콘솔

  1. Google Cloud 콘솔에서 Google Kubernetes Engine 페이지로 이동합니다.

    Google Kubernetes Engine으로 이동

  2. 클러스터 목록에서 확인할 클러스터 이름을 클릭합니다.

  3. 특성 섹션에서 Ray 연산자 체크박스가 선택되어 있는지 확인합니다.

gcloud

클러스터를 설명합니다.

gcloud container clusters describe CLUSTER_NAME

CLUSTER_NAME을 클러스터 이름으로 바꿉니다.

출력은 다음과 비슷합니다.

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

이 출력은 클러스터에 Ray 연산자가 사용 설정되었음을 나타냅니다.

다음 단계