Google Kubernetes Engine(GKE)で Ray Operator を有効にする


このページでは、Google Kubernetes Engine(GKE)で Ray Operator を有効にして、KubeRay API を使用して Ray クラスタをスケーリングして管理する方法について説明します。Ray と KubeRay の詳細については、GKE 上の Ray の概要をご覧ください。

始める前に

作業を始める前に、次のことを確認してください。

  • Google Kubernetes Engine API を有効にする。
  • Google Kubernetes Engine API の有効化
  • このタスクに Google Cloud CLI を使用する場合は、gcloud CLI をインストールして初期化する。すでに gcloud CLI をインストールしている場合は、gcloud components update を実行して最新のバージョンを取得する。

クラスタで Ray Operator を有効にする

新規または既存の Autopilot または Standard GKE クラスタで Ray Operator を有効にするには、Google Cloud CLI、Google Cloud コンソール、または Terraform を使用します。

コンソール

  1. Google Cloud コンソールで [Google Kubernetes Engine] ページに移動します。

    Google Kubernetes Engine に移動

  2. [ 作成] をクリックし、[Standard] セクションまたは [Autopilot] セクションで [構成] をクリックします。

  3. Standard の場合は、ナビゲーション パネルの [クラスタ] で [機能] をクリックします。Autopilot の場合は、[詳細設定] をクリックします。

  4. [AI と ML] セクションで、[Ray Operator の有効化] チェックボックスをオンにします。

  5. [作成] をクリックします。

gcloud

--addons=RayOperator オプションを使用してクラスタを作成します。

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

次のように置き換えます。

  • CLUSTER_NAME: 新しいクラスタの名前。
  • VERSION: GKE バージョン。1.30.0-gke.1747000 以降にする必要があります。--release-channel オプションを使用して、リリース チャンネルを選択することもできます。リリース チャンネルには、デフォルトのバージョン 1.30.0-gke.1747000 以降が必要です。

既存のクラスタで Ray Operator を有効にするには、--update-addons=RayOperator=ENABLED オプションを指定して gcloud container clusters update コマンドを使用します。

Terraform

次の Terraform の例では、Standard クラスタを作成して構成します。

resource "google_container_cluster" "ray-cluster" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }

  # Set `deletion_protection` to `true` will ensure that one cannot
  # accidentally delete this instance by use of Terraform.
  deletion_protection = false
}

Terraform の使用方法の詳細については、GKE での Terraform のサポートをご覧ください。

バージョニング

Ray Operator は、対応する KubeRay バージョンの次の GKE マイナー バージョンで使用できます。

GKE マイナー バージョン KubeRay のバージョン
1.31 v1.2
1.30 v1.1
1.29 v1.1

Ray Operator が有効になっていることを確認する

Autopilot または Standard GKE クラスタで Ray Operator が有効になっているかどうかは、gcloud CLI または Google Cloud コンソールで確認できます。

コンソール

  1. Google Cloud コンソールで [Google Kubernetes Engine] ページに移動します。

    Google Kubernetes Engine に移動

  2. クラスタのリストで、確認するクラスタの名前をクリックします。

  3. [機能] セクションで、[Ray Operator] チェックボックスがオンになっていることを確認します。

gcloud

クラスタの説明を表示します。

gcloud container clusters describe CLUSTER_NAME

CLUSTER_NAME は、クラスタの名前に置き換えます。

出力は次のようになります。

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

この出力は、クラスタで Ray Operator が有効になっていることを示しています。

次のステップ