このページでは、Google Kubernetes Engine(GKE)で Ray Operator を有効にして、KubeRay API を使用して Ray クラスタをスケーリングして管理する方法について説明します。Ray と KubeRay の詳細については、GKE 上の Ray の概要をご覧ください。
始める前に
作業を始める前に、次のことを確認してください。
- Google Kubernetes Engine API を有効にする。 Google Kubernetes Engine API の有効化
- このタスクに Google Cloud CLI を使用する場合は、gcloud CLI をインストールして初期化する。すでに gcloud CLI をインストールしている場合は、
gcloud components update
を実行して最新のバージョンを取得する。
クラスタで Ray Operator を有効にする
新規または既存の Autopilot または Standard GKE クラスタで Ray Operator を有効にするには、Google Cloud CLI、Google Cloud コンソール、または Terraform を使用します。
コンソール
Google Cloud コンソールで [Google Kubernetes Engine] ページに移動します。
[
作成] をクリックし、[Standard] セクションまたは [Autopilot] セクションで [構成] をクリックします。Standard の場合は、ナビゲーション パネルの [クラスタ] で [機能] をクリックします。Autopilot の場合は、[詳細設定] をクリックします。
[AI と ML] セクションで、[Ray Operator の有効化] チェックボックスをオンにします。
[作成] をクリックします。
gcloud
--addons=RayOperator
オプションを使用してクラスタを作成します。
gcloud container clusters create CLUSTER_NAME \
--cluster-version=VERSION \
--addons=RayOperator
次のように置き換えます。
CLUSTER_NAME
: 新しいクラスタの名前。VERSION
: GKE バージョン。1.30.0-gke.1747000 以降にする必要があります。--release-channel
オプションを使用して、リリース チャンネルを選択することもできます。リリース チャンネルには、デフォルトのバージョン 1.30.0-gke.1747000 以降が必要です。
既存のクラスタで Ray Operator を有効にするには、--update-addons=RayOperator=ENABLED
オプションを指定して gcloud container clusters update
コマンドを使用します。
Terraform
次の Terraform の例では、Standard クラスタを作成して構成します。
Terraform の使用方法の詳細については、GKE での Terraform のサポートをご覧ください。
バージョニング
Ray Operator は、対応する KubeRay バージョンの次の GKE マイナー バージョンで使用できます。
GKE マイナー バージョン | KubeRay のバージョン |
---|---|
1.31 | v1.2 |
1.30 | v1.1 |
1.29 | v1.1 |
Ray Operator が有効になっていることを確認する
Autopilot または Standard GKE クラスタで Ray Operator が有効になっているかどうかは、gcloud CLI または Google Cloud コンソールで確認できます。
コンソール
Google Cloud コンソールで [Google Kubernetes Engine] ページに移動します。
クラスタのリストで、確認するクラスタの名前をクリックします。
[機能] セクションで、[Ray Operator] チェックボックスがオンになっていることを確認します。
gcloud
クラスタの説明を表示します。
gcloud container clusters describe CLUSTER_NAME
CLUSTER_NAME
は、クラスタの名前に置き換えます。
出力は次のようになります。
# Several lines omitted
addonsConfig:
rayOperatorConfig:
enabled: true
この出力は、クラスタで Ray Operator が有効になっていることを示しています。
次のステップ
- Ray on Kubernetes について学習する。
- Ray クラスタのログと指標を収集して表示する方法を学習する。
- KubeRay のドキュメントを確認する。