Dataproc 自動選擇區域位置

建立 Dataproc 叢集時,叢集資源會依據 Compute Engine 區域使用地區端點。選擇地區時,您可以選取該地區內的區域,也可以略過區域,讓 Dataproc 自動選擇區域功能在您選擇的地區中自動選取一個區域。選取區域後,該叢集的所有節點都會部署至該區域。

自動選擇區域和預訂資源

自動選擇放置區域功能會優先在有資源預留的區域中建立叢集,如下所示:

  • 如果區域中的預留資源加上視需要使用的資源,足以滿足叢集資源要求,Auto Zone 就會使用這些資源,並在該區域中建立叢集。

  • 自動選擇區域功能會根據區域中的 CPU 核心 (vCPU) 預留總量,優先選取區域。

    範例:叢集建立要求指定 20 個 n2-standard-2 和 1 個 n2-standard-64 (要求 40 + 64 個 vCPUs)。自動選擇區域功能會根據區域中可用的 vCPU 預留資源總數,優先選取下列區域:

    1. zone-c 可預訂的座位:3 個 n2-standard-2 和 1 個 n2-standard-64 (70 vCPUs)
    2. zone-b 可用預留資源:1 個 n2-standard-64 (64 vCPUs)
    3. zone-a 可預訂的座位數:25 n2-standard-2 (50 vCPUs)

      假設這些區域都有足夠的額外隨選 vCPU 和其他資源來滿足叢集要求,自動區域就會選取 zone-c 來建立叢集。

  • 如果區域中預留和隨選資源無法完全滿足叢集資源要求,Auto Zone 會在最有可能使用隨選資源滿足要求的區域中建立叢集。

使用自動選擇區域位置

控制台

如要建立使用自動選擇區域位置的 Dataproc 叢集,請按照下列步驟操作:

  1. 在 Google Cloud 控制台中,開啟「Create a Dataproc cluster on Compute Engine」(在 Compute Engine 上建立 Dataproc 叢集) 頁面。系統會選取「設定叢集」面板。
  2. 在「地區」部分中,執行下列操作:
    • 選取叢集的區域
    • 在「區域」下方,選取「任何」。

gcloud 指令

如要建立使用自動選擇區域位置的 Dataproc 叢集,請使用 gcloud dataproc clusters create 指令。將 --region 標記設為區域,然後省略 --zone 標記 (或保持空白:--zone=zone="")。

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

REST API

如要建立使用自動選擇區域位置的 Dataproc 叢集,請建構 JSON clusters.create API 要求,將 gceClusterConfig.zoneUri 欄位留空。在 REST 端點 https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters 中,插入區域名稱。Dataproc 自動選擇區域功能會在指定的地區中為叢集選擇一個區域。

使用簡短的資源名稱搭配自動選擇區域位置:在自動選擇區域位置的 REST API 叢集建立要求中指定資源 URI (例如 machineTypeUriacceleratorTypeUri) 時,請使用不含區域規格的簡短資源名稱,例如「n1-standard-2」或「nvidia-tesla-t4」。