Automatische Zonenplatzierung in Dataproc

Wenn Sie einen Dataproc-Cluster erstellen, verwenden die Clusterressourcen regionale Endpunkte, die auf Compute Engine-Zonen basieren. Wenn Sie eine Region auswählen, können Sie eine Zone innerhalb dieser Region auswählen. Sie können auch die Zone auslassen, damit die Dataproc-Funktion zur automatischen Zonenplatzierung eine Zone in der von Ihnen ausgewählten Region auswählt. Sobald eine Zone ausgewählt ist, werden alle Knoten für diesen Cluster in dieser Zone bereitgestellt.

Auto Zone- und Ressourcenreservierungen

Auto Zone wird das Erstellen eines Clusters in einer Zone mit Ressourcenreservierungen priorisiert. Die Prioritäten sind dabei so festgelegt:

  • Wenn die angeforderten Clusterressourcen vollständig durch reservierte und bei Bedarf auch durch On-Demand-Ressourcen in einer Zone abgedeckt werden können, werden die reservierten und On-Demand-Ressourcen von Auto Zone verwendet und der Cluster in dieser Zone erstellt.

  • Bei der Auto Zone werden Zonen anhand der Anzahl der CPU-Kernreservierungen (vCPU) in einer Zone priorisiert.

    Beispiel:In einer Anfrage zum Erstellen eines Clusters werden 20 n2-standard-2 und 1 n2-standard-64 angegeben (40 + 64 vCPUs angefordert). Bei der Auto Zone werden die folgenden Zonen gemäß der Gesamtzahl der in der Zone verfügbaren vCPU-Reservierungen priorisiert:

    1. zone-c verfügbare Reservierungen: 3 n2-standard-2 und 1 n2-standard-64 (70 vCPUs)
    2. zone-b verfügbare Reservierungen: 1 n2-standard-64 (64 vCPUs)
    3. zone-a verfügbare Reservierungen: 25 n2-standard-2 (50 vCPUs)

      Angenommen, jede der oben genannten Zonen verfügt über zusätzliche On-Demand-vCPU und andere Ressourcen, die ausreichen, um die Clusteranfrage zu erfüllen, wird Auto Zone zone-c für die Clustererstellung auswählen.

  • Wenn die angeforderten Clusterressourcen nicht vollständig durch reservierte und On-Demand-Ressourcen in einer Zone abgedeckt werden können, erstellt Auto Zone den Cluster in einer Zone, in der die Anfrage mit On-Demand-Ressourcen am ehesten erfüllt werden kann.

Automatische Zonenplatzierung verwenden

Console

So erstellen Sie einen Dataproc-Cluster mit automatischer Zonenplatzierung:

  • Öffnen Sie in der Google Cloud Console die Dataproc-Seite Dataproc-Cluster in der Compute Engine erstellen. Der Bereich Cluster einrichten ist ausgewählt.
  • Gehen Sie im Bereich Standort so vor:
    • Wählen Sie eine Region für den Cluster aus.
    • Wählen Sie unter Zone die Option „Beliebig“ aus.

gcloud-Befehl

Verwenden Sie den Befehl gcloud dataproc clusters create, um einen Dataproc-Cluster mit automatischer Zonenplatzierung zu erstellen. Setzen Sie das --region-Flag auf eine Region und lassen Sie das --zone-Flag weg. Sie können das Flag auch leer lassen: --zone= oder zone="".

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

REST API

Gehen Sie zum Erstellen eines Dataproc-Clusters mit automatischer Zonenplatzierung so vor: Erstellen Sie die JSON API-Anfrage clusters.create und lassen Sie das Feld gceClusterConfig.zoneUri leer. Geben Sie im REST-Endpunkt https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters einen Regionsnamen ein. Die automatische Zonenplatzierung von Dataproc wählt eine Zone für den Cluster innerhalb der angegebenen Region aus.

Kurze Ressourcennamen bei der Auto Zone verwenden: Wenn Sie in einer REST API-Anfrage zum Erstellen eines Clusters mit automatischer Zonenplatzierung einen Ressourcen-URI angeben, z. B. machineTypeUri oder acceleratorTypeUri, verwenden Sie einen kurzen Ressourcennamen ohne Zonenspezifikation, z. B. „n1-standard-2“ oder „nvidia-tesla-t4“.