Posizionamento della zona automatica di Dataproc

Quando crei un cluster Dataproc, le risorse del cluster utilizzano un endpoint regionale in base alle zone di Compute Engine. Quando scegli una regione, puoi selezionare una zona al suo interno oppure omettere la zona per fare in modo che la funzionalità Zona automatica di Dataproc selezioni una zona per te nella regione che scegli. Una volta selezionata una zona, tutti i nodi del cluster verranno di cui è stato eseguito il deployment in quella zona.

Prenotazioni Selezione automatica della zona e risorse

Selezione automatica della zona dà la priorità alla creazione di un cluster in una zona con prenotazioni di risorse, come segue:

  • Se le risorse del cluster richieste possono essere soddisfatte completamente dalle risorse riservate e, se necessario, dalle risorse on demand in una zona, Selezione automatica della zona utilizzerà le risorse riservate e on demand e creerà il cluster in quella zona.

  • Selezione automatica della zona assegna la priorità alle zone per la selezione in base alle prenotazioni totali di core CPU (vCPU) in una zona.

    Esempio: una richiesta di creazione del cluster specifica 20 n2-standard-2 e 1 n2-standard-64 (40 + 64 vCPUs richiesti). Selezione automatica della zona darà la priorità alle seguenti zone per la selezione in base al totale delle prenotazioni vCPU disponibili nella zona:

    1. zone-c prenotazioni disponibili: 3 n2-standard-2 e 1 n2-standard-64 (70 vCPUs)
    2. zone-b prenotazioni disponibili: 1 n2-standard-64 (64 vCPUs)
    3. zone-a prenotazioni disponibili: 25 n2-standard-2 (50 vCPUs)

      Supponendo che ciascuna di queste zone disponga di vCPU on demand aggiuntive e di altre risorse sufficienti a soddisfare la richiesta del cluster, la Selezione automatica della zona selezionerà zone-c per la creazione del cluster.

  • Se le risorse del cluster richieste non possono essere soddisfatte completamente dalle risorse prenotate più on demand in una zona, laSelezione automatica della zonaa creerà il cluster in una zona che ha maggiori probabilità di soddisfare la richiesta utilizzando risorse on demand.

Utilizzare la selezione automatica della zona

Console

Per creare un cluster Dataproc che utilizza il posizionamento Selezione automatica della zona:

  1. Nella console Google Cloud , apri la pagina Crea un cluster Dataproc su Compute Engine. Il riquadro Configura cluster è selezionato.
  2. Nella sezione Località, segui questi passaggi:
    • Seleziona una regione per il cluster.
    • Nella sezione Zona, seleziona "Qualsiasi".

Comando g-cloud

Per creare un cluster Dataproc che utilizza il posizionamento Selezione automatica della zona, utilizza il comando gcloud dataproc clusters create. Imposta il flag --region su una regione e ometti il flag --zone (o lascia vuoto il flag: --zone= o zone="").

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

API REST

Per creare un cluster Dataproc che utilizza il posizionamento Selezione automatica della zona, crea una richiesta API clusters.create in formato JSON, lasciando vuoto il campo gceClusterConfig.zoneUri. Nell'endpoint REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, inserisci il nome di una regione. La funzionalità Zona automatica di Dataproc sceglierà una zona per il cluster all'interno della regione specificata.

Utilizza nomi di risorse brevi con il posizionamento Selezione automatica della zona zone: quando specifichi un URI risorsa, ad esempio machineTypeUri o acceleratorTypeUri, in una richiesta di creazione di cluster API REST di posizionamento Selezione automatica della zona, utilizza un nome risorsa breve senza una specifica di zona, ad esempio, "n1-standard-2" o "nvidia-tesla-t4".