Dataproc supporta gli endpoint regionali in base alle regioni di Compute Engine. Quando crei un cluster Dataproc, devi specificare una regione, ad esempio "us-east1" o "europe-west1". Dataproc isolerà le risorse del cluster, come le istanze VM e Cloud Storage e l'archiviazione dei metadati, all'interno di una zona nella regione specificata.
Quando crei un cluster, puoi specificare facoltativamente una zona all'interno della regione del cluster specificata, ad esempio "us-east1-a" o "europe-west1-b". Se non specifichi la zona, il posizionamento automatico delle zone di Dataproc sceglierà una zona all'interno della regione del cluster specificata per individuare le risorse dei cluster.
Lo spazio dei nomi regionale corrisponde al segmento /regions/REGION
degli URI delle risorse Dataproc (vedi, ad esempio, il cluster networkUri
).
Semantica degli endpoint regionali
I nomi degli endpoint regionali seguono una convenzione di denominazione standard basata sulle
regioni Compute Engine.
Ad esempio, il nome della regione Stati Uniti centrali è us-central1
e il nome della regione Europa occidentale è europe-west1
. Esegui il comando gcloud compute regions list
per visualizzare un elenco delle regioni disponibili.
Crea un cluster
gcloud
Quando crei un cluster, specifica una regione utilizzando il flag
--region
obbligatorio.
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ other args ...
API REST
Utilizza il parametro URL REGION
in una richiesta
clusters.create
per specificare la regione del cluster.
gRPC
Imposta l'indirizzo di trasporto del client sull'endpoint regionale utilizzando il seguente pattern:
REGION-dataproc.googleapis.com
Esempio Python (google-cloud-python):
from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport
transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)
project_id = 'my-project'
region = 'us-central1'
cluster = {...}
Esempio Java (google-cloud-java):
ClusterControllerSettings settings =
ClusterControllerSettings.newBuilder()
.setEndpoint("us-central1-dataproc.googleapis.com:443")
.build();
try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
String projectId = "my-project";
String region = "us-central1";
Cluster cluster = Cluster.newBuilder().build();
Cluster response =
clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
}
Console
Specifica una regione Dataproc nella sezione Località del riquadro Configura cluster nella pagina Crea un cluster di Dataproc nella console Google Cloud .
Passaggi successivi
- Geografia e regioni
- Compute Engine→Regioni e zone
- Compute Engine→Risorse globali, regionali e di zona
- Posizionamento automatico della zona di Dataproc