Google Cloud utilizza regioni suddivise in zone per definire la posizione geografica delle risorse di calcolo fisiche. Quando esegui un job su AI Platform Prediction, specifica la regione in cui vuoi che venga eseguito.
In genere, devi utilizzare la regione più vicina alla tua posizione fisica o alla posizione fisica dei tuoi utenti previsti, ma tieni presente le regioni disponibili per ciascun servizio, come indicato di seguito.
Aree geografiche disponibili
AI Platform Prediction è disponibile nelle seguenti regioni:
Americhe
Regione | Oregon us-west1 |
Los Angeles us-west2 |
Salt Lake City us-west3 |
Iowa us-central1 |
Carolina del Sud us-east1 |
N. Virginia us-east4 |
Montréal northamerica-northeast1 |
San Paolo southamerica-east1 |
---|---|---|---|---|---|---|---|---|
Previsione online (tipi di macchine MLS1 legacy) | ||||||||
Previsione online (tipi di macchine N1) | ||||||||
Previsione batch | * | * | * | * | * |
Europa
Regione | Londra europe-west2 |
Belgio europe-west1 |
Paesi Bassi europe-west4 |
Zurigo europe-west6 |
Francoforte europe-west3 |
Finlandia europe-north1 |
---|---|---|---|---|---|---|
Previsione online (tipi di macchine MLS1 legacy) | ||||||
Previsione online (tipi di macchine N1) | ||||||
Previsione batch | * | * | * | * | * |
Asia Pacifico
Regione | Mumbai asia-south1 |
Singapore asia-southeast1 |
Hong Kong asia-east2 |
Taiwan asia-east1 |
Tokyo asia-northeast1 |
Osaka asia-northeast2 |
Sydney australia-southeast1 |
Seul asia-northeast3 |
---|---|---|---|---|---|---|---|---|
Previsione online (tipi di macchine MLS1 legacy) | ||||||||
Previsione online (tipi di macchine N1) | ||||||||
Previsione batch | * | * | * | * | * | * | * |
Google Cloud fornisce anche regioni aggiuntive per prodotti diversi da AI Platform Prediction.
Considerazioni sulle regioni
Risorse insufficienti
La domanda di GPU e risorse di calcolo è elevata nella regione us-central1
.
Nei log del job potresti visualizzare il messaggio di errore: Resources are
insufficient in region: <region>. Please try a different region.
.
Per risolvere il problema, prova a utilizzare una regione diversa o riprova più tardi.
Cloud Storage
Devi eseguire il job AI Platform Prediction nella stessa regione del bucket Cloud Storage che utilizzi per leggere e scrivere i dati per il job.
Devi utilizzare la classe Standard Storage per tutti i bucket Cloud Storage che utilizzi per leggere e scrivere dati per il tuo job AI Platform Prediction.
Previsione online
Quando esegui il deployment di un modello per la previsione online, specifichi la regione in cui vuoi eseguire la previsione. Indipendentemente dal fatto che tu interagisca con la previsione online tramite l'endpoint globale (
ml.googleapis.com
) o un endpoint regionale (REGION-ml.googleapis.com
), le previsioni online vengono sempre pubblicate dalla regione predefinita specificata per il modello. L'utilizzo di un endpoint regionale per la previsione online offre una protezione aggiuntiva al tuo modello contro le interruzioni in altre regioni, in quanto isola le risorse del modello e delle versioni dalle altre regioni. Scopri di più sulle differenze tra l'utilizzo di un endpoint regionale e l'utilizzo dell'endpoint globale.I tipi di macchine di Compute Engine (N1) per la previsione online sono disponibili solo negli endpoint a livello di area geografica. I tipi di macchine Compute Engine (N1) non sono disponibili quando utilizzi l'endpoint globale.
Utilizzo delle GPU per la previsione online
L'utilizzo delle GPU per la previsione online è disponibile solo in regioni specifiche, su endpoint regionali. Non puoi utilizzare le GPU nell'endpoint globale. La tabella seguente elenca tutti gli acceleratori disponibili per la previsione online per ogni endpoint regionale:
Americhe
Regione | Oregon us-west1 |
Iowa us-central1 |
Carolina del Sud us-east1 |
N. Virginia us-east4 |
Montréal northamerica-northeast1 |
---|---|---|---|---|---|
NVIDIA Tesla P4 | |||||
NVIDIA Tesla P100 | |||||
NVIDIA Tesla T4 | |||||
NVIDIA Tesla V100 |
Europa
Regione | Londra europe-west2 |
Belgio europe-west1 |
Paesi Bassi europe-west4 |
Francoforte europe-west3 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Asia Pacifico
Regione | Singapore asia-southeast1 |
Taiwan asia-east1 |
Tokyo asia-northeast1 |
Sydney australia-southeast1 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Previsione batch
Per eseguire una previsione in batch, devi utilizzare l'endpoint API globale e non un endpoint regionale.
Puoi eseguire il deployment di modelli e versioni di modelli per le previsioni batch solo nelle seguenti regioni:
us-central1
us-east1
us-east4
europe-west1
asia-northeast1
Per eseguire la previsione batch in altre regioni disponibili, contrassegnate con asterischi nella tabella Regioni disponibili, devi utilizzare un modello salvato di TensorFlow archiviato in Cloud Storage.
Per ottenere le migliori prestazioni nella previsione batch, devi eseguire il job di previsione e memorizzare i dati di input e di output nella stessa regione, in particolare per set di dati molto grandi.
Quando esegui il deployment di un modello per la previsione batch, specifica la regione predefinita in cui vuoi eseguire la previsione. Quando avvii un job di previsione batch, puoi specificare una regione in cui eseguirlo, sostituendo la regione predefinita.
Limitazione delle località delle risorse
Gli amministratori dei criteri dell'organizzazione possono limitare le regioni disponibili per i modelli e i job di previsione batch creando un vincolo per le località delle risorse. Scopri come viene applicato un vincolo delle località delle risorse ad AI Platform Prediction.