Quote e limiti di Vertex AI

Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un Google Cloud progetto, le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.

Esistono anche limiti per le risorse Vertex AI. Questi limiti non sono correlati al sistema di quote. I limiti non possono essere modificati.

Quote per le richieste

Le seguenti quote si applicano alle richieste Vertex AI per un determinato progetto e una determinata regione supportata. Ad esempio, in un unico progetto, puoi avere fino a 30.000 richieste di inferenza online al minuto in una regione e altre 30.000 richieste di inferenza online al minuto in un'altra regione supportata.

Tipo di richiesta Richieste al minuto
Richieste di gestione delle risorse (CRUD)1 600
Richieste di invio di operazione a lunga esecuzione esecuzione (LRO) o job 60
Richieste di inferenza online2 30.000
Velocità effettiva delle richieste di inferenza online 1,5 GB
Richieste di spiegazione online 600
Richieste di lettura delle serie temporali di Vertex AI TensorBoard 60.000
Richieste ML Metadata (CRUD) 12.000
richieste di memorizzazione nella cache (CRUD) dell'AI generativa 200
Richieste Vertex AI Vizier (CRUD) 6000
Richieste di pubblicazione online di Vertex AI Feature Store 300.000
Richieste Vertex ML Metadata 12.000
Numero di richieste di token di conteggio o token di calcolo 3000

1Le richieste di gestione delle risorse includono qualsiasi richiesta che non sia un job, un'operazione LRO, una richiesta di inferenza online, una richiesta di Vertex AI Vizier, una richiesta di metadati ML, una richiesta di lettura dell'API Vertex AI TensorBoard Timeseries Insights, una richiesta di Vertex AI Feature Store, una richiesta di streaming di Vertex AI Feature Store o una richiesta di ricerca vettoriale.

2 Questa quota si applica solo agli endpoint pubblici.

I job o le operazioni a lunga esecuzione includono le seguenti richieste:

  • Creare o eliminare un set di dati.
  • Importare o esportare dati da un set di dati.
  • Crea un endpoint.
  • Creare o eliminare un job personalizzato.
  • Crea o elimina un job di etichettatura dati.
  • Crea o elimina un job di ottimizzazione degli iperparametri.
  • Crea o elimina un job di inferenza batch.
  • Crea o elimina un modello.
  • Caricare, eliminare o esportare un modello.
  • Crea o elimina un modello di runtime del notebook.
  • Assegna, elimina, avvia o esegui l'upgrade di un runtime del notebook.
  • Crea, elimina o aggiorna un monitoraggio del modello.
  • Crea o elimina un job di monitoraggio del modello.


Per informazioni sulle quote per i modelli di AI generativa, consulta Quote e limiti dell'AI generativa su Vertex AI.

Quote per i modelli AutoML

Le seguenti quote di applicano a ogni tipo di dati e obiettivo per un determinato progetto e una determinata area geografica. Ad esempio, in un determinato progetto e una determinata area geografica, puoi eseguire il deployment di 10 modelli di classificazione delle immagini AutoML e 10 modelli di rilevamento di oggetti immagine AutoML per un totale di 20 modelli sottoposti a deployment.

Immagine

Classificazione

Quota Valore
Job di addestramento simultanei 5
Job di addestramento simultanei con Explainable AI 2
Job di inferenza batch simultanei 5
Job di deployment di modelli simultanei 5
Job di annullamento del deployment del modello simultanei 5
Numero di modelli sottoposti a deployment 10

Rilevamento di oggetti

Quota Valore
Job di addestramento simultanei 5
Job di inferenza batch simultanei 5
Numero di modelli sottoposti a deployment 10

Tabulare

Quota Valore
Job di addestramento simultanei 5
Job di inferenza batch simultanei 5
Numero di modelli sottoposti a deployment 30

Testo

Classificazione

Quota Valore
Job di addestramento simultanei 5
Job di inferenza batch simultanei 5
Numero di modelli sottoposti a deployment 10

Estrazione di entità

Quota Valore
Job di addestramento simultanei 5
Job di inferenza batch simultanei 5
Numero di modelli sottoposti a deployment 10

Analisi del sentiment

Quota Valore
Job di addestramento simultanei 5
Job di inferenza batch simultanei 5
Numero di modelli sottoposti a deployment 10

Video

Riconoscimento delle azioni

Quota Valore
Job di addestramento simultanei 5
Job di inferenza batch simultanei 5

Classificazione

Quota Valore
Job di addestramento simultanei 5
Job di inferenza batch simultanei 5

Monitoraggio oggetti

Quota Valore
Job di addestramento simultanei 5
Job di inferenza batch simultanei 5

Vertex AI Model Registry

La dimensione massima del modello supportata da Vertex AI Model Registry è 1 TB.

Limiti dei modelli AutoML

I seguenti limiti si applicano a ogni tipo di dati per un determinato progetto e una determinata regione. Ad esempio, in un determinato progetto e una determinata regione, puoi includere un massimo di 1.000.000 di immagini in un input di richiesta batch.

Immagine

Tipo di limite Valore
Dimensione file immagine Massimo: 30 MB
Immagini per set di dati Massimo: 1.000.000
Etichette per set di dati Minimo: 2
Massimo: 5000
Immagini per etichetta Minimo: 10
Consigliato: 1000
Dimensioni massime del file CSV di input batch Massimo: 100 MB
Numero di immagini nell'input batch Massimo: 1.000.000

Tabulare

Tipo di limite Valore
Dimensioni massime 100 GB
Numero di righe Numero di righe compreso tra 1000 e 200.000.000
Numero di colonne Numero di colonne compreso tra 2 e 1000
Numero di importazioni di set di dati in esecuzione contemporaneamente 5 importazioni
Dimensioni del file CSV Massimo: 10 GB per file, fino a un massimo totale di 100 GB

Testo

Il conteggio dei caratteri si basa sui caratteri UTF-8.

Tipo di limite Classificazione Estrazione di entità Analisi del sentiment
Elementi di addestramento Da 10 a 1.000.000 Da 50 a 100.000 Da 10 a 100.000
Etichette per set di dati Da 2 a 5000 Da 1 a 100 Da 2 a 11
Lunghezza del nome dell'etichetta Da 1 a 32 Da 1 a 32 Valore intero da 0 a 10
Lunghezza dell'intervallo annotato N/D Da 1 a 100 caratteri N/D
Elementi di addestramento per etichetta Da 10 a 1.000.000 Da 100 a 100.000 Da 10 a 100.000
Dimensioni degli elementi di addestramento 10 MB
5.000.000 di caratteri
128 KB (testo); 20 MB (PDF)
da 10 a 300.000 caratteri (testo)
128 KB (testo); 2 MB (PDF)
60.000 caratteri
Elemento inviato per l'inferenza 128 KB (testo); 2 MB (PDF)
60.000 caratteri
20 MB 128 KB (testo); 2 MB (PDF)
60.000 caratteri
Elementi per richiesta batch 10.000 10.000 10.000

Video

Tipo di limite Valore
Durata massima del video 3 ore
Dimensioni massime del file video 50 GB
Minimo di etichette per set di dati 2
Minimo di video per etichetta 10 (si consiglia 1000)
Dimensioni del file CSV di input batch Massimo: 100 MB
Numero di segmenti video nell'input batch Massimo: 1000

Quote dei modelli addestrati personalizzati

Le seguenti quote si applicano per i modelli addestrati personalizzati Vertex AI per un determinato progetto e una determinata regione.

Formazione

Quota Valore
Pipeline di addestramento personalizzate simultanee 2000
Numero di CPU N1 ed E2 per l'addestramento, per regione
RegioneValore
us-west1 2200
us-west2 20
us-west3 2200
us-west4 20
us-central1 2200
us-east1 2200
us-east4 20
us-east5 450
us-south1 450
northamerica-northeast1 2200
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 2200
europe-west1 2200
europe-west4 2200
europe-west6 20
europe-west3 2200
europe-north1 20
europe-central2 450
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 2200
asia-southeast1 2200
asia-southeast2 2200
asia-east2 2200
asia-east1 2200
asia-northeast1 2200
asia-northeast2 20
australia-southeast1 2200
australia-southeast2 20
asia-northeast3 2200
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Numero di CPU N2 per l'addestramento, per regione
RegioneValore
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Numero di CPU M1 per l'addestramento, per regione
RegioneValore
us-west1 0
us-west2 0
us-west3 0
us-west4 0
us-central1 0
us-east1 0
us-east4 0
us-east5 0
us-south1 0
northamerica-northeast1 0
northamerica-northeast2 0
southamerica-east1 0
southamerica-west1 0
europe-west2 0
europe-west1 0
europe-west4 0
europe-west6 0
europe-west3 0
europe-north1 0
europe-central2 0
europe-west8 0
europe-west9 0
europe-southwest1 0
asia-south1 0
asia-southeast1 0
asia-southeast2 0
asia-east2 0
asia-east1 0
asia-northeast1 0
asia-northeast2 0
australia-southeast1 0
australia-southeast2 0
asia-northeast3 0
me-west1 0
me-central1 0
me-central2 0
europe-west12 0
africa-south1 0
Numero di CPU C2 per l'addestramento, per regione
RegioneValore
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 20
me-central2 20
europe-west12 20
africa-south1 20
Numero di CPU A2 per l'addestramento, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 Illimitata
us-east1 Illimitato
us-east4 Illimitato
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 Illimitato
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Illimitato
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Illimitato
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di CPU A3 simultanee per l'addestramento, per regione
RegioneValore
us-west1 Illimitato
us-west2 Illimitato
us-west3 Illimitato
us-west4 Illimitato
us-central1 Illimitato
us-east1 Illimitato
us-east4 Illimitato
us-east5 Illimitato
us-south1 Illimitato
northamerica-northeast1 Illimitato
northamerica-northeast2 Illimitato
southamerica-east1 Illimitato
southamerica-west1 Illimitato
europe-west2 Illimitato
europe-west1 Illimitato
europe-west4 Illimitato
europe-west6 Illimitato
europe-west3 Illimitato
europe-north1 Illimitato
europe-central2 Illimitato
europe-west8 Illimitato
europe-west9 Illimitato
europe-southwest1 Illimitato
asia-south1 Illimitato
asia-southeast1 Illimitato
asia-southeast2 Illimitato
asia-east2 Illimitato
asia-east1 Illimitato
asia-northeast1 Illimitato
asia-northeast2 Illimitato
australia-southeast1 Illimitato
australia-southeast2 Illimitato
asia-northeast3 Illimitato
me-west1 Illimitato
me-central1 Illimitato
me-central2 Illimitato
europe-west12 Illimitato
africa-south1 Illimitato
Numero di GPU H200 simultanee per l'addestramento, per regione
RegioneValore
us-west1 0
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 0
us-east1 Non disponibile
us-east4 8
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 0
europe-west4 Non disponibile
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU P4 per l'addestramento, per regione
RegioneValore
us-west1 Non disponibile
us-west2 6
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 6
us-east1 Non disponibile
us-east4 1
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 6
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 6
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 6
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 6
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU T4 per l'addestramento, per regione
RegioneValore
us-west1 2
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 12
us-east1 2
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 6
europe-west1 Non disponibile
europe-west4 2
europe-west6 Non disponibile
europe-west3 0
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 6
asia-southeast1 1
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 6
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 1
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU L4 per l'addestramento, per regione
RegioneValore
us-west1 0
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 0
us-east1 0
us-east4 0
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 0
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 0
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 0
asia-southeast1 0
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 0
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 0
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU P100 per l'addestramento, per regione
RegioneValore
us-west1 30
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 56
us-east1 30
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 30
europe-west4 Non disponibile
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 30
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 6
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU V100 per l'addestramento, per regione
RegioneValore
us-west1 6
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 6
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 6
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 6
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU A100 per l'addestramento, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 8
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 8
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 8
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU A100 da 80 GB simultanee per l'addestramento, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 0
us-east1 Non disponibile
us-east4 0
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 0
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 0
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile

Per ulteriori informazioni, vedi Visualizza e gestisci le quote.

Numero di GPU H100 simultanee per l'addestramento, per regione
RegioneValore
us-west1 0
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 0
us-east1 Non disponibile
us-east4 0
us-east5 0
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 0
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 0
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 0
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU B200 simultanee per l'addestramento, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 0
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 Non disponibile
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di Mega GPU H100 simultanee per l'addestramento, per regione
RegioneValore
us-west1 0
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 0
us-central1 0
us-east1 Non disponibile
us-east4 0
us-east5 0
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 0
europe-west4 0
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 0
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 0
asia-northeast2 Non disponibile
australia-southeast1 0
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile

Per ulteriori informazioni, vedi Visualizza e gestisci le quote.

Numero di core TPU v2 per l'addestramento, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 8
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 8
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 8
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di core pod TPU V2 per l'addestramento, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 Non disponibile
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 Non disponibile
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di core TPU v3 per l'addestramento, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 8
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 8
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 8
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di core pod TPU v3 per l'addestramento, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 Non disponibile
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 Non disponibile
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Utilizzo HDD (GB) durante l'addestramento, per regione
RegioneValore
us-west1 180.000
us-west2 3600
us-west3 180.000
us-west4 3600
us-central1 180.000
us-east1 180.000
us-east4 3600
us-east5 3600
us-south1 180.000
northamerica-northeast1 180.000
northamerica-northeast2 3600
southamerica-east1 3600
southamerica-west1 3600
europe-west2 180.000
europe-west1 180.000
europe-west4 180.000
europe-west6 3600
europe-west3 180.000
europe-north1 3600
europe-central2 180.000
europe-west8 3600
europe-west9 180.000
europe-southwest1 3600
asia-south1 180.000
asia-southeast1 180.000
asia-southeast2 180.000
asia-east2 180.000
asia-east1 180.000
asia-northeast1 180.000
asia-northeast2 3600
australia-southeast1 180.000
australia-southeast2 3600
asia-northeast3 180.000
me-west1 180.000
me-central1 3600
me-central2 3600
europe-west12 3600
africa-south1 3600
Utilizzo di SSD (GB) durante l'addestramento, per regione
RegioneValore
us-west1 75.000
us-west2 450
us-west3 75.000
us-west4 450
us-central1 75.000
us-east1 75.000
us-east4 450
us-east5 450
us-south1 75.000
northamerica-northeast1 75.000
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 75.000
europe-west1 75.000
europe-west4 75.000
europe-west6 450
europe-west3 75.000
europe-north1 450
europe-central2 75.000
europe-west8 450
europe-west9 75.000
europe-southwest1 450
asia-south1 75.000
asia-southeast1 75.000
asia-southeast2 75.000
asia-east2 75.000
asia-east1 75.000
asia-northeast1 75.000
asia-northeast2 450
australia-southeast1 75.000
australia-southeast2 450
asia-northeast3 75.000
me-west1 75.000
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Utilizzo di Hyperdisk bilanciato (GB) durante l'addestramento, per regione
RegioneValore
us-west1 75.000
us-west2 450
us-west3 450
us-west4 450
us-central1 75.000
us-east1 450
us-east4 75.000
us-east5 450
us-south1 75.000
northamerica-northeast1 450
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 450
europe-west1 75.000
europe-west4 75.000
europe-west6 450
europe-west3 450
europe-north1 450
europe-central2 450
europe-west8 450
europe-west9 450
europe-southwest1 450
asia-south1 75.000
asia-southeast1 450
asia-southeast2 450
asia-east2 450
asia-east1 450
asia-northeast1 450
asia-northeast2 450
australia-southeast1 450
australia-southeast2 450
asia-northeast3 450
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450

Pubblicazione

Quota Valore
Numero di repliche del modello personalizzato di cui è stato eseguito il deployment 100
Numero di CPU per la pubblicazione, per regione
RegioneValore
us-west1 2200
us-west2 2200
us-west3 2200
us-west4 16
us-central1 2200
us-east1 2200
us-east4 2200
us-east5 16
us-south1 450
northamerica-northeast1 2200
northamerica-northeast2 450
southamerica-east1 2200
southamerica-west1 450
europe-west2 2200
europe-west1 2200
europe-west4 2200
europe-west6 2200
europe-west3 2200
europe-north1 16
europe-central2 450
europe-west8 16
europe-west9 16
europe-southwest1 16
asia-south1 2200
asia-southeast1 2200
asia-southeast2 2200
asia-east2 2200
asia-east1 2200
asia-northeast1 2200
asia-northeast2 16
australia-southeast1 2200
australia-southeast2 16
asia-northeast3 2200
me-west1 450
me-central1 16
me-central2 16
europe-west12 16
africa-south1 16
Numero di GPU H200 simultanee per la pubblicazione, per regione
RegioneValore
us-west1 0
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 0
us-east1 Non disponibile
us-east4 0
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 0
europe-west4 Non disponibile
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU P100 per la pubblicazione, per regione
RegioneValore
us-west1 30
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 56
us-east1 30
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 30
europe-west4 Non disponibile
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 30
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU P4 per la pubblicazione, per regione
RegioneValore
us-west1 Non disponibile
us-west2 6
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 6
us-east1 Non disponibile
us-east4 6
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 6
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 6
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 6
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 6
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU T4 per la pubblicazione, per regione
RegioneValore
us-west1 12
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 12
us-east1 12
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 12
europe-west1 Non disponibile
europe-west4 12
europe-west6 Non disponibile
europe-west3 0
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 6
asia-southeast1 6
asia-southeast2 Non disponibile
asia-east2 12
asia-east1 6
asia-northeast1 6
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 6
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU L4 per la gestione, per regione
RegioneValore
us-west1 28
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 28
us-east1 28
us-east4 28
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 28
europe-west1 28
europe-west4 28
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 28
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 28
asia-northeast1 28
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU V100 per la pubblicazione, per regione
RegioneValore
us-west1 6
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 6
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 6
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU A100 per la pubblicazione, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 14
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 14
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 14
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 14
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 14
me-west1 1
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU A100 da 80 GB per la pubblicazione, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 1
us-east1 Non disponibile
us-east4 1
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 1
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 1
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU B200 simultanee per il servizio, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 0
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 Non disponibile
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di GPU H100 per la pubblicazione, per regione
RegioneValore
us-west1 8
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 8
us-east1 Non disponibile
us-east4 0
us-east5 Non disponibile
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 8
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 8
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di mega GPU H100 per la pubblicazione, per regione
RegioneValore
us-west1 0
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 0
us-central1 0
us-east1 Non disponibile
us-east4 0
us-east5 0
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 0
europe-west4 0
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 0
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 0
asia-northeast2 Non disponibile
australia-southeast1 0
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di chip TPU v5e per la pubblicazione, per regione
RegioneValore
us-west1 4
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 0
us-central1 16
us-east1 Non disponibile
us-east4 Non disponibile
us-east5 Non disponibile
us-south1 0
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 0
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 Non disponibile
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile
Numero di chip TPU v6e per l'inferenza, per regione
RegioneValore
us-west1 Non disponibile
us-west2 Non disponibile
us-west3 Non disponibile
us-west4 Non disponibile
us-central1 Non disponibile
us-east1 0
us-east4 Non disponibile
us-east5 0
us-south1 Non disponibile
northamerica-northeast1 Non disponibile
northamerica-northeast2 Non disponibile
southamerica-east1 Non disponibile
southamerica-west1 Non disponibile
europe-west2 Non disponibile
europe-west1 Non disponibile
europe-west4 0
europe-west6 Non disponibile
europe-west3 Non disponibile
europe-north1 Non disponibile
europe-central2 Non disponibile
europe-west8 Non disponibile
europe-west9 Non disponibile
europe-southwest1 Non disponibile
asia-south1 Non disponibile
asia-southeast1 Non disponibile
asia-southeast2 Non disponibile
asia-east2 Non disponibile
asia-east1 Non disponibile
asia-northeast1 0
asia-northeast2 Non disponibile
australia-southeast1 Non disponibile
australia-southeast2 Non disponibile
asia-northeast3 Non disponibile
me-west1 Non disponibile
me-central1 Non disponibile
me-central2 Non disponibile
europe-west12 Non disponibile
africa-south1 Non disponibile

Limiti dei modelli addestrati personalizzati

I seguenti limiti si applicano ai modelli con addestramento personalizzato Vertex AI per un determinato progetto e una determinata regione.

Pubblicazione

Limite Valore
Numero di repliche per progetto 200
Numero di container per cluster 25.000

Vertex AI Feature Store

Questa sezione elenca le quote e i limiti per quanto segue:

Vertex AI Feature Store

Le seguenti quote si applicano a un determinato progetto e a una determinata regione. Ad esempio, in un unico progetto puoi avere 200 nodi di pubblicazione online in us-central1 e altri 50 nodi in us-east4.

Quota Valore
Richieste di servizio online al minuto 300.000
Numero massimo di istanze FeatureOnlineStore 10
Numero massimo di richieste di ricerca al minuto 6.000.000
Numero massimo di nodi per la distribuzione online in tutte le istanze Optimized FeatureOnlineStore nel progetto 80
Numero massimo di istanze FeatureView in tutte le istanze FeatureOnlineStore 30

Vertex AI Feature Store presenta anche i seguenti limiti. Non puoi richiedere un aumento di nessuno dei limiti nella tabella seguente:

Limite Valore
Numero massimo di risorse FeatureGroup in un progetto e in una località 250
Numero massimo di risorse Feature all'interno di un FeatureGroup 10.000
Dimensione massima dei dati delle funzionalità per entità 5 MB
Numero di ID entità per richiesta di pubblicazione online (FetchFeatureValues) 1
Lunghezza massima di un ID entità 4076 caratteri
Limite di spazio di archiviazione per un nodo per la distribuzione online ottimizzata 200 GB

Vertex AI Feature Store (legacy)

Le seguenti quote si applicano a un determinato progetto e a una determinata regione. Ad esempio, in un singolo progetto, puoi avere 75 job batch simultanei in us-central1 e altri 75 job in europe-west4.

Quota Valore
Richieste di servizio online al minuto 300.000
Richieste di importazione in streaming al minuto 60.000
Velocità effettiva di scrittura dell'importazione di flussi di dati al minuto 1,2 GB
Richieste di creazione di funzionalità al minuto 100
Nodi di pubblicazione online in tutti gli feature store 30
Job batch simultanei (valori delle caratteristiche di importazione, recupero dati e eliminazione combinati) 75
Richieste simultanee di eliminazione dei valori delle funzionalità 1
Tipi di entità in tutti i featurestore 75

Vertex AI Feature Store (legacy) ha anche i seguenti limiti. Non puoi richiedere un aumento di nessuno dei limiti nella tabella seguente:

Limite Valore
Limite di spazio di archiviazione per un nodo di pubblicazione online 5 TB
Dati totali nell'archivio offline Illimitato
Funzionalità per tipo di entità 5000
Numero di richieste di creazione, aggiornamento ed eliminazione di feature store al giorno per progetto per regione 500
Per l'importazione di flussi di dati, le dimensioni per richiesta 1 MB
Per la lettura in streaming, il numero di entità che possono essere incluse per richiesta 100
Per l'importazione batch, il numero di file che possono essere inclusi per richiesta 5000 per Avro o 500 per CSV
Per il recupero dati in batch e le esportazioni, il numero di funzionalità che puoi richiedere 5000
Per l'importazione batch e l'importazione di flussi di dati, il timestamp meno recente per cui è possibile importare i dati delle caratteristiche 4000 giorni dalla data corrente

Il limite di conservazione dei dati in Vertex AI Feature Store (legacy) ha il seguente valore predefinito, che puoi sostituire:

Valori predefiniti di conservazione dei dati Valore predefinito
Conservazione dei dati nell'archivio offline (timestamp del valore della funzionalità meno recente dopo il quale i valori vengono eliminati) 4000 giorni dalla data corrente
Conservazione dei dati nell'archivio online (timestamp del valore della funzionalità meno recente dopo il quale i valori vengono eliminati) 4000 giorni dalla data corrente

Puoi ignorare il limite di conservazione dei dati nei seguenti modi:

  • Per ignorare il limite di conservazione dei dati per l'archivio online, imposta il parametro online_storage_ttl_days durante la creazione o l'aggiornamento di un archivio di caratteristiche.

  • Per ignorare il limite di conservazione dei dati per l'archivio offline, imposta il parametro offline_storage_ttl_days durante la creazione o l'aggiornamento di un tipo di entità.

Le seguenti quote si applicano a Vector Search per un determinato progetto in ogni regione.

Quota Valore
Operazioni di creazione di indici simultanee 5
Operazioni di aggiornamento dell'indice simultanee 5
Numero di nodi indice sottoposti a deployment 50
Numero di nodi N2D dell'indice sottoposti a deployment 5
Numero di indice 100
Richieste di aggiornamento dello streaming al minuto 6000
Throughput dell'aggiornamento dello streaming(in KB) al minuto 120.000

Vertex ML Metadata

I seguenti limiti si applicano a Vertex ML Metadata per un determinato progetto in ogni regione.

Limite Valore
Dimensione serializzata massima del campo dei metadati all'interno di una risorsa 204.800 byte
Dimensione massima serializzata degli schemi di metadati 204.800 byte

Vertex AI Pipelines

Le seguenti quote e limiti si applicano a Vertex AI Pipelines per un determinato progetto in ogni regione.

Quota Valore
Esecuzione parallela delle attività della pipeline* 600
Esecuzioni di pipeline simultanee* 300

* Le richieste di esecuzione di pipeline e attività oltre questo limite vengono messe in coda fino a quando non sono disponibili risorse.

Vertex AI Pipelines presenta i seguenti limiti. Tieni presente che, a differenza delle quote, non puoi richiedere un aumento di un limite.

Limite Valore
Numero di attività della pipeline per job 10.000
Artefatti di input e output per attività della pipeline 100
Artefatti di input e output per job della pipeline 10.000
Dimensione massima del payload JSON contenente parametri di output e artefatti per attività della pipeline 131.072 byte
Tempo di esecuzione massimo per un'attività della pipeline** 7 giorni

* Le attività della pipeline in esecuzione oltre questo limite vengono annullate.

Quote e limiti di Colab Enterprise

Le quote e i limiti di Colab Enterprise sono elencati separatamente. Consulta Quote e limiti di Colab Enterprise.

Aumenti di quota

Se vuoi aumentare una delle quote per Vertex AI, puoi utilizzare la Google Cloud console per richiedere un aumento di quota.

Per ulteriori informazioni sull'invio di una richiesta di aumento della quota, consulta le seguenti sezioni di Visualizza e gestisci le quote:

Quote per regione e modello

Visualizzare e modificare le quote nella console Google Cloud

Per visualizzare e modificare le quote nella console Google Cloud :
  1. Vai alla pagina Quote e limiti di sistema.
  2. Vai a Quote e limiti di sistema

  3. Per modificare la quota, copia e incolla la proprietà aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model nel filtro. Premi Invio.
  4. Fai clic sui tre puntini alla fine della riga e seleziona Modifica quota.
  5. Inserisci un nuovo valore di quota nel riquadro e fai clic su Invia richiesta.

Visualizzare le quote di richieste al minuto (RPM) per regione e per modello

Per impostazione predefinita, i modelli 2.0 e successivi utilizzano la quota condivisa dinamica (DSQ).

Scegli una regione per visualizzare le quote per ogni modello disponibile:

Aumentare le quote

Se vuoi aumentare una delle quote per l'AI generativa su Vertex AI, puoi utilizzare la Google Cloud console per richiedere un aumento di quota.

Quote di RAG Engine

Per ogni servizio che esegue la generazione aumentata dal recupero (RAG) utilizzando RAG Engine, si applicano le seguenti quote, con la quota misurata come richieste al minuto (RPM).
Servizio Quota Metrica
API di gestione dei dati di RAG Engine 60 RPM VertexRagDataService requests per minute per region
RetrievalContexts API 1500 giri/minuto VertexRagService retrieve requests per minute per region
base_model: textembedding-gecko 1500 giri/minuto Online prediction requests per base model per minute per region per base_model

Un altro filtro che puoi specificare è base_model: textembedding-gecko
I limiti sono i seguenti:
Servizio Limite Metrica
Richieste ImportRagFiles simultanee 3 RPM VertexRagService concurrent import requests per region
Numero massimo di file per richiesta ImportRagFiles 10.000 VertexRagService import rag files requests per region

Per ulteriori limiti di frequenza e quote, consulta Limiti di frequenza dell'AI generativa su Vertex AI.

Richieste batch

Le quote e i limiti per i job di inferenza batch sono gli stessi in tutte le regioni.

Limiti dei job di inferenza batch simultanei per i modelli Gemini

Non esistono limiti di quota predefiniti per l'inferenza batch per i modelli Gemini. Il servizio batch fornisce invece l'accesso a un ampio pool condiviso di risorse, allocate dinamicamente in base alla disponibilità e alla domanda in tempo reale del modello per tutti i clienti. Quando più clienti sono attivi e hanno saturato la capacità del modello, le richieste batch potrebbero essere inserite in coda per capacità.

Quote di job di inferenza batch simultanei

La seguente tabella elenca le quote per il numero di job di inferenza batch simultanei, che non si applicano ai modelli Gemini:
Quota Valore
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs 4
Se il numero di attività inviate supera la quota allocata, le attività vengono inserite in una coda ed elaborate quando la capacità della quota diventa disponibile.

Quote dei modelli addestrati personalizzati

Le seguenti quote si applicano ai modelli ottimizzati di AI generativa su Vertex AI per un determinato progetto e una determinata regione:
Quota Valore
Core pod TPU V3 per regione per l'addestramento di immagini con limitazioni
* Regione supportata: europe-west4
64
Addestramento di immagini con limitazioni GPU Nvidia A100 da 80 GB per regione
* Regione supportata: us-central1
* Regione supportata: us-east4

8
2
* Gli scenari di ottimizzazione prevedono prenotazioni di acceleratori in regioni specifiche. Le quote per l'ottimizzazione sono supportate e devono essere richieste in regioni specifiche.

Limiti di incorporamento del testo

Ogni richiesta del modello di incorporamento di testo può contenere fino a 250 testi di input (generando 1 incorporamento per testo di input) e 20.000 token per richiesta. Per calcolare gli incorporamenti vengono utilizzati solo i primi 2048 token di ogni testo di input. Per gemini-embedding-001, ogni richiesta può includere un solo testo di input. La quota per questo modello è elencata sotto il nome gemini-embedding.

Token di input dei contenuti incorporati al minuto per modello di base

A differenza dei precedenti modelli di incorporamento, limitati principalmente dalle quote RPM, la quota per il modello di incorporamento Gemini limita il numero di token che possono essere inviati al minuto per progetto.

Quota Valore
Token di input dei contenuti incorporati al minuto 200000

Quote di servizio di Gen AI evaluation service

Gen AI evaluation service utilizza gemini-2.0-flash come modello di valutazione predefinito per le metriche basate sul modello. Una singola richiesta di valutazione per una metrica basata su modelli potrebbe comportare più richieste sottostanti al servizio Gen AI evaluation service. La quota di ogni modello viene calcolata in base al progetto, il che significa che tutte le richieste indirizzate a gemini-2.0-flash per l'inferenza del modello e la valutazione basata su modelli contribuiscono alla quota. Le quote per Gen AI evaluation service e il modello di valutazione sottostante sono riportate nella tabella seguente:
Richiedi quota Quota predefinita
Richieste di Gen AI evaluation service al minuto 1000 richieste per progetto per regione
Richieste di previsione online al minuto per
base_model: gemini-2.0-flash
Consulta le quote per regione e modello.

Se ricevi un errore relativo alle quote durante l'utilizzo del servizio di valutazione dell'IA generativa, potresti dover presentare una richiesta di aumento della quota. Per ulteriori informazioni, consulta Visualizzare e gestire le quote.

Limite Valore
Timeout della richiesta del servizio di valutazione dell'AI generativa 60 secondi

Quando utilizzi il servizio di valutazione dell'IA generativa per la prima volta in un nuovo progetto, potresti riscontrare un ritardo iniziale di configurazione fino a due minuti. Se la prima richiesta non va a buon fine, attendi qualche minuto e riprova. Le successive richieste di valutazione vengono in genere completate entro 60 secondi.

Il numero massimo di token di input e output per le metriche basate su modelli dipende dal modello utilizzato come modello giudice. Consulta Modelli Google per un elenco di modelli.

Quote di valutazione della pipeline

Se ricevi un errore relativo alle quote durante l'utilizzo del servizio di pipeline di valutazione, potresti dover inviare una richiesta di aumento della quota. Per ulteriori informazioni, vedi Visualizzare e gestire le quote. Il servizio di pipeline di valutazione utilizza Vertex AI Pipelines per eseguire PipelineJobs. Consulta le quote pertinenti per Vertex AI Pipelines. Di seguito sono riportati i consigli generali sulle quote:
Servizio Quota Consiglio
API Vertex AI Job di previsione batch LLM simultanei per regione Basata su punti: 1 * num_concurrent_pipelines

Basata su coppie: 2 * num_concurrent_pipelines
API Vertex AI Richieste di valutazione al minuto per regione 1000 * num_concurrent_pipelines
Inoltre, la quota pertinente per le metriche basate su modelli dipende dal modello di giudice che utilizzi:
Tasks Quota Modello di base Consiglio
summarization
question_answering
Richieste di previsione online per modello di base al minuto per regione per base_model text-bison 60 * num_concurrent_pipelines

Motore Vertex AI Agent

I seguenti limiti si applicano a Vertex AI Agent Engine per un determinato progetto in ogni regione:
Descrizione Limite
Crea, elimina o aggiorna Vertex AI Agent Engine al minuto 10
Crea, elimina o aggiorna le sessioni di Vertex AI Agent Engine al minuto 100
Crea, elimina o aggiorna le sessioni di Vertex AI Agent Engine al minuto 100
Query o StreamQuery Vertex AI Agent Engine al minuto 60
Aggiungi evento alle sessioni al minuto di Vertex AI Agent Engine 100
Numero massimo di risorse Vertex AI Agent Engine 100
Crea, elimina o aggiorna le risorse di memoria di Vertex AI Agent Engine al minuto 100
Recupera, elenca o recupera da Vertex AI Agent Engine Memory Bank al minuto 300

Risolvere i problemi relativi al codice di errore 429

Per risolvere il problema relativo all'errore 429, consulta Codice di errore 429.

Passaggi successivi