Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.
Il sistema delle quote di Cloud esegue le seguenti operazioni:
- Monitora il tuo consumo di Google Cloud prodotti e servizi
- Limita il consumo di queste risorse
- Fornisce un modo per richiedere modifiche al valore della quota e automatizzare gli aggiustamenti della quota
Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.
In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un Google Cloud progetto, le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.
Esistono anche limiti per le risorse Vertex AI. Questi limiti non sono correlati al sistema di quote. I limiti non possono essere modificati.
Quote per le richieste
Le seguenti quote si applicano alle richieste Vertex AI per un determinato progetto e una determinata regione supportata. Ad esempio, in un unico progetto, puoi avere fino a 30.000 richieste di inferenza online al minuto in una regione e altre 30.000 richieste di inferenza online al minuto in un'altra regione supportata.
Tipo di richiesta | Richieste al minuto |
---|---|
Richieste di gestione delle risorse (CRUD)1 | 600 |
Richieste di invio di operazione a lunga esecuzione esecuzione (LRO) o job | 60 |
Richieste di inferenza online2 | 30.000 |
Velocità effettiva delle richieste di inferenza online | 1,5 GB |
Richieste di spiegazione online | 600 |
Richieste di lettura delle serie temporali di Vertex AI TensorBoard | 60.000 |
Richieste ML Metadata (CRUD) | 12.000 |
richieste di memorizzazione nella cache (CRUD) dell'AI generativa | 200 |
Richieste Vertex AI Vizier (CRUD) | 6000 |
Richieste di pubblicazione online di Vertex AI Feature Store | 300.000 |
Richieste Vertex ML Metadata | 12.000 |
Numero di richieste di token di conteggio o token di calcolo | 3000 |
1Le richieste di gestione delle risorse includono qualsiasi richiesta che non sia un job, un'operazione LRO, una richiesta di inferenza online, una richiesta di Vertex AI Vizier, una richiesta di metadati ML, una richiesta di lettura dell'API Vertex AI TensorBoard Timeseries Insights, una richiesta di Vertex AI Feature Store, una richiesta di streaming di Vertex AI Feature Store o una richiesta di ricerca vettoriale.
2 Questa quota si applica solo agli endpoint pubblici.
I job o le operazioni a lunga esecuzione includono le seguenti richieste:
- Creare o eliminare un set di dati.
- Importare o esportare dati da un set di dati.
- Crea un endpoint.
- Creare o eliminare un job personalizzato.
- Crea o elimina un job di etichettatura dati.
- Crea o elimina un job di ottimizzazione degli iperparametri.
- Crea o elimina un job di inferenza batch.
- Crea o elimina un modello.
- Caricare, eliminare o esportare un modello.
- Crea o elimina un modello di runtime del notebook.
- Assegna, elimina, avvia o esegui l'upgrade di un runtime del notebook.
- Crea, elimina o aggiorna un monitoraggio del modello.
- Crea o elimina un job di monitoraggio del modello.
Per informazioni sulle quote per i modelli di AI generativa, consulta
Quote e limiti dell'AI generativa su Vertex AI.
Quote per i modelli AutoML
Le seguenti quote di applicano a ogni tipo di dati e obiettivo per un determinato progetto e una determinata area geografica. Ad esempio, in un determinato progetto e una determinata area geografica, puoi eseguire il deployment di 10 modelli di classificazione delle immagini AutoML e 10 modelli di rilevamento di oggetti immagine AutoML per un totale di 20 modelli sottoposti a deployment.
Immagine
Classificazione
Quota | Valore |
---|---|
Job di addestramento simultanei | 5 |
Job di addestramento simultanei con Explainable AI | 2 |
Job di inferenza batch simultanei | 5 |
Job di deployment di modelli simultanei | 5 |
Job di annullamento del deployment del modello simultanei | 5 |
Numero di modelli sottoposti a deployment | 10 |
Rilevamento di oggetti
Quota | Valore |
---|---|
Job di addestramento simultanei | 5 |
Job di inferenza batch simultanei | 5 |
Numero di modelli sottoposti a deployment | 10 |
Tabulare
Quota | Valore |
---|---|
Job di addestramento simultanei | 5 |
Job di inferenza batch simultanei | 5 |
Numero di modelli sottoposti a deployment | 30 |
Testo
Classificazione
Quota | Valore |
---|---|
Job di addestramento simultanei | 5 |
Job di inferenza batch simultanei | 5 |
Numero di modelli sottoposti a deployment | 10 |
Estrazione di entità
Quota | Valore |
---|---|
Job di addestramento simultanei | 5 |
Job di inferenza batch simultanei | 5 |
Numero di modelli sottoposti a deployment | 10 |
Analisi del sentiment
Quota | Valore |
---|---|
Job di addestramento simultanei | 5 |
Job di inferenza batch simultanei | 5 |
Numero di modelli sottoposti a deployment | 10 |
Video
Riconoscimento delle azioni
Quota | Valore |
---|---|
Job di addestramento simultanei | 5 |
Job di inferenza batch simultanei | 5 |
Classificazione
Quota | Valore |
---|---|
Job di addestramento simultanei | 5 |
Job di inferenza batch simultanei | 5 |
Monitoraggio oggetti
Quota | Valore |
---|---|
Job di addestramento simultanei | 5 |
Job di inferenza batch simultanei | 5 |
Vertex AI Model Registry
La dimensione massima del modello supportata da Vertex AI Model Registry è 1 TB.
Limiti dei modelli AutoML
I seguenti limiti si applicano a ogni tipo di dati per un determinato progetto e una determinata regione. Ad esempio, in un determinato progetto e una determinata regione, puoi includere un massimo di 1.000.000 di immagini in un input di richiesta batch.
Immagine
Tipo di limite | Valore |
---|---|
Dimensione file immagine | Massimo: 30 MB |
Immagini per set di dati | Massimo: 1.000.000 |
Etichette per set di dati | Minimo: 2 Massimo: 5000 |
Immagini per etichetta | Minimo: 10 Consigliato: 1000 |
Dimensioni massime del file CSV di input batch | Massimo: 100 MB |
Numero di immagini nell'input batch | Massimo: 1.000.000 |
Tabulare
Tipo di limite | Valore |
---|---|
Dimensioni massime | 100 GB |
Numero di righe | Numero di righe compreso tra 1000 e 200.000.000 |
Numero di colonne | Numero di colonne compreso tra 2 e 1000 |
Numero di importazioni di set di dati in esecuzione contemporaneamente | 5 importazioni |
Dimensioni del file CSV | Massimo: 10 GB per file, fino a un massimo totale di 100 GB |
Testo
Il conteggio dei caratteri si basa sui caratteri UTF-8.
Tipo di limite | Classificazione | Estrazione di entità | Analisi del sentiment |
---|---|---|---|
Elementi di addestramento | Da 10 a 1.000.000 | Da 50 a 100.000 | Da 10 a 100.000 |
Etichette per set di dati | Da 2 a 5000 | Da 1 a 100 | Da 2 a 11 |
Lunghezza del nome dell'etichetta | Da 1 a 32 | Da 1 a 32 | Valore intero da 0 a 10 |
Lunghezza dell'intervallo annotato | N/D | Da 1 a 100 caratteri | N/D |
Elementi di addestramento per etichetta | Da 10 a 1.000.000 | Da 100 a 100.000 | Da 10 a 100.000 |
Dimensioni degli elementi di addestramento | 10 MB
5.000.000 di caratteri |
128 KB (testo); 20 MB (PDF)
da 10 a 300.000 caratteri (testo) |
128 KB (testo); 2 MB (PDF)
60.000 caratteri |
Elemento inviato per l'inferenza | 128 KB (testo); 2 MB (PDF)
60.000 caratteri |
20 MB | 128 KB (testo); 2 MB (PDF)
60.000 caratteri |
Elementi per richiesta batch | 10.000 | 10.000 | 10.000 |
Video
Tipo di limite | Valore |
---|---|
Durata massima del video | 3 ore |
Dimensioni massime del file video | 50 GB |
Minimo di etichette per set di dati | 2 |
Minimo di video per etichetta | 10 (si consiglia 1000) |
Dimensioni del file CSV di input batch | Massimo: 100 MB |
Numero di segmenti video nell'input batch | Massimo: 1000 |
Quote dei modelli addestrati personalizzati
Le seguenti quote si applicano per i modelli addestrati personalizzati Vertex AI per un determinato progetto e una determinata regione.
Formazione
Quota | Valore |
---|---|
Pipeline di addestramento personalizzate simultanee | 2000 |
Numero di CPU N1 ed E2 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 2200 |
us-west2 | 20 |
us-west3 | 2200 |
us-west4 | 20 |
us-central1 | 2200 |
us-east1 | 2200 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 450 |
northamerica-northeast1 | 2200 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 2200 |
europe-west1 | 2200 |
europe-west4 | 2200 |
europe-west6 | 20 |
europe-west3 | 2200 |
europe-north1 | 20 |
europe-central2 | 450 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 2200 |
asia-southeast1 | 2200 |
asia-southeast2 | 2200 |
asia-east2 | 2200 |
asia-east1 | 2200 |
asia-northeast1 | 2200 |
asia-northeast2 | 20 |
australia-southeast1 | 2200 |
australia-southeast2 | 20 |
asia-northeast3 | 2200 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Numero di CPU N2 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Numero di CPU M1 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 0 |
us-west2 | 0 |
us-west3 | 0 |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 0 |
northamerica-northeast1 | 0 |
northamerica-northeast2 | 0 |
southamerica-east1 | 0 |
southamerica-west1 | 0 |
europe-west2 | 0 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 0 |
europe-west3 | 0 |
europe-north1 | 0 |
europe-central2 | 0 |
europe-west8 | 0 |
europe-west9 | 0 |
europe-southwest1 | 0 |
asia-south1 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | 0 |
asia-east2 | 0 |
asia-east1 | 0 |
asia-northeast1 | 0 |
asia-northeast2 | 0 |
australia-southeast1 | 0 |
australia-southeast2 | 0 |
asia-northeast3 | 0 |
me-west1 | 0 |
me-central1 | 0 |
me-central2 | 0 |
europe-west12 | 0 |
africa-south1 | 0 |
Numero di CPU C2 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 20 |
me-central2 | 20 |
europe-west12 | 20 |
africa-south1 | 20 |
Numero di CPU A2 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | Illimitata |
us-east1 | Illimitato |
us-east4 | Illimitato |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | Illimitato |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Illimitato |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Illimitato |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di CPU A3 simultanee per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | Illimitato |
us-west2 | Illimitato |
us-west3 | Illimitato |
us-west4 | Illimitato |
us-central1 | Illimitato |
us-east1 | Illimitato |
us-east4 | Illimitato |
us-east5 | Illimitato |
us-south1 | Illimitato |
northamerica-northeast1 | Illimitato |
northamerica-northeast2 | Illimitato |
southamerica-east1 | Illimitato |
southamerica-west1 | Illimitato |
europe-west2 | Illimitato |
europe-west1 | Illimitato |
europe-west4 | Illimitato |
europe-west6 | Illimitato |
europe-west3 | Illimitato |
europe-north1 | Illimitato |
europe-central2 | Illimitato |
europe-west8 | Illimitato |
europe-west9 | Illimitato |
europe-southwest1 | Illimitato |
asia-south1 | Illimitato |
asia-southeast1 | Illimitato |
asia-southeast2 | Illimitato |
asia-east2 | Illimitato |
asia-east1 | Illimitato |
asia-northeast1 | Illimitato |
asia-northeast2 | Illimitato |
australia-southeast1 | Illimitato |
australia-southeast2 | Illimitato |
asia-northeast3 | Illimitato |
me-west1 | Illimitato |
me-central1 | Illimitato |
me-central2 | Illimitato |
europe-west12 | Illimitato |
africa-south1 | Illimitato |
Numero di GPU H200 simultanee per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 0 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 0 |
us-east1 | Non disponibile |
us-east4 | 8 |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | 0 |
europe-west4 | Non disponibile |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU P4 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | 6 |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 6 |
us-east1 | Non disponibile |
us-east4 | 1 |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 6 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 6 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | 6 |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU T4 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 2 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 12 |
us-east1 | 2 |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | 6 |
europe-west1 | Non disponibile |
europe-west4 | 2 |
europe-west6 | Non disponibile |
europe-west3 | 0 |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | 6 |
asia-southeast1 | 1 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | 6 |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | 1 |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU L4 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 0 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | 0 |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 0 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | 0 |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | 0 |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU P100 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 30 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | 30 |
europe-west4 | Non disponibile |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | 30 |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | 6 |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU V100 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 6 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 6 |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 6 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | 6 |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU A100 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 8 |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 8 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 8 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU A100 da 80 GB simultanee per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 0 |
us-east1 | Non disponibile |
us-east4 | 0 |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 0 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 0 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Per ulteriori informazioni, vedi Visualizza e gestisci le quote.
Numero di GPU H100 simultanee per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 0 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 0 |
us-east1 | Non disponibile |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 0 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 0 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | 0 |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU B200 simultanee per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 0 |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | Non disponibile |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di Mega GPU H100 simultanee per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 0 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | Non disponibile |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 0 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | 0 |
asia-northeast2 | Non disponibile |
australia-southeast1 | 0 |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Per ulteriori informazioni, vedi Visualizza e gestisci le quote.
Numero di core TPU v2 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 8 |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 8 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | 8 |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di core pod TPU V2 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | Non disponibile |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | Non disponibile |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di core TPU v3 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 8 |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 8 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | 8 |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di core pod TPU v3 per l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | Non disponibile |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | Non disponibile |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Utilizzo HDD (GB) durante l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 180.000 |
us-west2 | 3600 |
us-west3 | 180.000 |
us-west4 | 3600 |
us-central1 | 180.000 |
us-east1 | 180.000 |
us-east4 | 3600 |
us-east5 | 3600 |
us-south1 | 180.000 |
northamerica-northeast1 | 180.000 |
northamerica-northeast2 | 3600 |
southamerica-east1 | 3600 |
southamerica-west1 | 3600 |
europe-west2 | 180.000 |
europe-west1 | 180.000 |
europe-west4 | 180.000 |
europe-west6 | 3600 |
europe-west3 | 180.000 |
europe-north1 | 3600 |
europe-central2 | 180.000 |
europe-west8 | 3600 |
europe-west9 | 180.000 |
europe-southwest1 | 3600 |
asia-south1 | 180.000 |
asia-southeast1 | 180.000 |
asia-southeast2 | 180.000 |
asia-east2 | 180.000 |
asia-east1 | 180.000 |
asia-northeast1 | 180.000 |
asia-northeast2 | 3600 |
australia-southeast1 | 180.000 |
australia-southeast2 | 3600 |
asia-northeast3 | 180.000 |
me-west1 | 180.000 |
me-central1 | 3600 |
me-central2 | 3600 |
europe-west12 | 3600 |
africa-south1 | 3600 |
Utilizzo di SSD (GB) durante l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 75.000 |
us-west2 | 450 |
us-west3 | 75.000 |
us-west4 | 450 |
us-central1 | 75.000 |
us-east1 | 75.000 |
us-east4 | 450 |
us-east5 | 450 |
us-south1 | 75.000 |
northamerica-northeast1 | 75.000 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 75.000 |
europe-west1 | 75.000 |
europe-west4 | 75.000 |
europe-west6 | 450 |
europe-west3 | 75.000 |
europe-north1 | 450 |
europe-central2 | 75.000 |
europe-west8 | 450 |
europe-west9 | 75.000 |
europe-southwest1 | 450 |
asia-south1 | 75.000 |
asia-southeast1 | 75.000 |
asia-southeast2 | 75.000 |
asia-east2 | 75.000 |
asia-east1 | 75.000 |
asia-northeast1 | 75.000 |
asia-northeast2 | 450 |
australia-southeast1 | 75.000 |
australia-southeast2 | 450 |
asia-northeast3 | 75.000 |
me-west1 | 75.000 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Utilizzo di Hyperdisk bilanciato (GB) durante l'addestramento, per regione | |
---|---|
Regione | Valore |
us-west1 | 75.000 |
us-west2 | 450 |
us-west3 | 450 |
us-west4 | 450 |
us-central1 | 75.000 |
us-east1 | 450 |
us-east4 | 75.000 |
us-east5 | 450 |
us-south1 | 75.000 |
northamerica-northeast1 | 450 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 450 |
europe-west1 | 75.000 |
europe-west4 | 75.000 |
europe-west6 | 450 |
europe-west3 | 450 |
europe-north1 | 450 |
europe-central2 | 450 |
europe-west8 | 450 |
europe-west9 | 450 |
europe-southwest1 | 450 |
asia-south1 | 75.000 |
asia-southeast1 | 450 |
asia-southeast2 | 450 |
asia-east2 | 450 |
asia-east1 | 450 |
asia-northeast1 | 450 |
asia-northeast2 | 450 |
australia-southeast1 | 450 |
australia-southeast2 | 450 |
asia-northeast3 | 450 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Pubblicazione
Quota | Valore |
---|---|
Numero di repliche del modello personalizzato di cui è stato eseguito il deployment | 100 |
Numero di CPU per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | 2200 |
us-west2 | 2200 |
us-west3 | 2200 |
us-west4 | 16 |
us-central1 | 2200 |
us-east1 | 2200 |
us-east4 | 2200 |
us-east5 | 16 |
us-south1 | 450 |
northamerica-northeast1 | 2200 |
northamerica-northeast2 | 450 |
southamerica-east1 | 2200 |
southamerica-west1 | 450 |
europe-west2 | 2200 |
europe-west1 | 2200 |
europe-west4 | 2200 |
europe-west6 | 2200 |
europe-west3 | 2200 |
europe-north1 | 16 |
europe-central2 | 450 |
europe-west8 | 16 |
europe-west9 | 16 |
europe-southwest1 | 16 |
asia-south1 | 2200 |
asia-southeast1 | 2200 |
asia-southeast2 | 2200 |
asia-east2 | 2200 |
asia-east1 | 2200 |
asia-northeast1 | 2200 |
asia-northeast2 | 16 |
australia-southeast1 | 2200 |
australia-southeast2 | 16 |
asia-northeast3 | 2200 |
me-west1 | 450 |
me-central1 | 16 |
me-central2 | 16 |
europe-west12 | 16 |
africa-south1 | 16 |
Numero di GPU H200 simultanee per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | 0 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 0 |
us-east1 | Non disponibile |
us-east4 | 0 |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | 0 |
europe-west4 | Non disponibile |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU P100 per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | 30 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | 30 |
europe-west4 | Non disponibile |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | 30 |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU P4 per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | 6 |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 6 |
us-east1 | Non disponibile |
us-east4 | 6 |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 6 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 6 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | 6 |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU T4 per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | 12 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 12 |
us-east1 | 12 |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | 12 |
europe-west1 | Non disponibile |
europe-west4 | 12 |
europe-west6 | Non disponibile |
europe-west3 | 0 |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | 6 |
asia-southeast1 | 6 |
asia-southeast2 | Non disponibile |
asia-east2 | 12 |
asia-east1 | 6 |
asia-northeast1 | 6 |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | 6 |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU L4 per la gestione, per regione | |
---|---|
Regione | Valore |
us-west1 | 28 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 28 |
us-east1 | 28 |
us-east4 | 28 |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | 28 |
europe-west1 | 28 |
europe-west4 | 28 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 28 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | 28 |
asia-northeast1 | 28 |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU V100 per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | 6 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 6 |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 6 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU A100 per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 14 |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 14 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 14 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | 14 |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | 14 |
me-west1 | 1 |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU A100 da 80 GB per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 1 |
us-east1 | Non disponibile |
us-east4 | 1 |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 1 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 1 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU B200 simultanee per il servizio, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 0 |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | Non disponibile |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di GPU H100 per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | 8 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | 8 |
us-east1 | Non disponibile |
us-east4 | 0 |
us-east5 | Non disponibile |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 8 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 8 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di mega GPU H100 per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | 0 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | Non disponibile |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | 0 |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | 0 |
asia-northeast2 | Non disponibile |
australia-southeast1 | 0 |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di chip TPU v5e per la pubblicazione, per regione | |
---|---|
Regione | Valore |
us-west1 | 4 |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | 0 |
us-central1 | 16 |
us-east1 | Non disponibile |
us-east4 | Non disponibile |
us-east5 | Non disponibile |
us-south1 | 0 |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 0 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | Non disponibile |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Numero di chip TPU v6e per l'inferenza, per regione | |
---|---|
Regione | Valore |
us-west1 | Non disponibile |
us-west2 | Non disponibile |
us-west3 | Non disponibile |
us-west4 | Non disponibile |
us-central1 | Non disponibile |
us-east1 | 0 |
us-east4 | Non disponibile |
us-east5 | 0 |
us-south1 | Non disponibile |
northamerica-northeast1 | Non disponibile |
northamerica-northeast2 | Non disponibile |
southamerica-east1 | Non disponibile |
southamerica-west1 | Non disponibile |
europe-west2 | Non disponibile |
europe-west1 | Non disponibile |
europe-west4 | 0 |
europe-west6 | Non disponibile |
europe-west3 | Non disponibile |
europe-north1 | Non disponibile |
europe-central2 | Non disponibile |
europe-west8 | Non disponibile |
europe-west9 | Non disponibile |
europe-southwest1 | Non disponibile |
asia-south1 | Non disponibile |
asia-southeast1 | Non disponibile |
asia-southeast2 | Non disponibile |
asia-east2 | Non disponibile |
asia-east1 | Non disponibile |
asia-northeast1 | 0 |
asia-northeast2 | Non disponibile |
australia-southeast1 | Non disponibile |
australia-southeast2 | Non disponibile |
asia-northeast3 | Non disponibile |
me-west1 | Non disponibile |
me-central1 | Non disponibile |
me-central2 | Non disponibile |
europe-west12 | Non disponibile |
africa-south1 | Non disponibile |
Limiti dei modelli addestrati personalizzati
I seguenti limiti si applicano ai modelli con addestramento personalizzato Vertex AI per un determinato progetto e una determinata regione.
Pubblicazione
Limite | Valore |
---|---|
Numero di repliche per progetto | 200 |
Numero di container per cluster | 25.000 |
Vertex AI Feature Store
Questa sezione elenca le quote e i limiti per quanto segue:
Vertex AI Feature Store
Le seguenti quote si applicano a un determinato progetto e a una determinata regione. Ad esempio, in un unico progetto puoi avere 200 nodi di pubblicazione online in us-central1
e altri 50 nodi in us-east4
.
Quota | Valore |
---|---|
Richieste di servizio online al minuto | 300.000 |
Numero massimo di istanze FeatureOnlineStore |
10 |
Numero massimo di richieste di ricerca al minuto | 6.000.000 |
Numero massimo di nodi per la distribuzione online in tutte le istanze Optimized FeatureOnlineStore nel progetto |
80 |
Numero massimo di istanze FeatureView in tutte le istanze FeatureOnlineStore |
30 |
Vertex AI Feature Store presenta anche i seguenti limiti. Non puoi richiedere un aumento di nessuno dei limiti nella tabella seguente:
Limite | Valore |
---|---|
Numero massimo di risorse FeatureGroup in un progetto e in una località |
250 |
Numero massimo di risorse Feature all'interno di un FeatureGroup |
10.000 |
Dimensione massima dei dati delle funzionalità per entità | 5 MB |
Numero di ID entità per richiesta di pubblicazione online (FetchFeatureValues ) |
1 |
Lunghezza massima di un ID entità | 4076 caratteri |
Limite di spazio di archiviazione per un nodo per la distribuzione online ottimizzata | 200 GB |
Vertex AI Feature Store (legacy)
Le seguenti quote si applicano a un determinato progetto e a una determinata regione. Ad esempio, in un
singolo progetto, puoi avere 75 job batch simultanei in us-central1
e
altri 75 job in europe-west4
.
Quota | Valore |
---|---|
Richieste di servizio online al minuto | 300.000 |
Richieste di importazione in streaming al minuto | 60.000 |
Velocità effettiva di scrittura dell'importazione di flussi di dati al minuto | 1,2 GB |
Richieste di creazione di funzionalità al minuto | 100 |
Nodi di pubblicazione online in tutti gli feature store | 30 |
Job batch simultanei (valori delle caratteristiche di importazione, recupero dati e eliminazione combinati) | 75 |
Richieste simultanee di eliminazione dei valori delle funzionalità | 1 |
Tipi di entità in tutti i featurestore | 75 |
Vertex AI Feature Store (legacy) ha anche i seguenti limiti. Non puoi richiedere un aumento di nessuno dei limiti nella tabella seguente:
Limite | Valore |
---|---|
Limite di spazio di archiviazione per un nodo di pubblicazione online | 5 TB |
Dati totali nell'archivio offline | Illimitato |
Funzionalità per tipo di entità | 5000 |
Numero di richieste di creazione, aggiornamento ed eliminazione di feature store al giorno per progetto per regione | 500 |
Per l'importazione di flussi di dati, le dimensioni per richiesta | 1 MB |
Per la lettura in streaming, il numero di entità che possono essere incluse per richiesta | 100 |
Per l'importazione batch, il numero di file che possono essere inclusi per richiesta | 5000 per Avro o 500 per CSV |
Per il recupero dati in batch e le esportazioni, il numero di funzionalità che puoi richiedere | 5000 |
Per l'importazione batch e l'importazione di flussi di dati, il timestamp meno recente per cui è possibile importare i dati delle caratteristiche | 4000 giorni dalla data corrente |
Il limite di conservazione dei dati in Vertex AI Feature Store (legacy) ha il seguente valore predefinito, che puoi sostituire:
Valori predefiniti di conservazione dei dati | Valore predefinito |
---|---|
Conservazione dei dati nell'archivio offline (timestamp del valore della funzionalità meno recente dopo il quale i valori vengono eliminati) | 4000 giorni dalla data corrente |
Conservazione dei dati nell'archivio online (timestamp del valore della funzionalità meno recente dopo il quale i valori vengono eliminati) | 4000 giorni dalla data corrente |
Puoi ignorare il limite di conservazione dei dati nei seguenti modi:
Per ignorare il limite di conservazione dei dati per l'archivio online, imposta il parametro
online_storage_ttl_days
durante la creazione o l'aggiornamento di un archivio di caratteristiche.Per ignorare il limite di conservazione dei dati per l'archivio offline, imposta il parametro
offline_storage_ttl_days
durante la creazione o l'aggiornamento di un tipo di entità.
Ricerca vettoriale
Le seguenti quote si applicano a Vector Search per un determinato progetto in ogni regione.
Quota | Valore |
---|---|
Operazioni di creazione di indici simultanee | 5 |
Operazioni di aggiornamento dell'indice simultanee | 5 |
Numero di nodi indice sottoposti a deployment | 50 |
Numero di nodi N2D dell'indice sottoposti a deployment | 5 |
Numero di indice | 100 |
Richieste di aggiornamento dello streaming al minuto | 6000 |
Throughput dell'aggiornamento dello streaming(in KB) al minuto | 120.000 |
Vertex ML Metadata
I seguenti limiti si applicano a Vertex ML Metadata per un determinato progetto in ogni regione.
Limite | Valore |
---|---|
Dimensione serializzata massima del campo dei metadati all'interno di una risorsa | 204.800 byte |
Dimensione massima serializzata degli schemi di metadati | 204.800 byte |
Vertex AI Pipelines
Le seguenti quote e limiti si applicano a Vertex AI Pipelines per un determinato progetto in ogni regione.
Quota | Valore |
---|---|
Esecuzione parallela delle attività della pipeline* | 600 |
Esecuzioni di pipeline simultanee* | 300 |
* Le richieste di esecuzione di pipeline e attività oltre questo limite vengono messe in coda fino a quando non sono disponibili risorse.
Vertex AI Pipelines presenta i seguenti limiti. Tieni presente che, a differenza delle quote, non puoi richiedere un aumento di un limite.
Limite | Valore |
---|---|
Numero di attività della pipeline per job | 10.000 |
Artefatti di input e output per attività della pipeline | 100 |
Artefatti di input e output per job della pipeline | 10.000 |
Dimensione massima del payload JSON contenente parametri di output e artefatti per attività della pipeline | 131.072 byte |
Tempo di esecuzione massimo per un'attività della pipeline** | 7 giorni |
* Le attività della pipeline in esecuzione oltre questo limite vengono annullate.
Quote e limiti di Colab Enterprise
Le quote e i limiti di Colab Enterprise sono elencati separatamente. Consulta Quote e limiti di Colab Enterprise.
Aumenti di quota
Se vuoi aumentare una delle quote per Vertex AI, puoi utilizzare la Google Cloud console per richiedere un aumento di quota.
Per ulteriori informazioni sull'invio di una richiesta di aumento della quota, consulta le seguenti sezioni di Visualizza e gestisci le quote:
Quote per regione e modello
Visualizzare e modificare le quote nella console Google Cloud
Per visualizzare e modificare le quote nella console Google Cloud :- Vai alla pagina Quote e limiti di sistema.
- Per modificare la quota, copia e incolla la proprietà
aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model
nel filtro. Premi Invio. - Fai clic sui tre puntini alla fine della riga e seleziona Modifica quota.
- Inserisci un nuovo valore di quota nel riquadro e fai clic su Invia richiesta.
Vai a Quote e limiti di sistema
Visualizzare le quote di richieste al minuto (RPM) per regione e per modello
Per impostazione predefinita, i modelli 2.0 e successivi utilizzano la quota condivisa dinamica (DSQ).
Scegli una regione per visualizzare le quote per ogni modello disponibile:
Aumentare le quote
Se vuoi aumentare una delle quote per l'AI generativa su Vertex AI, puoi utilizzare la Google Cloud console per richiedere un aumento di quota.
Quote di RAG Engine
Per ogni servizio che esegue la generazione aumentata dal recupero (RAG) utilizzando RAG Engine, si applicano le seguenti quote, con la quota misurata come richieste al minuto (RPM).Servizio | Quota | Metrica |
---|---|---|
API di gestione dei dati di RAG Engine | 60 RPM | VertexRagDataService requests per minute per region |
RetrievalContexts API |
1500 giri/minuto | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1500 giri/minuto | Online prediction requests per base model per minute per region per base_model Un altro filtro che puoi specificare è base_model: textembedding-gecko |
Servizio | Limite | Metrica |
---|---|---|
Richieste ImportRagFiles simultanee |
3 RPM | VertexRagService concurrent import requests per region |
Numero massimo di file per richiesta ImportRagFiles |
10.000 | VertexRagService import rag files requests per region |
Per ulteriori limiti di frequenza e quote, consulta Limiti di frequenza dell'AI generativa su Vertex AI.
Richieste batch
Le quote e i limiti per i job di inferenza batch sono gli stessi in tutte le regioni.Limiti dei job di inferenza batch simultanei per i modelli Gemini
Non esistono limiti di quota predefiniti per l'inferenza batch per i modelli Gemini. Il servizio batch fornisce invece l'accesso a un ampio pool condiviso di risorse, allocate dinamicamente in base alla disponibilità e alla domanda in tempo reale del modello per tutti i clienti. Quando più clienti sono attivi e hanno saturato la capacità del modello, le richieste batch potrebbero essere inserite in coda per capacità.Quote di job di inferenza batch simultanei
La seguente tabella elenca le quote per il numero di job di inferenza batch simultanei, che non si applicano ai modelli Gemini:Quota | Valore |
---|---|
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs |
4 |
Quote dei modelli addestrati personalizzati
Le seguenti quote si applicano ai modelli ottimizzati di AI generativa su Vertex AI per un determinato progetto e una determinata regione:Quota | Valore |
---|---|
Core pod TPU V3 per regione per l'addestramento di immagini con limitazioni * Regione supportata: europe-west4 |
64 |
Addestramento di immagini con limitazioni GPU Nvidia A100 da 80 GB per regione * Regione supportata: us-central1 * Regione supportata: us-east4 |
8 2 |
Limiti di incorporamento del testo
Ogni richiesta del modello di incorporamento di testo può contenere fino a 250 testi di input (generando 1 incorporamento per testo di input) e 20.000 token per richiesta. Per calcolare gli incorporamenti vengono utilizzati solo i primi 2048 token di ogni testo di input. Pergemini-embedding-001
, ogni richiesta può includere un solo testo di input.
La quota per questo modello è elencata sotto
il nome gemini-embedding
.
Token di input dei contenuti incorporati al minuto per modello di base
A differenza dei precedenti modelli di incorporamento, limitati principalmente dalle quote RPM, la quota per il modello di incorporamento Gemini limita il numero di token che possono essere inviati al minuto per progetto.
Quota | Valore |
---|---|
Token di input dei contenuti incorporati al minuto | 200000 |
Quote di servizio di Gen AI evaluation service
Gen AI evaluation service utilizzagemini-2.0-flash
come modello di valutazione predefinito
per le metriche basate sul modello.
Una singola richiesta di valutazione per una metrica basata su modelli potrebbe comportare più richieste sottostanti al servizio Gen AI evaluation service. La quota di ogni modello viene calcolata in base al progetto, il che significa
che tutte le richieste indirizzate a gemini-2.0-flash
per l'inferenza del modello e
la valutazione basata su modelli contribuiscono alla quota.
Le quote per Gen AI evaluation service e il modello di valutazione sottostante sono riportate
nella tabella seguente:
Richiedi quota | Quota predefinita |
---|---|
Richieste di Gen AI evaluation service al minuto | 1000 richieste per progetto per regione |
Richieste di previsione online al minuto perbase_model: gemini-2.0-flash |
Consulta le quote per regione e modello. |
Se ricevi un errore relativo alle quote durante l'utilizzo del servizio di valutazione dell'IA generativa, potresti dover presentare una richiesta di aumento della quota. Per ulteriori informazioni, consulta Visualizzare e gestire le quote.
Limite | Valore |
---|---|
Timeout della richiesta del servizio di valutazione dell'AI generativa | 60 secondi |
Quando utilizzi il servizio di valutazione dell'IA generativa per la prima volta in un nuovo progetto, potresti riscontrare un ritardo iniziale di configurazione fino a due minuti. Se la prima richiesta non va a buon fine, attendi qualche minuto e riprova. Le successive richieste di valutazione vengono in genere completate entro 60 secondi.
Il numero massimo di token di input e output per le metriche basate su modelli dipende dal modello utilizzato come modello giudice. Consulta Modelli Google per un elenco di modelli.
Quote di valutazione della pipeline
Se ricevi un errore relativo alle quote durante l'utilizzo del servizio di pipeline di valutazione, potresti dover inviare una richiesta di aumento della quota. Per ulteriori informazioni, vedi Visualizzare e gestire le quote. Il servizio di pipeline di valutazione utilizza Vertex AI Pipelines per eseguirePipelineJobs
. Consulta le quote pertinenti per
Vertex AI Pipelines. Di seguito sono riportati i consigli generali sulle quote:
Servizio | Quota | Consiglio |
---|---|---|
API Vertex AI | Job di previsione batch LLM simultanei per regione | Basata su punti: 1 * num_concurrent_pipelines Basata su coppie: 2 * num_concurrent_pipelines |
API Vertex AI | Richieste di valutazione al minuto per regione | 1000 * num_concurrent_pipelines |
Tasks | Quota | Modello di base | Consiglio |
---|---|---|---|
summarization question_answering |
Richieste di previsione online per modello di base al minuto per regione per base_model | text-bison |
60 * num_concurrent_pipelines |
Motore Vertex AI Agent
I seguenti limiti si applicano a Vertex AI Agent Engine per un determinato progetto in ogni regione:Descrizione | Limite |
---|---|
Crea, elimina o aggiorna Vertex AI Agent Engine al minuto | 10 |
Crea, elimina o aggiorna le sessioni di Vertex AI Agent Engine al minuto | 100 |
Crea, elimina o aggiorna le sessioni di Vertex AI Agent Engine al minuto | 100 |
Query o StreamQuery Vertex AI Agent Engine al minuto |
60 |
Aggiungi evento alle sessioni al minuto di Vertex AI Agent Engine | 100 |
Numero massimo di risorse Vertex AI Agent Engine | 100 |
Crea, elimina o aggiorna le risorse di memoria di Vertex AI Agent Engine al minuto | 100 |
Recupera, elenca o recupera da Vertex AI Agent Engine Memory Bank al minuto | 300 |
Risolvere i problemi relativi al codice di errore 429
Per risolvere il problema relativo all'errore 429, consulta Codice di errore 429.
Passaggi successivi
- Scopri di più su quote e limiti dell'AI generativa su Vertex AI.