Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um Google Cloud recurso o projeto Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de Google Cloud produtos e serviços
- Restringe o consumo desses recursos.
- Fornece um meio de solicitar mudanças no valor da cota e automatizar ajustes de cota
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao projeto do nível Google Cloud. O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud, as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Também há limites para os recursos da Vertex AI. Esses limites não estão relacionados ao sistema de cotas. Não é possível alterar os limites.
Solicitar cotas
As cotas a seguir se aplicam às solicitações da Vertex AI para um determinado projeto e região. Por exemplo, em um único projeto, é possível ter até 30.000 solicitações de previsão on-line por minuto em uma região e outras 30.000 em outra região.
Tipo de solicitação | Solicitações por minuto |
---|---|
Solicitações do gerenciamento de recursos (CRUD, na sigla em inglês)1 | 600 |
Solicitações de envio de jobs ou operações de longa duração (LRO, na sigla em inglês) | 60 |
Solicitações de previsão on-line2 | 30.000 |
Capacidade de processamento da solicitação de previsão on-line | 1,5 GB |
Solicitações de explicação on-line | 600 |
Solicitações de leitura da série temporal do TensorBoard da Vertex AI | 60.000 |
Solicitações de metadados de ML (CRUD, na sigla em inglês) | 12.000 |
Solicitações de armazenamento em cache de IA generativa (CRUD, na sigla em inglês) | 200 |
Solicitações da Vizier da Vertex AI (CRUD, na sigla em inglês) | 6.000 |
Solicitações de disponibilização on-line do Vertex AI Feature Store | 300.000 |
Solicitações do Vertex ML Metadata | 12.000 |
Número de tokens de contagem ou solicitações de tokens de computação | 3.000 |
1As solicitações de gerenciamento de recursos incluem qualquer solicitação que não seja um job, uma LRO, uma solicitação de previsão on-line, uma solicitação do Vertex AI Vizier, uma solicitação de metadados de ML, uma solicitação de leitura da API Timeseries Insights do TensorBoard da Vertex AI, uma solicitação do Vertex AI Feature Store, uma solicitação de streaming do Vertex AI Feature Store ou uma solicitação da Pesquisa de vetor.
2 Essa cota se aplica apenas a endpoints públicos.
Os jobs ou as LROs incluem as seguintes solicitações:
- Criar ou excluir um conjunto de dados.
- Importe ou exporte dados de ou para um conjunto de dados.
- Crie um endpoint.
- Crie ou exclua um job personalizado.
- Crie ou exclua um job de rotulagem de dados.
- Crie ou exclua um job de ajuste de hiperparâmetros.
- Crie ou exclua um job de previsão em lote.
- Crie ou exclua um modelo.
- Faça upload, exclua ou exporte um modelo.
- Crie ou exclua um modelo de ambiente de execução do notebook.
- Atribua, exclua, inicie ou faça upgrade de um ambiente de execução do notebook.
- Crie, exclua ou atualize um monitor de modelo.
- Crie ou exclua um job de monitoramento de modelo.
Para informações sobre cotas para modelos de IA generativa, consulte
IA generativa em cotas e limites da Vertex AI.
Cotas de modelos do AutoML
As cotas a seguir se aplicam a cada tipo de dados e objetivo em projetos e regiões. Por exemplo, é possível implantar 10 modelos de classificação de imagens do AutoML e 10 modelos de detecção de objetos de imagem do AutoML em uma região e um projeto específicos, totalizando 20 modelos implantados.
Imagem
Classificação
Cota | Valor |
---|---|
Jobs de treinamento simultâneos | 5 |
Jobs de treinamento simultâneos com o Explainable AI | 2 |
Jobs de previsão em lote simultâneos | 5 |
Jobs de implantação de modelo simultâneo | 5 |
Jobs de cancelamento de implantação de modelos simultâneos | 5 |
Número de modelos implantados | 10 |
Detecção de objetos
Cota | Valor |
---|---|
Jobs de treinamento simultâneos | 5 |
Jobs de previsão em lote simultâneos | 5 |
Número de modelos implantados | 10 |
Tabular
Cota | Valor |
---|---|
Jobs de treinamento simultâneos | 5 |
Jobs de previsão em lote simultâneos | 5 |
Número de modelos implantados | 30 |
Texto
.Classificação
Cota | Valor |
---|---|
Jobs de treinamento simultâneos | 5 |
Jobs de previsão em lote simultâneos | 5 |
Número de modelos implantados | 10 |
Extração de entidades
Cota | Valor |
---|---|
Jobs de treinamento simultâneos | 5 |
Jobs de previsão em lote simultâneos | 5 |
Número de modelos implantados | 10 |
Análise de sentimento
Cota | Valor |
---|---|
Jobs de treinamento simultâneos | 5 |
Jobs de previsão em lote simultâneos | 5 |
Número de modelos implantados | 10 |
Vídeo
Reconhecimento de ação
Cota | Valor |
---|---|
Jobs de treinamento simultâneos | 5 |
Jobs de previsão em lote simultâneos | 5 |
Classificação
Cota | Valor |
---|---|
Jobs de treinamento simultâneos | 5 |
Jobs de previsão em lote simultâneos | 5 |
Rastreamento de objetos
Cota | Valor |
---|---|
Jobs de treinamento simultâneos | 5 |
Jobs de previsão em lote simultâneos | 5 |
Vertex AI Model Registry
O tamanho máximo do modelo compatível com o Vertex AI Model Registry é de 1 TB.
Limites de modelos do AutoML
Os limites a seguir se aplicam a cada tipo de dados para um determinado projeto e região. Por exemplo, em um projeto e uma região específicos, é possível incluir no máximo 1.000.000 imagens em uma entrada de solicitação em lote.
Imagem
Tipo de limite | Valor |
---|---|
Tamanho do arquivo de imagem | Máximo: 30 MB |
Imagens por conjunto de dados | Máximo: 1.000.000 |
Rótulos por conjunto de dados | Mínimo: 2 Máximo: 5.000 |
Imagens por rótulo | Mínimo: 10 Recomendado: 1.000 |
Tamanho do arquivo CSV de entrada em lote | Máximo: 100 MB |
Número de imagens na entrada em lote | Máximo: 1.000.000 |
Tabular
Tipo de limite | Valor |
---|---|
Tamanho máximo | 100 GB |
Número de linhas | Entre 1.000 e 200.000.000 linhas |
Quantidade de colunas | entre 2 e 1.000 colunas. |
Número de importações de conjuntos de dados em execução simultânea | 5 importações |
Tamanho do arquivo CSV | Máximo: 10 GB por arquivo, até o total máximo de 100 GB |
Texto
.As contagens de caracteres consideram os caracteres como UTF-8.
Tipo de limite | Classificação | Extração de entidades | Análise de sentimento |
---|---|---|---|
Itens de treinamento | 10 a 1.000.000 | 50 a 100.000 | 10 a 100.000 |
Rótulos por conjunto de dados | 2 a 5.000 | 1 a 100 | 2 a 11 |
Comprimento do nome do rótulo | 1 a 32 | 1 a 32 | Número inteiro de 0 a 10 |
Duração do período anotado | N/A | 1 a 100 caracteres | N/A |
Itens de treinamento por rótulo | 10 a 1.000.000 | 100 a 100.000 | 10 a 100.000 |
Tamanho do item de treinamento | 10 MB
5.000.000 caracteres |
128 KB (texto), 20 MB (PDF)
10 a 300.000 caracteres (texto) |
128 KB (texto), 2 MB (PDF)
60.000 caracteres |
Item enviado para previsão | 128 KB (texto), 2 MB (PDF)
60.000 caracteres |
20 MB | 128 KB (texto), 2 MB (PDF)
60.000 caracteres |
Itens por solicitação em lote | 10.000 | 10.000 | 10.000 |
Vídeo
Tipo de limite | Valor |
---|---|
Duração máxima do vídeo | 3 horas |
Tamanho máximo do arquivo de vídeo | 50 GB |
Mínimos de rótulos por conjunto de dados | 2 |
Mínimo de vídeos por rótulo | 10 (1.000 é a recomendação) |
Tamanho do arquivo CSV de entrada em lote | Máximo: 100 MB |
Número de segmentos de vídeo na entrada em lote | Máximo: 1.000 |
Cotas de modelos treinados e personalizados
As cotas a seguir se aplicam a modelos treinadores personalizados da Vertex AI para um determinado projeto e região.
Treinamento
Cota | Valor |
---|---|
Pipelines de treinamento personalizado simultâneos | 2.000 |
Número de CPUs N1 e E2 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 2.200 |
us-west2 | 20 |
us-west3 | 2.200 |
us-west4 | 20 |
us-central1 | 2.200 |
us-east1 | 2.200 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 450 |
northamerica-northeast1 | 2.200 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 2.200 |
europe-west1 | 2.200 |
europe-west4 | 2.200 |
europe-west6 | 20 |
europe-west3 | 2.200 |
europe-north1europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1asia-south1 | 20 |
asia-southeast1 | 2.200 |
asia-southeast2 | 2.200 |
asia-east2 | 2.200 |
asia-east1 | 2.200 |
asia-northeast1 | 2.200 |
asia-northeast2 | 20 |
australia-southeast1 | 2.200 |
australia-southeast2 | 20 |
asia-northeast3 | 2.200 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Número de CPUs N2 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1asia-south1 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Número de CPUs M1 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | 0 |
us-west3 | 0 |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 0 |
northamerica-northeast1 | 0 |
northamerica-northeast2 | 0 |
southamerica-east1 | 0 |
southamerica-west1 | 0 |
europe-west2 | 0 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 0 |
europe-west3 | 0 |
europe-north1europe-central2 | 0 |
europe-west8 | 0 |
europe-west9 | 0 |
europe-southwest1asia-south1 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | 0 |
asia-east2 | 0 |
asia-east1 | 0 |
asia-northeast1 | 0 |
asia-northeast2 | 0 |
australia-southeast1 | 0 |
australia-southeast2 | 0 |
asia-northeast3 | 0 |
me-west1 | 0 |
me-central1 | 0 |
me-central2 | 0 |
europe-west12 | 0 |
africa-south1 | 0 |
Número de CPUs C2 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1asia-south1 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 20 |
me-central2 | 20 |
europe-west12 | 20 |
africa-south1 | 20 |
Número de CPUs A2 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | Ilimitado |
us-east1 | Ilimitado |
us-east4 | Ilimitado |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | Ilimitado |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Ilimitado |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Ilimitado |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de CPUs A3 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | Ilimitado |
us-east1 | Indisponível |
us-east4 | Indisponível |
us-east5 | Ilimitado |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | Ilimitado |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Ilimitado |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs P4 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | 6 |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 6 |
us-east1 | Indisponível |
us-east4 | 1 |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 6 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 6 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | 6 |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs T4 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 2 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 12 |
us-east1 | 2 |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | 6 |
europe-west1 | Indisponível |
europe-west4 | 2 |
europe-west6 | Indisponível |
europe-west3 | 0 |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 1 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | 6 |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | 1 |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs L4 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | 0 |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 0 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 0 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | 0 |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | 0 |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs P100 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 30 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | 30 |
europe-west4 | Indisponível |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Indisponível |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | 30 |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | 6 |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs V100 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 6 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 6 |
us-east1 | Indisponível |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 6 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Indisponível |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | 6 |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs A100 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 8 |
us-east1 | Indisponível |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 8 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 8 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs A100 de 80 GB simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 0 |
us-east1 | Indisponível |
us-east4 | 0 |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 0 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 0 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Se você tiver interesse, consulte a documentação de cotas.
Número de GPUs H100 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 0 |
us-east1 | Indisponível |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 0 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 0 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | 0 |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs H100 Mega simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | Indisponível |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 0 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | 0 |
asia-northeast2 | Indisponível |
australia-southeast1 | 0 |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Se você tiver interesse, consulte a documentação de cotas.
Número de núcleos simultâneos de TPU V2 para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 8 |
us-east1 | Indisponível |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 8 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Indisponível |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | 8 |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de núcleos de pod simultâneos de TPU V2 para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | Indisponível |
us-east1 | Indisponível |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | Indisponível |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Indisponível |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de núcleos de TPU V3 simultâneos para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 8 |
us-east1 | Indisponível |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 8 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Indisponível |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | 8 |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de núcleos de pod simultâneos da TPU V3 para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | Indisponível |
us-east1 | Indisponível |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | Indisponível |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Indisponível |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Uso HDD (GB) durante o treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 180.000 |
us-west2 | 3.600 |
us-west3 | 180.000 |
us-west4 | 3.600 |
us-central1 | 180.000 |
us-east1 | 180.000 |
us-east4 | 3.600 |
us-east5 | 3.600 |
us-south1 | 180.000 |
northamerica-northeast1 | 180.000 |
northamerica-northeast2 | 3.600 |
southamerica-east1 | 3.600 |
southamerica-west1 | 3.600 |
europe-west2 | 180.000 |
europe-west1 | 180.000 |
europe-west4 | 180.000 |
europe-west6 | 3.600 |
europe-west3 | 180.000 |
europe-north1europe-central2 | 3.600 |
europe-west8 | 3.600 |
europe-west9 | 180.000 |
europe-southwest1asia-south1 | 3.600 |
asia-southeast1 | 180.000 |
asia-southeast2 | 180.000 |
asia-east2 | 180.000 |
asia-east1 | 180.000 |
asia-northeast1 | 180.000 |
asia-northeast2 | 3.600 |
australia-southeast1 | 180.000 |
australia-southeast2 | 3.600 |
asia-northeast3 | 180.000 |
me-west1 | 180.000 |
me-central1 | 3.600 |
me-central2 | 3.600 |
europe-west12 | 3.600 |
africa-south1 | 3.600 |
Uso do SSD (GB) durante o treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 75.000 |
us-west2 | 450 |
us-west3 | 75.000 |
us-west4 | 450 |
us-central1 | 75.000 |
us-east1 | 75.000 |
us-east4 | 450 |
us-east5 | 450 |
us-south1 | 75.000 |
northamerica-northeast1 | 75.000 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 75.000 |
europe-west1 | 75.000 |
europe-west4 | 75.000 |
europe-west6 | 450 |
europe-west3 | 75.000 |
europe-north1europe-central2 | 450 |
europe-west8 | 450 |
europe-west9 | 75.000 |
europe-southwest1asia-south1 | 450 |
asia-southeast1 | 75.000 |
asia-southeast2 | 75.000 |
asia-east2 | 75.000 |
asia-east1 | 75.000 |
asia-northeast1 | 75.000 |
asia-northeast2 | 450 |
australia-southeast1 | 75.000 |
australia-southeast2 | 450 |
asia-northeast3 | 75.000 |
me-west1 | 75.000 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Disponibilização
Cota | Valor |
---|---|
Número de réplicas de modelos personalizados implantados | 100 |
Número de CPUs simultâneas para veiculação, por região | |
---|---|
Região | Valor |
us-west1 | 2.200 |
us-west2 | 2.200 |
us-west3 | 2.200 |
us-west4 | 16 |
us-central1 | 2.200 |
us-east1 | 2.200 |
us-east4 | 2.200 |
us-east5 | 16 |
us-south1 | 450 |
northamerica-northeast1 | 2.200 |
northamerica-northeast2 | 450 |
southamerica-east1 | 2.200 |
southamerica-west1 | 450 |
europe-west2 | 2.200 |
europe-west1 | 2.200 |
europe-west4 | 2.200 |
europe-west6 | 2.200 |
europe-west3 | 2.200 |
europe-north1europe-central2 | 16 |
europe-west8 | 16 |
europe-west9 | 16 |
europe-southwest1asia-south1 | 16 |
asia-southeast1 | 2.200 |
asia-southeast2 | 2.200 |
asia-east2 | 2.200 |
asia-east1 | 2.200 |
asia-northeast1 | 2.200 |
asia-northeast2 | 16 |
australia-southeast1 | 2.200 |
australia-southeast2 | 16 |
asia-northeast3 | 2.200 |
me-west1 | 450 |
me-central1 | 16 |
me-central2 | 16 |
europe-west12 | 16 |
africa-south1 | 16 |
Número de GPUs P100 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 30 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | 30 |
europe-west4 | Indisponível |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Indisponível |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | 30 |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs P4 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | 6 |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 6 |
us-east1 | Indisponível |
us-east4 | 6 |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 6 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 6 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | 6 |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs T4 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 12 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 12 |
us-east1 | 12 |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | 12 |
europe-west1 | Indisponível |
europe-west4 | 12 |
europe-west6 | Indisponível |
europe-west3 | 0 |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 6 |
asia-southeast2 | Indisponível |
asia-east2 | 12 |
asia-east1 | 6 |
asia-northeast1 | 6 |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | 6 |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs L4 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 28 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 28 |
us-east1 | 28 |
us-east4 | 28 |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | 28 |
europe-west1 | 28 |
europe-west4 | 28 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 28 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | 28 |
asia-northeast1 | 28 |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs V100 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 6 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 6 |
us-east1 | Indisponível |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 6 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Indisponível |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs A100 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 14 |
us-east1 | Indisponível |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 14 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 14 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | 14 |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | 14 |
me-west1 | 1 |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs A100 de 80 GB simultâneas para disponibilização, por região | |
---|---|
Região | Valor |
us-west1 | Indisponível |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 1 |
us-east1 | Indisponível |
us-east4 | 1 |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 1 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 1 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de GPUs H100 simultâneas para treinamento, por região | |
---|---|
Região | Valor |
us-west1 | 8 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | 8 |
us-east1 | Indisponível |
us-east4 | 0 |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | 8 |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | 8 |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Número de ícones de TPU v5e para exibição, por região | |
---|---|
Região | Valor |
us-west1 | 4 |
us-west2 | Indisponível |
us-west3 | Indisponível |
us-west4 | Indisponível |
us-central1 | Indisponível |
us-east1 | Indisponível |
us-east4 | Indisponível |
us-east5 | Indisponível |
us-south1 | Indisponível |
northamerica-northeast1 | Indisponível |
northamerica-northeast2 | Indisponível |
southamerica-east1 | Indisponível |
southamerica-west1 | Indisponível |
europe-west2 | Indisponível |
europe-west1 | Indisponível |
europe-west4 | Indisponível |
europe-west6 | Indisponível |
europe-west3 | Indisponível |
europe-north1europe-central2 | Indisponível |
europe-west8 | Indisponível |
europe-west9 | Indisponível |
europe-southwest1asia-south1 | Indisponível |
asia-southeast1 | Indisponível |
asia-southeast2 | Indisponível |
asia-east2 | Indisponível |
asia-east1 | Indisponível |
asia-northeast1 | Indisponível |
asia-northeast2 | Indisponível |
australia-southeast1 | Indisponível |
australia-southeast2 | Indisponível |
asia-northeast3 | Indisponível |
me-west1 | Indisponível |
me-central1 | Indisponível |
me-central2 | Indisponível |
europe-west12 | Indisponível |
africa-south1 | Indisponível |
Limites de modelos treinados de forma personalizada
Os limites a seguir se aplicam a modelos de treinamento personalizados da Vertex AI para um determinado projeto e região.
Disponibilização
Limite | Valor |
---|---|
Número de réplicas por projeto | 200 |
Número de contêineres por cluster | 25.000 |
Vertex AI Feature Store
Nesta seção, listamos as cotas e os limites para o seguinte:
Vertex AI Feature Store
As cotas a seguir se aplicam a um determinado projeto e região. Por exemplo, em um
único projeto, é possível ter 200 nós de exibição on-line em us-central1
e
outros 50 nós em us-east4
.
Cota | Valor |
---|---|
Solicitações de veiculação on-line por minuto | 300.000 |
Número máximo de instâncias FeatureOnlineStore |
10 |
Número máximo de solicitações de pesquisa por minuto | 6.000.000 |
O número máximo de nós de veiculação on-line em todas as instâncias de FeatureOnlineStore otimizadas no projeto |
80 |
Número máximo de FeatureView instâncias em todas as FeatureOnlineStore instâncias |
30 |
A Vertex AI Feature Store também tem os seguintes limites: Não é possível solicitar um aumento em nenhum dos limites na tabela a seguir:
Limite | Valor |
---|---|
Número máximo de FeatureGroup recursos em um projeto e local |
250 |
Número máximo de Feature recursos em um FeatureGroup |
10.000 |
Tamanho máximo dos dados de elementos por entidade | 5 MB |
Número de IDs de entidade por solicitação de veiculação on-line (FetchFeatureValues ) |
1 |
Tamanho máximo de um ID de entidade | 4.076 caracteres |
Limite de armazenamento de um nó de exibição on-line otimizado | 200 GB |
Vertex AI Feature Store (legado)
As cotas a seguir se aplicam a um determinado projeto e região. Por exemplo, em um único projeto, é possível ter 75 jobs em lote simultâneos em us-central1
e outros 75 jobs em europe-west4
.
Cota | Valor |
---|---|
Solicitações de veiculação on-line por minuto | 300.000 |
Solicitações de ingestão de streaming por minuto | 60.000 |
Capacidade de processamento de gravação de ingestão de streaming por minuto | 1,2 GB |
Solicitações de criação de recursos por minuto | 100 |
Nós de exibição on-line em todas as featurestores | 30 |
Jobs em lote simultâneos (ingestão, veiculação e exclusão de valores de atributos combinados) | 75 |
Solicitações simultâneas para excluir valores de recursos | 1 |
Tipos de entidade em todas as featurestores | 75 |
O Feature Store da Vertex AI também tem os seguintes limites. Não é possível solicitar um aumento em nenhum dos limites na tabela a seguir:
Limite | Valor |
---|---|
Limite de armazenamento de um nó de exibição on-line | 5 TB |
Total de dados na loja off-line | Ilimitado |
Recursos por tipo de entidade | 5.000 |
Número de solicitações de criação, atualização e exclusão de featurestores por dia, por projeto e por região | 500 |
Para ingestão de streaming, o tamanho por solicitação | 1 MB |
Para leitura de streaming, o número de entidades que podem ser incluídas por solicitação | 100 |
Para importação em lote, o número de arquivos que podem ser incluídos por solicitação | 5.000 para Avro ou 500 para CSV |
Para exibição e exportações em lote, o número de recursos que é possível solicitar | 5.000 |
Para ingestão de lote e de streaming, o carimbo de data/hora mais antigo para o qual os dados do recurso podem ser ingeridos | 4.000 dias a partir da data atual |
O limite de retenção de dados no Feature Store da Vertex AI tem o seguinte valor padrão, que você pode substituir:
Padrões de retenção de dados | Valor padrão |
---|---|
Retenção de dados no armazenamento off-line (carimbo de data/hora do valor do atributo mais antigo após o qual os valores são excluídos) | 4.000 dias a partir da data atual |
Retenção de dados no armazenamento on-line (carimbo de data/hora do valor do atributo mais antigo após o qual os valores são excluídos) | 4.000 dias a partir da data atual |
É possível modificar o limite de retenção de dados das seguintes maneiras:
Para substituir o limite de retenção de dados do armazenamento on-line, defina o parâmetro
online_storage_ttl_days
ao criar ou atualizar um featurestore.Para substituir o limite de retenção de dados do armazenamento off-line, defina o parâmetro
offline_storage_ttl_days
ao criar ou atualizar um tipo de entidade.
Vector Search
As cotas a seguir se aplicam à Pesquisa de vetores para um determinado projeto em cada região.
Cota | Valor |
---|---|
Operações simultâneas de criação de índice | 5 |
Operações de atualização de índice simultâneas | 5 |
Número de nós de índice implantados | 50 |
Número de nós N2D implantados no índice | 5 |
Número de índices | 100 |
Solicitações de atualização de streaming por minuto | 6.000 |
Capacidade de atualização de streaming (em KB) por minuto | 120.000 |
Vertex ML Metadata
Os limites a seguir se aplicam ao Vertex ML Metadata para um determinado projeto em cada região.
Limite | Valor |
---|---|
Tamanho máximo serializado do campo de metadados em um recurso | 204.800 bytes |
Tamanho máximo serializado dos esquemas de metadados | 204.800 bytes |
Vertex AI Pipelines
As cotas e limites a seguir se aplicam ao Vertex AI Pipelines para um determinado projeto em cada região.
Cota | Valor |
---|---|
Como executar tarefas de pipeline em paralelo* | 600 |
Execuções de pipeline simultâneas* | 300 |
* Solicitações de execução de pipeline e tarefas que ultrapassam esse limite são enfileiradas até que os recursos estejam disponíveis.
O Vertex AI Pipelines tem os limites a seguir. Ao contrário das cotas, não é possível solicitar um aumento.
Limite | Valor |
---|---|
Número de tarefas de pipeline por job | 10.000 |
Artefatos de entrada e saída por tarefa de pipeline | 100 |
Artefatos de entrada e saída por job de pipeline | 10.000 |
Tamanho máximo do payload JSON que contém parâmetros de saída e artefatos por tarefa de pipeline | 131.072 bytes |
Tempo máximo de execução de uma tarefa de pipeline** | 7 dias |
* As tarefas de pipeline que forem executadas além desse limite serão canceladas.
Otimização da decisão na Vertex AI
As cotas e limites a seguir se aplicam à otimização de decisão da Vertex AI para um determinado projeto em cada região.
Cota | Valor |
---|---|
Resolver solicitação por minuto | 30 |
Cotas e limites do Colab Enterprise
As cotas e os limites do Colab Enterprise são listados separadamente. Consulte Cotas e limites do Colab Enterprise.
Aumento de cotas
Se você quiser expandir alguma cota da Vertex AI, use o Console do Google Cloud para solicitar um aumento de cota.
Para mais informações sobre como enviar uma solicitação de aumento de cota, consulte as seções a seguir sobre Como trabalhar com cotas:
Cotas por região e modelo
Acessar e editar as cotas no console do Google Cloud
Para conferir e editar as cotas no console do Google Cloud, faça o seguinte:- Acesse a página Cotas e limites do sistema.
- Para ajustar a cota, copie e cole a propriedade
aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model
no Filtro. Pressione Enter. - Clique nos três pontos no final da linha e selecione Editar cota.
- Insira um novo valor de cota no painel e clique em Enviar solicitação.
Acesse "Cotas e limites do sistema"
Conferir as cotas de solicitações por minuto (RPM) por região e modelo
Por padrão, os modelos 2.0 e mais recentes usam a Cota compartilhada dinâmica (DSQ, na sigla em inglês).
Escolha uma região para ver as cotas de cada modelo disponível:
Aumentar as cotas
Para aumentar alguma das suas cotas de IA generativa na Vertex AI, use o console do Google Cloud para solicitar um aumento de cota.
Cotas do mecanismo RAG
Para que cada serviço realize a geração aumentada de recuperação (RAG) usando o RAG Engine, as cotas a seguir se aplicam, sendo a cota medida como solicitações por minuto (RPM).Serviço | Cota | Métrica |
---|---|---|
APIs de gerenciamento de dados do mecanismo RAG | 60 RPM | VertexRagDataService requests per minute per region |
API RetrievalContexts |
1.500 RPM | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1.500 RPM | Online prediction requests per base model per minute per region per base_model Outro filtro que você pode especificar é base_model: textembedding-gecko |
Serviço | Limite | Métrica |
---|---|---|
Solicitações ImportRagFiles simultâneas |
3 RPM | VertexRagService concurrent import requests per region |
Número máximo de arquivos por solicitação ImportRagFiles |
10.000 | VertexRagService import rag files requests per region |
Para mais limites de taxa e cotas, consulte Limites de taxa da IA generativa na Vertex AI.
Solicitações em lote
As cotas e os limites para solicitações de previsão em lote são os mesmos em todas as regiões.Limites de solicitações de previsão em lote simultâneas
A tabela a seguir lista os limites para o número de solicitações de previsão em lote simultâneas:Limite | Valor |
---|---|
Modelos do Gemini | 8 |
Cotas de solicitações de previsões em lote simultâneas
A tabela a seguir lista as cotas para o número de solicitações de previsão em lote simultâneas, que não se aplicam aos modelos do Gemini:Cota | Valor |
---|---|
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs |
4 |
Cotas de modelos treinados e personalizados
As cotas a seguir se aplicam à IA generativa em modelos ajustados pela Vertex AI para determinado projeto e região:Cota | Valor |
---|---|
Núcleos do pod da TPU V3 de treinamento de imagens restritos por região * Região compatível: europe-west4 |
64 |
Treinamento de imagens restrito: GPUs Nvidia A100 de 80 GB por região * Região compatível: us-central1 * Região compatível: us-east4 |
8 2 |
Limites de incorporação de texto
Cada solicitação de modelo de inserção de texto pode ter até 250 textos de entrada (gerando 1 inserção por texto de entrada) e 20.000 tokens por solicitação. Apenas os primeiros 2.048 tokens em cada texto de entrada são usados para calcular as representações.
Para text-embedding-large-exp-03-07
, cada solicitação só pode incluir um único texto de entrada. A cota desse modelo está listada com o nome text-embedding-large-001
.
cotas do serviço de avaliação de IA generativa
O serviço de avaliação de IA generativa usagemini-2.0-flash
como modelo de juiz padrão
para métricas baseadas em modelo.
Uma única solicitação de avaliação para uma métrica baseada em modelo pode resultar em várias solicitações subjacentes ao
serviço de avaliação de IA generativa. A cota de cada modelo é calculada por projeto, o que significa que todas as solicitações direcionadas a gemini-2.0-flash
para inferência de modelo e avaliação baseada em modelo contribuem para a cota.
As cotas do serviço de avaliação de IA generativa e do modelo de juiz subjacente são mostradas
na tabela a seguir:
Solicitação de cota | Cota padrão |
---|---|
Solicitações do serviço de avaliação de IA generativa por minuto | 1.000 solicitações por projeto em cada região |
Solicitações de previsão on-line por minuto parabase_model: gemini-2.0-flash |
Consulte Cotas por região e modelo. |
Se você receber um erro relacionado a cotas ao usar o serviço de avaliação de IA generativa, talvez seja necessário enviar uma solicitação de aumento de cota. Consulte Conferir e gerenciar cotas para mais informações.
Limite | Valor |
---|---|
Tempo limite da solicitação do serviço de avaliação de IA generativa | 60 segundos |
Quando você usa o serviço de avaliação de IA generativa pela primeira vez em um novo projeto, pode ocorrer um atraso na configuração inicial de até dois minutos. Se a primeira solicitação falhar, aguarde alguns minutos e tente novamente. As próximas solicitações de avaliação normalmente são concluídas em 60 segundos.
Os tokens máximos de entrada e saída para métricas baseadas em modelo dependem do modelo usado como modelo de avaliação. Consulte Modelos do Google para conferir uma lista de modelos.
Cotas de avaliação de pipeline
Se você receber um erro relacionado a cotas ao usar o serviço de pipelines de avaliação, talvez seja necessário registrar uma solicitação de aumento de cota. Consulte Ver e gerenciar cotas para mais informações. O serviço de pipelines de avaliação usa o Vertex AI Pipelines para executarPipelineJobs
. Consulte as cotas relevantes para o Vertex AI Pipelines. Veja a seguir recomendações gerais de cota:
Serviço | Cota | Recomendação |
---|---|---|
API Vertex AI | Jobs simultâneos de previsão em lote de LLM por região | Por pontos: 1 * num_concurrent_pipelines Pairwise: 2 * num_concurrent_pipelines |
API Vertex AI | Solicitações de avaliação por minuto em cada região | 1.000 * num_concurrent_pipelines |
Tarefas | Cota | Modelo base | Recomendação |
---|---|---|---|
summarization question_answering |
Solicitações de previsão on-line por modelo base, por minuto, por região e por base_model | text-bison |
60 * num_concurrent_pipelines |
Vertex AI Reasoning Engine
As cotas e os limites a seguir se aplicam ao Vertex AI Reasoning Engine para um determinado projeto em cada região.Cota | Valor |
---|---|
Criar/excluir/atualizar o Reasoning Engine por minuto | 10 |
Mecanismo de raciocínio de consulta/StreamQuery por minuto | 60 |
Número máximo de recursos do Reasoning Engine | 100 |
Resolver problemas com o código de erro 429
Para resolver o erro 429, consulte Código de erro 429.
A seguir
- Saiba mais sobre a IA generativa em cotas e limites da Vertex AI.