Esta página foi traduzida pela API Cloud Translation.

Cotas e limites

Neste documento, listamos as cotas e os limites do sistema que se aplicam aos aplicativos de IA.

As cotas especificam a quantidade de um recurso compartilhado e contável que pode ser usado. As cotas são definidas por serviços Google Cloud , como aplicativos de IA.
Os limites do sistema são valores fixos que não podem ser alterados.

Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um recurso doGoogle Cloud seu projeto do Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos Google Cloud .

O sistema de cotas do Cloud faz o seguinte:

Monitora o consumo de Google Cloud produtos e serviços
Restringe o consumo desses recursos.
Fornece uma maneira de solicitar mudanças no valor da cota e automatizar ajustes de cota

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.

As cotas geralmente se aplicam ao nível do projeto Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um Google Cloud projeto, as cotas são compartilhadas entre todos os aplicativos e endereços IP.

Também há limites de sistemas nos recursos do AI Applications. Não é possível alterar os limites.

cotas de alocação.

As cotas a seguir não são redefinidas com o tempo. Em vez disso, elas são liberadas quando você libera o recurso. Se a cota padrão não for suficiente, solicite um aumento.

Cota	Valor
Número de documentos por projeto	10.000.000
Número de repositórios de dados por projeto	100^*
Número de mecanismos por projeto	150^†
Número de operações pendentes de longa duração para importação por projeto	300
Número de operações de longa duração pendentes de exclusão de documentos por projeto	100
Número de controles de veiculação por projeto	1.000
Número de controles de exibição de reforço por configuração de exibição	100
Número de controles de veiculação de filtros por configuração de veiculação	100
Número de controles de exibição de redirecionamento por configuração de exibição	100
Número de controles de veiculação de sinônimos por configuração de veiculação	100
Número de eventos do usuário por projeto	40.000.000.000
Número regional de repositórios de dados por projeto e local para Global ou `global`	100
Número regional de repositórios de dados por projeto e local para multirregião da UE ou `eu`	100
Número regional de armazenamentos de dados por projeto e local para multirregião dos EUA ou `us`	100
Número regional de documentos por projeto e por local para Global ou `global`	10.000.000
Número regional de documentos por projeto e local para multirregião da UE ou `eu`	10.000.000
Número regional de documentos por projeto e local para multirregião dos EUA ou `us`	10.000.000
Número regional de mecanismos por projeto e por local para Global ou `global`	150
Número regional de mecanismos por projeto e local para multirregião da UE ou `eu`	150
Número regional de mecanismos por projeto e local para multirregião dos EUA ou `us`	150
Número regional de eventos do usuário por projeto e local para Global ou `global`	40.000.000.000
Número regional de eventos do usuário por projeto e por local para multirregião da UE ou `eu`	40.000.000.000
Número regional de eventos do usuário por projeto e por local para multirregião dos EUA ou `us`	40.000.000.000

^* Devido a uma limitação técnica, a cota máxima para repositórios de dados é de 500 por projeto. Se você precisar de mais repositórios de dados, use novos projetos.

^† Devido a uma limitação técnica, a cota máxima para mecanismos é de 500 por projeto. Se você precisar de mais mecanismos, use novos projetos.

cotas de taxa.

As cotas a seguir se aplicam às solicitações da API AI Applications. Se a cota padrão não for suficiente, é possível solicitar um aumento.

Cota	Valor
Solicitações de consulta completa por minuto por projeto	300
Solicitações de leitura de pesquisa por conversa por minuto por projeto	300
Solicitações de gravação de pesquisa por conversa por minuto por projeto	300
Solicitações em lote de documentos (como importação e remoção inline) por minuto e projeto	100
Documentar solicitações de importação assíncrona (Cloud Storage, BigQuery etc.) por minuto por projeto	5
Solicitações de exclusão de documentos por minuto por projeto	100
Solicitações de leitura de documentos por minuto por projeto	300
Solicitações de gravação de documentos por minuto por projeto	12.000
Solicitações de criação de avaliação por dia e por projeto	5
Solicitações de leitura de avaliação por minuto por projeto	100
Solicitações de gravação de avaliação por minuto por projeto	100
Consultas de LLM (resumo da pesquisa, pesquisa em várias etapas) por minuto por projeto	60
Número de gravações pendentes de streaming do FHIR ou do BigQuery por minuto	6.000
Número de conjuntos de consultas de amostra por projeto	100
Solicitações de API de classificação por minuto e projeto	500
Solicitações de recomendação por minuto por projeto	60.000
Exemplo de solicitações de leitura de consultas por minuto por projeto	200
Exemplo de solicitações de leitura de conjunto de consultas por minuto por projeto	100
Exemplo de solicitações de gravação de conjunto de consultas por minuto por projeto	100
Exemplo de solicitações de gravação de consultas por minuto por projeto	200
Solicitações de leitura de esquema por minuto por projeto	100
Solicitações de gravação de esquema por minuto por projeto	100
Solicitações de pesquisa por minuto por projeto	300
Solicitações em lote de eventos do usuário (como importação e exclusão) por minuto e por projeto	100
Solicitações de coleta de eventos do usuário por minuto, projeto e usuário	240
Solicitações de gravação de eventos do usuário por minuto por projeto	60.000

Cota para indexação de páginas da Web

Quando você tem um repositório de dados com a Indexação avançada de sites ativada, cada página da Web indexada conta para a cota "Número de documentos por projeto" na lista Cotas de alocação. Você também pode conferir o número de páginas no seu projeto e a cota de páginas dele no campo Páginas do projeto x cota na página Dados de um repositório de dados.

Se você adicionar sites a um repositório de dados em um projeto e as páginas da Web nesses sites excederem a cota do projeto, os sites não serão indexados. Se você tiver sites no seu repositório de dados que já estão indexados, eles vão continuar sendo indexados como antes. É possível solicitar um upgrade da sua cota a qualquer momento.

Solicitar aumento de cota

Para ajustar a maioria das cotas, use o console do Google Cloud . Para mais informações, consulte Solicitar um ajuste de cota.