Este documento lista as cotas e os limites do sistema que se aplicam ao Gemini para Google Cloud.
- As cotas especificam a quantidade de um recurso compartilhado e contável que pode ser usado. As cotas são definidas por serviços do Google Cloud , como o Gemini para Google Cloud.
- Os limites do sistema são valores fixos que não podem ser alterados.
Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um recurso doGoogle Cloud seu projeto do Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de Google Cloud produtos e serviços
- Restringe o consumo desses recursos.
- Fornece uma maneira de solicitar mudanças no valor da cota e automatizar ajustes de cota
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao nível do projeto Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um Google Cloud projeto, as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Também há limites de sistemas nos recursos do Gemini. Não é possível alterar os limites.
Solicitações por segundo
O Gemini para Google Cloud impõe cotas de solicitações por segundo para cada usuário em um projeto.
Cota | Valor |
---|---|
Solicitações por segundo | 2 |
Solicitações por dia
O Gemini para Google Cloud impõe cotas para o número total de solicitações por dia para cada usuário em um projeto.
Cota | Valor |
---|---|
Solicitações por dia para o Gemini Code Assist ou o Gemini em solicitações de código do BigQuery, como geração e conclusão de código. | 6000 |
Solicitações por dia para chat, visualização, verificações de tabelas de insights de dados, geração de metadados, preparação de dados e outras solicitações que mostram respostas no painel Assistente do Cloud no console e nos IDEs do Google Cloud . | 960 |
Cotas do Gemini Code Assist
O Gemini Code Assist aplica cotas para alguns recursos.
Cota | Valor |
---|---|
Reconhecimento da base de código local | Janela de contexto com 128 mil tokens |
Repositórios de personalização de código | 20.000 |
Cotas para o modo de agente e a CLI do Gemini
As cotas para solicitações do modo de agente do Gemini Code Assist e da CLI Gemini são combinadas. No modo agente ou ao usar a CLI do Gemini, um comando pode resultar em várias solicitações.
Cota | Edição do Gemini Code Assist | Valor |
---|---|---|
Solicitações por usuário a cada minuto | Padrão | 120 |
Enterprise | 120 | |
Solicitações por usuário por dia | Padrão | 1500 |
Enterprise | 2000 |
Cotas do Gemini no BigQuery
Para recursos de assistência de programação, a cota do Gemini Code Assist e do Gemini no BigQuery para solicitações de código de recursos como preenchimento automático e geração de código é a mesma.
Para clientes que usam o Gemini no BigQuery com computação on demand do BigQuery ou com as edições Enterprise ou Enterprise Plus, as cotas de recursos avançados, como insights de dados, são fornecidas com base no uso médio diário de TiB verificados ou nas horas de slot do último mês civil completo. Essa cota é aplicada no nível da organização e está disponível para todos os projetos nela. As cotas são arredondadas para a centena mais próxima de uso de slot-hora.
Cotas por 100 horas de slot (uso médio diário das edições Enterprise ou Enterprise Plus) ou por TiB verificado usando o modelo de computação sob demanda | Valor |
---|---|
Solicitações por dia para chat, visualização, verificações de tabela e outras solicitações que mostram respostas no painel Assistente do Cloud no console Google Cloud . | 5 |
Exemplo: uma organização que tem uma reserva da edição Enterprise com 100 slots como valor de referência usa uma média de 2.400 horas de slot por dia (100 slots * 24 horas = 2.400 horas de slot). Como resultado, no mês seguinte, eles recebem as seguintes cotas diárias:
- 120 chats, visualizações, verificações de tabela de insights de dados e gerações automatizadas de metadados por dia
Se sua organização não tiver comprado nenhum slot da edição Enterprise ou Enterprise Plus do BigQuery ou computação sob demanda (TiB) até agora, após o primeiro uso, você vai receber a cota padrão do seguinte no primeiro mês civil completo:
- 250 conversas, visualizações, verificações de tabela de insights de dados e gerações automatizadas de metadados por dia
Se você começar a usar reservas de computação sob demanda, da edição Enterprise ou da edição Enterprise Plus no meio do mês, a cota padrão será aplicada até o fim do mês seguinte.
Solicitar aumento de cota
Para ajustar a maioria das cotas, use o console do Google Cloud . Para mais informações, consulte Solicitar um ajuste de cota.