Cota compartilhada dinâmica (DSQ, na sigla em inglês)

A cota compartilhada dinâmica (DSQ, na sigla em inglês) foi introduzida para atender às suas solicitações de pagamento por uso (PayGo, na sigla em inglês) com mais flexibilidade para se adaptar às necessidades de carga de trabalho sem precisar gerenciar cotas e solicitações de aumento de cota (QIR, na sigla em inglês). O DSQ atende às solicitações recebidas distribuindo a capacidade de pagamento conforme o uso disponível entre os clientes de um modelo e região específicos. Suas solicitações são atendidas enquanto a capacidade estiver disponível sem nenhum limite de cota predefinido.

Modelos compatíveis

Os seguintes modelos do Gemini são compatíveis com a DSQ:

Como o DSQ funciona

A cota compartilhada dinâmica (DSQ, na sigla em inglês) se adapta aos seus padrões de tráfego e necessidades sem uma cota predefinida e atende às suas solicitações enquanto houver capacidade disponível. Com a DSQ, você não precisa enviar uma solicitação de aumento de cota (QIR, na sigla em inglês) sempre que o tráfego aumenta, porque não há cota que possa limitar suas solicitações.

Para evitar que picos de tráfego enviados por alguns clientes interfiram em outros que enviam tráfego menor e mais estável, o DSQ adota um mecanismo de controle de tráfego definindo um limite de tokens por segundo (TPS) no nível da organização. Esse limite de TPS é diferente das cotas padrão e não limita automaticamente as solicitações acima do limite. Em vez disso, o DSQ define prioridades diferentes para solicitações, dependendo se elas estão dentro ou acima do limite de TPS. Portanto, picos de tráfego além do limite de TPS não vão interferir nas solicitações dentro do limite.

As solicitações do Gemini com entradas multimodais estão sujeitas aos limites de taxa do sistema correspondentes que incluem imagem, áudio, vídeo e documento.

A seguir