Quota condivisa dinamica (DSQ)

È stata introdotta la quota condivisa dinamica (DSQ) per gestire le richieste con pagamento a consumo (PayGo) con maggiore flessibilità per adattarsi alle esigenze del tuo workload senza dover gestire le quote e le richieste di aumento della quota (QIR). Con DSQ, non esistono limiti di quota predefiniti per il tuo utilizzo. DSQ fornisce invece l'accesso a un ampio pool condiviso di risorse, allocate dinamicamente in base alla disponibilità in tempo reale delle risorse e alla domanda in tempo reale di tutti i clienti di quel modello. Quando più clienti sono attivi, ciascuno riceve una quantità inferiore di throughput. Allo stesso modo, se ci sono meno clienti, ognuno potrebbe ottenere una velocità effettiva maggiore.

Modelli supportati

I seguenti modelli Gemini e i relativi modelli ottimizzati con supervisione supportano DSQ:

I seguenti modelli Gemini legacy supportano DSQ:

  • Gemini 1.5 Pro
  • Gemini 1.5 Flash

Come funziona DSQ

La quota condivisa dinamica (DSQ) si adatta ai tuoi pattern e alle tue esigenze di traffico e riduce al minimo gli attriti di utilizzo. L'accesso del tuo progetto alle risorse in DSQ non è limitato da un numero arbitrario che abbiamo impostato. Viene invece determinata dalla capacità complessiva del pool condiviso e dalla domanda collettiva attuale di tutti i clienti. Questo modello è progettato per offrire una flessibilità significativa, consentendo ai tuoi carichi di lavoro di aumentare e consumare più risorse quando disponibili. Al contrario, consente anche a tutti i clienti del pool condiviso di avere la possibilità di accedere alle risorse quando sono disponibili senza richiedere la configurazione della quota per cliente.

Per garantire un'esperienza equa e stabile per tutti gli utenti nell'ambiente di risorse condivise, la quota condivisa dinamica gestisce in modo intelligente la gestione delle richieste, soprattutto durante i periodi di domanda molto elevata da fonti isolate. Anziché un limite fisso, DSQ utilizza un approccio di assegnazione delle priorità dinamico. Ciò significa che, sebbene il sistema sia progettato per gestire i picchi, gli aumenti insolitamente grandi e rapidi di traffico da una singola origine potrebbero essere gestiti con una priorità diversa rispetto a un traffico più costante e stabile. Questa gestione sofisticata garantisce che l'attività degli utenti e i carichi di lavoro regolari siano protetti da picchi estremi e transitori, promuovendo la stabilità complessiva del sistema e l'accesso equo.

Le richieste a Gemini con input multimodali sono soggette ai limiti di frequenza del sistema corrispondenti, che includono immagini, audio, video e documenti.

Per contribuire a garantire l'alta disponibilità della tua applicazione e ottenere livelli di servizio prevedibili per i tuoi carichi di lavoro di produzione, consulta Throughput di cui è stato eseguito il provisioning.

Informazioni sugli errori 429 relativi all'esaurimento delle risorse in DSQ

Siamo consapevoli che riscontrare un errore 429 "risorsa esaurita" può essere frustrante e potrebbe farti sospettare di aver raggiunto una sorta di limite di quota. Tuttavia, con DSQ non è così. Questi errori indicano che il pool condiviso complessivo di risorse per quel tipo specifico (ad esempio, un modello particolare in una regione specifica) in un momento specifico sta registrando una domanda estremamente elevata da parte di molti utenti contemporaneamente. Immagina di provare a salire su un treno molto affollato durante l'ora di punta. Non esiste un "limite di biglietti" specifico per te, ma il treno potrebbe essere momentaneamente pieno. Si tratta di uno stato temporaneo di contesa per le risorse, non di un limite fisso imposto al tuo progetto.

DSQ lavora costantemente per gestire e distribuire la capacità disponibile in modo equo ed efficiente. Quando ricevi un errore di questo tipo, significa che la domanda istantanea ha superato l'offerta disponibile nel pool condiviso. A differenza di una quota rigida, in cui l'accesso ti viene negato anche se le risorse sono inattive altrove, DSQ mira a darti l'accesso ogni volta che le risorse sono libere. L'errore di esaurimento riflette il carico attuale dell'intero sistema, non un limite del tuo account.

Ti consigliamo di implementare meccanismi di ripetizione dei tentativi, poiché la disponibilità in questo ambiente dinamico può cambiare rapidamente. Per altre tattiche di gestione degli errori di esaurimento delle risorse, vedi Guida alla gestione degli errori 429 o Codice di errore 429.

Passaggi successivi