Questa pagina descrive le best practice per la gestione della quota dell'API Cloud Healthcare. Utilizza questa pagina se il tuo progetto Google Cloud ha, o potrebbe avere, una grande quantità di traffico e hai bisogno di una quota superiore a quella fornita per impostazione predefinita dall'API Cloud Healthcare.
Quote predefinite dell'API Cloud Healthcare
Le quote predefinite dell'API Cloud Healthcare non sono progettate per tutti i casi d'uso, in particolare se il tuo progetto Google Cloud ha un volume di traffico elevato. La quota dell'API Cloud Healthcare non aumenta automaticamente. Devi pianificare e monitorare l'utilizzo della quota.
Best practice per il monitoraggio e la visualizzazione della quota
Esistono diversi metodi per visualizzare l'utilizzo della quota. Quando stimi e visualizzi la quota per l'API Cloud Healthcare, ti consigliamo di utilizzare il modello di quota di servizio. Il modello consente di valutare con precisione la quota disponibile in base ai seguenti criteri:
- Indica se è presente una sostituzione amministrativa. Un principal a cui è stato concesso il ruolo Amministratore delle quote in un'organizzazione può applicare l'override amministrativo alla quota nei progettiGoogle Cloud all'interno dell'organizzazione. Un override dell'amministratore sostituisce i limiti predefiniti e gli override del producer.
Se è presente un override del producer. Il proprietario di un servizio concede una sostituzione del producer a un consumer di un servizio. Google Cloud è il proprietario del servizio API Cloud Healthcare. Qualsiasi override della quota fornito da Google Cloud è un override del producer.
Indica se è presente un override del consumer. Una persona che effettua richieste all'API Cloud Healthcare è un consumer del servizio API Cloud Healthcare. Puoi applicare override consumer per varie situazioni, ad esempio per limitare le quote nel tuo progettoGoogle Cloud come misura di controllo dei costi per evitare di superare il budget.
Se hai uno di questi override in vigore, puoi calcolare il limite della quota consumer per ottenere una valutazione accurata della quota disponibile.
Best practice per la richiesta di quota aggiuntiva
Google Cloud dispone di procedure per richiedere un valore di quota più elevato. Per scoprire come vengono elaborate le richieste di aggiustamento delle quote, vedi Informazioni sugli aggiustamenti delle quote.
Prima di richiedere una quota aggiuntiva, assicurati di aver implementato entrambe le seguenti operazioni:
Queste implementazioni potrebbero ridurre la quota necessaria per i seguenti motivi:
- Entrambe le implementazioni distribuiscono i picchi di carico su diverse ore o minuti, anziché secondi.
- Entrambe le implementazioni utilizzano in modo efficiente la quota in un periodo di 24 ore. Se le richieste che superano significativamente la quota predefinita sono coerenti per un periodo di 24 ore, è possibile allocare pool di risorse più grandi al servizio API Cloud Healthcare. L'allocazione aggiuntiva di risorse avviene solo su richiesta e viene determinata caso per caso.
- L'utilizzo coerente delle risorse consente a Google Cloud di comprendere più facilmente i tuoi requisiti di quota e di fornirti la quota di cui hai bisogno.
Per gestire in modo efficace capacità e quota, devi conoscere i requisiti di capacità della tua organizzazione. Se stai pianificando i requisiti di capacità e ritieni di aver bisogno di un aumento significativo della quota quando il tuo progetto è in produzione, richiedi un aumento a Google Cloud Customer Care. Google Cloud L'assistenza clienti può aiutarti ad allocare e aumentare la quota durante le fasi di test e implementazione del tuo progetto Google Cloud .
Non è necessario disporre di un servizio di assistenza clienti a pagamento per richiedere un aumento della quota. Alcune richieste di aumento della quota vengono completate entro 2-3 giorni lavorativi, ma ti consigliamo di pianificare un periodo più lungo. Se l'aumento della quota è elevato, potrebbero essere necessari 10 giorni lavorativi o più prima che la richiesta di aumento della quota venga completata. La pianificazione deve prevedere l'allocazione di tempo per rispondere all'assistenza clienti e risolvere eventuali domande o problemi aperti relativi alla richiesta. Se ti assicuri che la richiesta iniziale di aumento della quota sia sufficientemente dettagliata, potresti ridurre il tempo di attesa per l'evasione della richiesta.
Best practice per prevedere le esigenze di quota
Prima che il tuo Google Cloud progetto venga messo in produzione, prevedi e pianifica la quota di cui avrai bisogno. La pianificazione dei requisiti di quota impedisce una limitazione imprevista del consumo di risorse in un secondo momento.
Le sezioni seguenti spiegano cosa considerare quando pianifichi la quota.
Prevedi l'utilizzo totale per tutti i datastore e i client
Comprendere l'utilizzo totale in tutti i datastore dell'API Cloud Healthcare e l'utilizzo totale di tutti i client che effettuano richieste al tuo progettoGoogle Cloud .
- Alcuni Google Cloud progetti implementano più casi d'uso dell'API Cloud Healthcare. Ad esempio, il tuo progetto Google Cloud potrebbe utilizzare più set di dati e datastore dell'API Cloud Healthcare per diversi tipi di dati, aumentando così l'utilizzo totale della quota.
- Le quote vengono applicate per progetto e per regione.Google Cloud Assicurati di avere misurazioni accurate della quota richiesta in più regioni. Se hai più Google Cloud progetti, potresti aver bisogno di misurazioni più accurate tra i progetti. Per ulteriori informazioni sulla pianificazione della quota per regione, vedi Anticipare l'utilizzo per regione.
- L'API Cloud Healthcare non bilancia il carico della quota tra client, set di dati o
datastore. Il cliente deve determinare se implementare uno schema di assegnazione delle priorità per garantire che il traffico più critico non riscontri errori
429 RESOURCE_EXHAUSTED
.
Prevedere l'utilizzo per regione
L'API Cloud Healthcare misura le quote in base al progetto e alla regione.Google CloudLe quote vengono in genere misurate al minuto, il che consente di bilanciare piccoli picchi di richieste al secondo su una scala al minuto.
Se il tuo Google Cloud progetto utilizza più regioni, puoi impostare quote per regione.
Se il tuo set di dati dell'API Cloud Healthcare si trova nella posizione multiregionale us
e vuoi richiedere una quota aggiuntiva, indica nella richiesta di quota che la quota è per la "metaregione Stati Uniti". La località multiregionale us
è composta dalle seguenti regioni secondarie:
us-central1
us-east1
us-west1
Se hai già traffico dell'API Cloud Healthcare che utilizza la quota in una delle
us-
regioni secondarie, assicurati di tenere conto del traffico esistente in queste regioni secondarie
quando effettui una richiesta di aumento della quota per la multiregione us
.
Ad esempio, se hai set di dati in us-central1
e us
e richiedi un aumento della quota in us
, specifica nella richiesta che hai set di dati in us-central1
.
Prediligi le transazioni a basso volume in modo coerente
Lo scenario seguente spiega l'importanza di inviare quantità minori di traffico in modo coerente anziché inviare transazioni di volume elevato con un intervallo più lungo tra le transazioni.
Il volume di traffico viene calcolato utilizzando la formula request payload * time = traffic volume
.
Una transazione ad alto volume è una o più richieste all'API Cloud Healthcare in un breve intervallo che contengono un payload di grandi dimensioni.
Una serie di richieste può essere considerata ad alto volume anche se
vengono inviate molte richieste in un breve intervallo, indipendentemente dalle dimensioni del payload.
Supponiamo che un client raccolga transazioni ad alto volume e le invii all'API Cloud Healthcare in un burst ogni cinque minuti. Si verifica quanto segue:
- Il burst iniziale di traffico consuma la quota nel primo minuto (a seconda dei rollover dei minuti) fino all'esaurimento della quota.
- Il traffico burst rimanente riceve errori
429 RESOURCE_EXHAUSTED
. Se configurate, tutte le richieste interessate riscontrano un backoff esponenziale. - Una percentuale di richieste che hanno riscontrato il backoff esponenziale iniziale viene ripianificata per essere riprovata nel minuto successivo. Alcune richieste vengono tentate più volte in un solo minuto, per poi essere riprovate il minuto successivo.
- Se il volume di richieste è sufficientemente elevato, le richieste ripetute potrebbero riscontrare
errori
429 RESOURCE_EXHAUSTED
e un nuovo backoff esponenziale. Alcuni picchi di traffico potrebbero riscontrare un backoff esponenziale in momenti diversi e i tentativi di inviare nuovamente il traffico potrebbero convergere nello stesso minuto in futuro. - Se il volume di richieste è ancora elevato, viene eseguito un nuovo tentativo per parte del traffico all'inizio del successivo picco di traffico. Il problema è esacerbato perché al backlog esistente di richieste viene aggiunto altro traffico. La tua applicazione potrebbe avere difficoltà a gestire l'arretrato di richieste e a inviarle in modo coerente all'API Cloud Healthcare.
Questo scenario mostra l'importanza di conoscere il volume del traffico su base oraria. Implementa il volume di traffico e i backoff per evitare la congestione della rete e assicurarti che la tua applicazione non riscontri molti errori che richiedono tentativi.
Rivedi le quote DICOM e FHIR
Per visualizzare le quote dell'API Cloud Healthcare associate a operazioni e negozi FHIR e DICOM, consulta Limiti di quota.