Cette page décrit les bonnes pratiques à suivre pour gérer les quotas de l'API Cloud Healthcare. Utilisez cette page si votre projet Google Cloud génère ou est susceptible de générer un trafic important et si vous avez besoin de plus de quotas que ceux fournis par défaut par l'API Cloud Healthcare.
Quotas par défaut de l'API Cloud Healthcare
Les quotas par défaut de l'API Cloud Healthcare ne sont pas conçus pour tous les cas d'utilisation, en particulier si votre projet Google Cloud génère un trafic important. L'API Cloud Healthcare n'augmente pas automatiquement les quotas. Vous devez planifier et surveiller votre utilisation des quotas.
Bonnes pratiques pour surveiller et consulter les quotas
Il existe plusieurs méthodes pour consulter votre utilisation des quotas. Lorsque vous estimez et consultez les quotas de l'API Cloud Healthcare, nous vous recommandons d'utiliser le modèle de quota de service. Le modèle vous permet d'évaluer précisément le quota disponible en fonction des critères suivants:
- Présence d'un remplacement par l'administrateur. Un compte principal auquel le rôle Administrateur de quotas a été attribué dans une organisation peut appliquer une dérogation d'administrateur aux quotas dans les projets Google Cloud de l'organisation. Une dérogation administrative remplace les limites par défaut et les dérogations du producteur.
Indique si un remplacement défini par le producteur est présent. Un propriétaire de service accorde un quota de remplacement défini par le producteur à un client d'un service. Google Cloud est le propriétaire du service de l'API Cloud Healthcare. Tout forçage de quota fourni par Google Cloud est un forçage de producteur.
Indique si un quota de remplacement défini par le client est présent. Une personne qui envoie des requêtes à l'API Cloud Healthcare est un consommateur du service de l'API Cloud Healthcare. Vous pouvez appliquer des forçages de client dans différentes situations, par exemple pour limiter les quotas dans votre projet Google Cloud en tant que mesure de contrôle des coûts afin d'éviter de dépasser votre budget.
Si l'un de ces forçages est en vigueur, vous pouvez calculer votre limite de quota de client pour obtenir une évaluation précise de votre quota disponible.
Bonnes pratiques pour demander des quotas supplémentaires
Google Cloud dispose de procédures pour demander un quota plus élevé. Pour en savoir plus sur le traitement des demandes d'augmentation de quota, consultez la page À propos des demandes d'augmentation de quota.
Avant de demander un quota supplémentaire, assurez-vous d'avoir implémenté les deux éléments suivants:
Ces implémentations peuvent réduire le quota dont vous avez besoin pour les raisons suivantes:
- Les deux implémentations étalent les pics de charge sur plusieurs heures ou minutes, plutôt que sur quelques secondes.
- Les deux implémentations utilisent efficacement le quota sur une période de 24 heures. Si les requêtes qui dépassent considérablement le quota par défaut sont cohérentes sur une période de 24 heures, des pools de ressources plus importants peuvent être alloués au service de l'API Cloud Healthcare. L'allocation supplémentaire de ressources est effectuée sur demande uniquement et est déterminée au cas par cas.
- Une utilisation cohérente des ressources permet à Google Cloud de comprendre plus facilement vos besoins en quotas et de vous fournir les quotas dont vous avez besoin.
Pour gérer efficacement votre capacité et votre quota, vous devez connaître les besoins en capacité de votre organisation. Si vous planifiez vos besoins en capacité et que vous pensez avoir besoin d'une augmentation importante des quotas lorsque votre projet Google Cloud sera en production, demandez-la au service client Google Cloud. L'assistance client peut vous aider à allouer et à augmenter les quotas pendant les phases de test et de déploiement de votre projet Google Cloud.
Vous n'avez pas besoin d'avoir une offre d'assistance Customer Care payante pour demander une augmentation de quota. Certaines demandes d'augmentation de quota sont traitées dans un délai de deux à trois jours ouvrés, mais nous vous recommandons de prévoir un délai plus long. Si votre demande d'augmentation de quota est importante, son traitement peut prendre 10 jours ouvrés ou plus. Une partie de votre planification doit consister à prévoir du temps pour répondre au service client afin de résoudre les questions ou les problèmes liés à la demande. Si vous vous assurez que votre demande initiale d'augmentation du quota est suffisamment détaillée, vous pourrez peut-être réduire le temps d'attente pour que votre demande soit traitée.
Bonnes pratiques pour anticiper les besoins en quotas
Avant de mettre votre projet Google Cloud en production, anticipez et planifiez le nombre de quotas dont vous aurez besoin. Planifier vos besoins en termes de quota vous évite toute limitation inattendue de la consommation de ressources plus tard.
Les sections suivantes expliquent les éléments à prendre en compte lors de la planification des quotas.
Anticiper l'utilisation totale pour tous les magasins de données et les clients
Découvrez votre utilisation totale pour tous les datastores de l'API Cloud Healthcare, ainsi que l'utilisation totale de tous les clients qui envoient des requêtes à votre projet Google Cloud.
- Certains projets Google Cloud implémentent plusieurs cas d'utilisation de l'API Cloud Healthcare. Par exemple, votre projet Google Cloud peut utiliser plusieurs ensembles de données et datastores de l'API Cloud Healthcare pour différents types de données, ce qui augmente votre utilisation totale des quotas.
- Les quotas sont appliqués par projet Google Cloud et par région. Assurez-vous de disposer de mesures précises de votre quota requis dans plusieurs régions. Si vous avez plusieurs projets Google Cloud, vous aurez peut-être besoin de mesures plus précises pour chacun d'entre eux. Pour en savoir plus sur la planification des quotas par région, consultez la section Anticiper l'utilisation par région.
- L'API Cloud Healthcare n'équilibre pas la charge des quotas entre les clients, les ensembles de données ni les datastores. Le client doit déterminer s'il doit implémenter un schéma de priorisation pour s'assurer que le trafic le plus critique ne rencontre pas d'erreurs
429 RESOURCE_EXHAUSTED
.
Anticiper l'utilisation par région
L'API Cloud Healthcare mesure les quotas par projet Google Cloud et par région. Les quotas sont généralement mesurés par minute, ce qui permet d'équilibrer les petits pics de requêtes par seconde sur une échelle par minute.
Si votre projet Google Cloud utilise plusieurs régions, vous pouvez définir des quotas par région.
Si votre ensemble de données de l'API Cloud Healthcare se trouve dans l'emplacement multirégional us
et que vous souhaitez demander un quota supplémentaire, indiquez dans votre demande de quota qu'il s'agit du quota pour la "méta-région États-Unis". L'emplacement multirégional us
se compose des sous-régions suivantes:
us-central1
us-east1
us-west1
Si le trafic de l'API Cloud Healthcare utilise déjà un quota dans l'une des sous-régions us-
, veillez à prendre en compte le trafic existant dans ces sous-régions lorsque vous envoyez une demande d'augmentation de quota pour la multirégion us
.
Par exemple, si vous avez des ensembles de données dans us-central1
et us
, et que vous demandez une augmentation de quota dans us
, indiquez dans votre demande que vous avez des ensembles de données dans us-central1
.
Privilégier les transactions à faible volume de manière cohérente
Le scénario suivant explique l'importance d'envoyer de plus petites quantités de trafic de manière cohérente au lieu d'envoyer des transactions à fort volume avec un intervalle plus long entre les transactions.
Le volume de trafic est calculé à l'aide de la formule request payload * time = traffic volume
.
Une transaction à fort volume correspond à une ou plusieurs requêtes envoyées à l'API Cloud Healthcare sur un court intervalle et contenant une charge utile importante.
Une série de requêtes peut également être considérée comme à fort volume si de nombreuses requêtes sont envoyées sur une courte période, quelle que soit la taille de la charge utile.
Supposons qu'un client collecte un grand nombre de transactions et les envoie à l'API Cloud Healthcare en rafale toutes les cinq minutes. Voici ce qui se passe:
- L'augmentation initiale du trafic consomme le quota de la première minute (selon les rollovers de minutes) jusqu'à ce que le quota soit épuisé.
- Tout trafic par rafales restant reçoit des erreurs
429 RESOURCE_EXHAUSTED
. Si elle est configurée, toutes les requêtes concernées font l'objet d'un intervalle exponentiel entre les tentatives. - Un pourcentage de requêtes ayant rencontré l'intervalle exponentiel entre les tentatives initial est reprogrammé pour être réessayé dans la minute suivante. Certaines requêtes sont tentées plusieurs fois en une seule minute, puis réessayées la minute suivante.
- Si le volume de requêtes est suffisamment élevé, les requêtes réessayées peuvent à nouveau rencontrer des erreurs
429 RESOURCE_EXHAUSTED
et un intervalle exponentiel entre les tentatives. Certaines rafales de trafic peuvent rencontrer un délai exponentiel à différents moments, et les tentatives d'envoi de trafic peuvent converger à la même minute à l'avenir. - Si le volume de requêtes est toujours élevé, une partie du trafic est réessayée lorsque la prochaine rafale de trafic commence. Le problème est exacerbé par l'ajout de trafic au volume de requêtes existant. Votre application peut avoir du mal à gérer la file d'attente de requêtes et à les envoyer de manière cohérente à l'API Cloud Healthcare.
Ce scénario montre l'importance de connaître le volume de votre trafic par minute. Implémentez votre volume de trafic et vos délais avant expiration pour éviter la congestion du réseau et vous assurer que votre application ne rencontre pas de nombreuses défaillances nécessitant des nouvelles tentatives.
Consulter les quotas DICOM et FHIR
Pour afficher les quotas de l'API Cloud Healthcare associés aux magasins et aux opérations FHIR et DICOM, consultez la section Limites de quota.