Bonnes pratiques de gestion des quotas

Cette page décrit les bonnes pratiques pour gérer le quota de l'API Cloud Healthcare. Utilisez cette page si votre projet Google Cloud génère ou est susceptible de générer un volume de trafic important, et que vous avez besoin d'un quota supérieur à celui fourni par défaut par l'API Cloud Healthcare.

Quotas par défaut de l'API Cloud Healthcare

Les quotas par défaut de l'API Cloud Healthcare ne sont pas conçus pour tous les cas d'utilisation, en particulier si votre Google Cloud projet génère un volume de trafic important. L'API Cloud Healthcare n'augmente pas automatiquement les quotas. Vous devez planifier et surveiller votre utilisation des quotas.

Bonnes pratiques pour surveiller et afficher les quotas

Il existe plusieurs méthodes pour afficher votre utilisation du quota. Lorsque vous estimez et consultez le quota de l'API Cloud Healthcare, nous vous recommandons d'utiliser le modèle de quota de service. Le modèle vous permet d'évaluer précisément le quota disponible en fonction des critères suivants :

  • Indique si un remplacement par un administrateur est présent. Un compte principal auquel le rôle Administrateur de quotas a été attribué dans une organisation peut appliquer une dérogation d'administrateur aux quotas dans les projetsGoogle Cloud de l'organisation. Une dérogation administrative remplace les limites par défaut et les dérogations du producteur.
  • Indique si un remplacement défini par le producteur est présent. Un propriétaire de service accorde un remplacement de producteur à un client d'un service. Google Cloud est le propriétaire du service de l'API Cloud Healthcare. Tout remplacement de quota fourni par Google Cloud est un remplacement de producteur.

  • Indique si un quota de remplacement défini par le client est présent. Toute personne qui envoie des requêtes à l'API Cloud Healthcare est un consommateur du service de l'API Cloud Healthcare. Vous pouvez appliquer des remplacements de client dans différentes situations, par exemple pour limiter les quotas dans votre projetGoogle Cloud en tant que mesure de contrôle des coûts afin d'éviter de dépasser votre budget.

Si l'une de ces substitutions est en vigueur, vous pouvez calculer votre limite de quota de client pour obtenir une évaluation précise de votre quota disponible.

Bonnes pratiques pour demander un quota supplémentaire

Google Cloud dispose de procédures pour demander une augmentation de quota. Pour savoir comment les demandes d'ajustement de quota sont traitées, consultez À propos des ajustements de quota.

Avant de demander un quota supplémentaire, assurez-vous d'avoir implémenté les deux éléments suivants :

Ces implémentations peuvent réduire la quantité de quota dont vous avez besoin pour les raisons suivantes :

  • Les deux implémentations répartissent les pics de charge sur plusieurs heures ou minutes, plutôt que sur quelques secondes.
  • Les deux implémentations utilisent efficacement le quota sur une période de 24 heures. Si les requêtes qui dépassent largement le quota par défaut sont cohérentes sur une période de 24 heures, des pools de ressources plus importants peuvent être alloués au service de l'API Cloud Healthcare. L'allocation de ressources supplémentaires n'est possible que sur demande et est déterminée au cas par cas.
  • Une utilisation cohérente des ressources permet à Google Cloud de mieux comprendre vos besoins en termes de quota et de vous fournir le quota dont vous avez besoin.

Pour gérer efficacement votre capacité et votre quota, vous devez connaître les besoins en capacité de votre organisation. Si vous planifiez vos besoins en capacité et pensez avoir besoin d'une forte augmentation de quota lorsque votre projet Google Cloud sera en production, demandez une augmentation au service client.Google Cloud Le service client peut vous aider à allouer et à augmenter votre quota lors des phases de test et de déploiement de votre projet Google Cloud .

Vous n'avez pas besoin d'avoir une offre d'assistance Customer Care payante pour demander une augmentation de quota. Certaines demandes d'augmentation de quota sont traitées dans un délai de deux à trois jours ouvrés, mais nous vous recommandons de prévoir un délai plus long. Si l'augmentation de quota est importante, le traitement de la demande peut prendre 10 jours ouvrés ou plus. Vous devez prévoir du temps pour répondre au service client et résoudre les questions ou problèmes en suspens concernant la demande. Si vous veillez à ce que votre demande initiale d'augmentation de quota soit suffisamment détaillée, vous pourrez peut-être réduire le temps d'attente avant qu'elle ne soit traitée.

Bonnes pratiques pour anticiper les besoins en quota

Avant de mettre en production votre projet Google Cloud , anticipez et planifiez la quantité de quota dont vous aurez besoin. Planifier vos besoins en termes de quota vous permet d'éviter toute limitation inattendue de la consommation de ressources par la suite.

Les sections suivantes expliquent ce que vous devez prendre en compte lorsque vous planifiez votre quota.

Anticiper l'utilisation totale pour tous les clients et magasins de données

Comprenez votre utilisation totale dans tous les datastores de l'API Cloud Healthcare et l'utilisation totale de tous les clients qui envoient des requêtes à votre projetGoogle Cloud .

  • Certains projets Google Cloud implémentent plusieurs cas d'utilisation de l'API Cloud Healthcare. Par exemple, votre projet Google Cloud peut utiliser plusieurs ensembles de données et datastores de l'API Cloud Healthcare pour différents types de données, ce qui augmente votre utilisation totale du quota.
  • Les quotas sont appliqués par projetGoogle Cloudet par région. Assurez-vous de disposer de mesures précises du quota requis dans plusieurs régions. Si vous avez plusieurs projets Google Cloud , vous aurez peut-être besoin de mesures plus précises pour chacun d'eux. Pour en savoir plus sur la planification des quotas par région, consultez Anticiper l'utilisation par région.
  • L'API Cloud Healthcare n'équilibre pas la charge du quota entre les clients, les ensembles de données ni les datastores. Le client doit déterminer s'il doit implémenter un système de priorisation pour s'assurer que le trafic le plus critique ne rencontre pas d'erreurs 429 RESOURCE_EXHAUSTED.

Anticiper l'utilisation par région

L'API Cloud Healthcare mesure les quotas par projetGoogle Cloudet par région. Les quotas sont généralement mesurés par minute, ce qui permet de compenser les petits pics de requêtes par seconde à l'échelle d'une minute.

Si votre projet Google Cloud utilise plusieurs régions, vous pouvez définir des quotas par région.

Si votre ensemble de données de l'API Cloud Healthcare se trouve dans l'emplacement multirégional us et que vous souhaitez demander un quota supplémentaire, indiquez dans votre demande de quota que le quota concerne la "méta-région des États-Unis". L'emplacement multirégional us se compose des sous-régions suivantes :

  • us-central1
  • us-east1
  • us-west1

Si vous avez déjà du trafic d'API Cloud Healthcare utilisant un quota dans l'une des sous-régions us-, assurez-vous de tenir compte du trafic existant dans ces sous-régions lorsque vous demandez une augmentation de quota pour la région multirégionale us-.us Par exemple, si vous avez des ensembles de données dans us-central1 et us, et que vous demandez une augmentation de quota dans us, précisez dans votre demande que vous avez des ensembles de données dans us-central1.

Privilégiez les transactions à faible volume de manière régulière.

Le scénario suivant explique l'importance d'envoyer régulièrement de petits volumes de trafic plutôt que des transactions à fort volume avec un intervalle plus long entre les transactions.

Le volume de trafic est calculé à l'aide de la formule request payload * time = traffic volume. Une transaction à volume élevé correspond à une ou plusieurs requêtes envoyées à l'API Cloud Healthcare dans un court intervalle et contenant une charge utile importante. Une série de requêtes peut également être considérée comme à volume élevé si de nombreuses requêtes sont envoyées sur un court intervalle, quelle que soit la taille de la charge utile.

Supposons qu'un client collecte des transactions à volume élevé et les envoie à l'API Cloud Healthcare par rafales toutes les cinq minutes. Voici ce qui se passe :

  1. Le pic de trafic initial consomme du quota au cours de la première minute (en fonction des reports de minutes) jusqu'à ce que tout le quota soit épuisé.
  2. Tout trafic en rafale restant génère des erreurs 429 RESOURCE_EXHAUSTED. Si elle est configurée, toutes les requêtes concernées rencontrent un intervalle exponentiel entre les tentatives.
  3. Un certain pourcentage des requêtes ayant rencontré l'intervalle exponentiel entre les tentatives initial est reprogrammé pour être réessayé la minute suivante. Certaines requêtes sont tentées plusieurs fois en une minute, puis sont réessayées la minute suivante.
  4. Si le volume de requêtes est suffisamment élevé, les requêtes relancées peuvent à nouveau rencontrer des erreurs 429 RESOURCE_EXHAUSTED et un intervalle exponentiel entre les tentatives. Certaines rafales de trafic peuvent rencontrer un intervalle exponentiel entre les tentatives à des moments différents, et les tentatives d'envoi de trafic peuvent converger vers la même minute à l'avenir.
  5. Si le volume de requêtes reste élevé, une partie du trafic est relancée au début de la prochaine rafale de trafic. Le problème est exacerbé, car davantage de trafic est ajouté au backlog de requêtes existant. Votre application peut avoir du mal à gérer le backlog de requêtes et à les envoyer de manière cohérente à l'API Cloud Healthcare.

Ce scénario montre l'importance de connaître le volume de votre trafic par minute. Implémentez votre volume de trafic et vos intervalles entre les tentatives pour éviter la congestion du réseau et vous assurer que votre application ne rencontre pas de nombreuses défaillances nécessitant des nouvelles tentatives.

Consulter les quotas DICOM et FHIR

Pour afficher les quotas de l'API Cloud Healthcare associés aux magasins et opérations FHIR et DICOM, consultez Limites de quota.