La planification de la capacité est un élément essentiel de la préparation des événements. Elle vous permet de déterminer la quantité de ressources cloud nécessaires pour vous assurer que vos charges de travail disposent de ce dont elles ont besoin pour fonctionner efficacement, sans surprovisionnement ni paiement inutile de ce dont vous n'avez pas besoin.
La capacité correspond à la quantité totale d'une ressource particulière disponible et partagée entre tous les clients. Toutefois, pour s'assurer qu'un petit nombre de clients ou de projets ne peut pas monopoliser les ressources, Google Cloud limite la quantité d'une ressource Google Cloud partagée particulière que vous pouvez utiliser à l'aide de quotas.
Chaque quota représente une ressource dénombrable spécifique, comme les appels d'API à un service particulier, le nombre de VM utilisées par votre projet à un moment donné, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer.
Bien que de nombreux services disposent de quotas par défaut pour certaines ressources, les quotas qui s'appliquent à vos applications sont propres à vous, à votre projet ou à votre organisation. Activer la facturation pour votre projet augmente les quotas pour la plupart des services. Les quotas peuvent également augmenter à mesure que votre utilisation de Google Cloud s'accroît.
Lorsque vous vous préparez à un événement ou à une période de forte activité, vous devez vous assurer que vos quotas correspondent à vos besoins en ressources afin de ne pas rencontrer de défaillances inattendues.
Nous vous recommandons d'effectuer les opérations suivantes :
Utilisez les outils Cloud Monitoring pour obtenir une visibilité sur l'utilisation et la capacité de vos applications, ainsi que sur l'état général de vos applications et de votre infrastructure.
Évaluez les utilisations moyennes et maximales de vos principales charges de travail cloud, ainsi que leurs besoins actuels et futurs en capacité, afin de déterminer le surprovisionnement nécessaire pour vous préparer aux pics de trafic.
Exécutez des tests de charge pour déterminer la charge que le système peut gérer tout en atteignant ses objectifs de latence, avec une quantité fixe de ressources.
Utiliser le planificateur de capacité
Le planificateur de capacité vous permet d'afficher l'historique et les prévisions d'utilisation de vos instances de machine virtuelle (VM), de vos volumes de disque persistant et de vos GPU. Vous pouvez également afficher les réservations, réserver des ressources à l'avance et gérer les limites de quota de votre projet en vérifiant si vous êtes proche de votre limite et en configurant des demandes d'augmentation automatique des quotas. Pour en savoir plus, consultez Afficher les données d'utilisation et de prévision dans le planificateur de capacité.
Activer l'outil d'ajustement de quota
L'outil d'ajustement des quotas surveille votre consommation de ressources et envoie de manière proactive des demandes d'ajustement de quota en votre nom pour que vous n'ayez pas à effectuer de demandes manuelles. Pour en savoir plus, consultez Fonctionnement de l'outil d'ajustement des quotas.
Demander un ajustement de quota
Si vos quotas ne sont pas suffisants, vous pouvez demander un ajustement de quota. Il existe trois façons principales de demander une augmentation de quota:
- Via la console Google Cloud
- Via une demande d'assistance
- Directement avec votre équipe de gestion de compte ou votre TAM
Si vous avez besoin que votre demande d'augmentation de quota soit traitée rapidement, nous vous recommandons d'utiliser la console Google Cloud. Toutefois, si la demande nécessite une analyse plus approfondie, vous devrez peut-être travailler avec votre équipe de gestion de compte.
Pour ajuster la valeur d'un quota via la console Google Cloud, consultez la section Afficher et gérer les quotas.
La plupart des demandes d'augmentation de quota sont évaluées par des systèmes automatisés. Leur décision est basée sur des critères, y compris la disponibilité des ressources, la durée d'utilisation de Google Cloudet d'autres facteurs. Les demandes qui ne répondent pas aux critères sont refusées. Si votre demande est refusée, vous pouvez essayer de demander une augmentation du quota en créant une demande d'assistance ou en contactant votre équipe de gestion du compte ou votre TAM.
Créer une réservation
Les réservations vous permettent de vous assurer que les ressources Compute Engine sont disponibles pour créer des VM avec le même matériel (mémoire et processeurs virtuels) et les mêmes ressources facultatives (GPU et disques SSD locaux) chaque fois que vous en avez besoin.
Une réservation à la demande est provisionnée au moment de votre requête, si la capacité demandée est disponible. Une réservation future vous permet de demander de la capacité à l'avance et vous offre un niveau élevé d'assurance quant à l'obtention et à la sécurisation de la capacité pour les pics d'activité. Nous vous recommandons de réserver vos futurs espaces bien à l'avance. Pour en savoir plus, consultez les ressources suivantes :
- Réservations de ressources zonales Compute Engine
- Créer une réservation pour un seul projet
- Créer des demandes de réservation futures pour un seul projet