Avant que votre événement de pic de capacité ne se produise, gérez et optimisez les ressources utilisées par vos charges de travail Google Cloud . Cela implique de dimensionner correctement les ressources en fonction de l'utilisation et de la demande réelles, d'utiliser l'autoscaling pour l'allocation dynamique des ressources et d'examiner les recommandations d'architecture et de sécurité. Cloud Monitoring et Recommender (Active Assist) peuvent tous deux vous aider à identifier les opportunités d'optimisation de vos ressources cloud. Grâce à ces outils, vous pouvez obtenir des insights sur l'utilisation des ressources et prendre des décisions éclairées avant votre événement.
Consultez les Google Cloud bonnes pratiques
De nombreux problèmes liés aux pics de capacité peuvent être évités en suivant les bonnes pratiques recommandées pour le Google Cloud produit que vous utilisez. Voici quelques exemples de guides de bonnes pratiques:
Général | |
BigQuery | |
Cloud Storage | |
Compute Engine | |
Dataflow | |
Dataproc | |
Google Kubernetes Engine |
Examiner l'évolutivité
L'autoscaling peut vous assurer que vos applications cloud disposent des ressources dont elles ont besoin pour gérer des charges de travail variables, tout en évitant le surprovisionnement et les coûts inutiles. Google Cloud propose plusieurs options d'autoscaling spécifiques au produit, y compris les suivantes:
- Les groupes d'instances gérés (MIG, Managed Instance Group) Compute Engine sont des groupes de VM gérés et mis à l'échelle en tant qu'entité unique. Avec les MIG, vous pouvez définir des règles d'autoscaling qui spécifient le nombre minimal et maximal de VM à maintenir dans le groupe, ainsi que les conditions qui déclenchent l'autoscaling.
- L'autoscaler Google Kubernetes Engine (GKE) ajuste dynamiquement les ressources de votre cluster en fonction des besoins de votre application. Il propose des outils qui peuvent optimiser l'utilisation des ressources, garantir les performances des applications et simplifier la gestion des clusters.
- Cloud Run propose une fonctionnalité d'autoscaling intégrée qui ajuste automatiquement le nombre d'instances en fonction du trafic entrant.
Avant votre événement, nous vous recommandons d'augmenter manuellement la capacité. Même si vous avez configuré l'autoscaling, il est possible qu'il ne puisse pas répondre à la demande en raison de la vitesse du trafic d'événements. Préchauffez donc les ressources à l'avance, y compris les éléments suivants:
- Machines virtuelles
- Mise en cache si vous souhaitez précharger
- Composants sans serveur pour éviter les démarrages à froid
Examiner les recommandations Active Assist
Active Assist fait référence au portefeuille d'outils utilisé dansGoogle Cloud pour générer des recommandations et des insights afin de vous aider à optimiser vos projets Google Cloud . Pour en savoir plus, consultez la section Qu'est-ce qu'Active Assist ?
Vérifier les versions de vos produits
Assurez-vous que tous vos produits et services cloud sont à jour avec la dernière version stable.
Examiner les alertes et les tableaux de bord
Identifiez et corrigez de manière proactive les problèmes en évaluant les alertes et les tableaux de bord qui vous sont fournis via les outils d'observabilité Google Cloud et les solutions tierces.
Consultez vos métriques, journaux et traces Google Cloud Observability pour obtenir des insights sur l'utilisation des ressources, les caractéristiques de performances et l'état global de vos ressources. Surveillez les métriques importantes qui correspondent aux indicateurs de l'état du système, tels que l'utilisation du processeur, l'utilisation de la mémoire, le trafic réseau, les E/S de disque et les temps de réponse des applications. Vous devez également tenir compte des métriques spécifiques à votre entreprise. En suivant ces métriques, vous pouvez identifier les goulots d'étranglement potentiels, les problèmes de performances et les contraintes de ressources. Vous pouvez également configurer des alertes pour informer de manière proactive les équipes concernées des problèmes ou anomalies potentiels.
Pour les alertes, concentrez-vous sur les métriques critiques, définissez des seuils appropriés pour réduire la fatigue liée aux alertes et assurez-vous de répondre rapidement aux problèmes importants. Cette approche ciblée vous permet de maintenir de manière proactive la fiabilité de la charge de travail. Pour en savoir plus, consultez la présentation des alertes.