Ce guide explique comment vous préparer aux pics de capacité et au trafic élevé afin de pouvoir fournir vos services avec un temps d'arrêt minimal, voire nul, et sans dégradation des performances ni de l'expérience utilisateur.
La gestion des événements dans le cloud comporte trois phases clés:
- Préparation: effectuez les activités et les tâches nécessaires à la préparation de votre événement, y compris un examen de l'architecture, une planification de la capacité et la création de réservations.
- Exécution: lorsque votre événement commence, surveillez-le attentivement et réagissez en conséquence.
- Analyse: une fois votre événement terminé, analysez ce qui s'est bien passé, ce qui ne l'a pas été et comment améliorer vos futurs événements.
Ce guide se concentre sur la phase de préparation.
Checklist
Pour vous préparer à un pic de capacité, effectuez les tâches suivantes:
Pour obtenir des instructions détaillées sur cette tâche directement dans la console Google Cloud, cliquez sur Visite guidée :
Avant de commencer
Selon la formule d'assistance Customer Care que vous avez souscrite, assurez-vous de bien comprendre les services de préparation à des événements disponibles:
Assistance améliorée: vous pouvez optimiser la préparation de vos événements, lancements et migrations à l'aide de l'assistance aux événements planifiés, un service à valeur ajoutée qui couvre les phases critiques des événements numériques à fort trafic à court terme, comme les inaugurations, les lancements de nouveaux produits ou les migrations de données.
Assistance Premium: vous pouvez utiliser le service de gestion des événements pour les événements de pic d'activité planifiés, comme un lancement de produit ou un événement commercial majeur. Grâce à ce service, Customer Care s'associe à vous pour créer un plan, vous conseiller tout au long de l'événement et vous aider à:
- Préparer vos systèmes aux temps clés et aux charges de travail lourdes
- L'exécution de tests de sinistre pour résoudre de manière proactive les problèmes potentiels
- Développer et mettre en œuvre une solution plus rapide pour résoudre l'impact de tout problème pouvant survenir
Après l'événement, votre responsable de compte technique (TAM) vous aide à examiner les résultats et à formuler des recommandations pour les événements futurs. Pour commencer ou en savoir plus, contactez votre TAM.
Prendre connaissance des bonnes pratiques de gestion des événements
Vous devez comprendre et suivre certaines bonnes pratiques de gestion des événements :
Détailler votre processus de planification d'événements : pendant la phase de préparation à un pic de capacité, vous devez contacter l'équipe chargée de votre compte ou votre TAM afin qu'ils vous aident à examiner votre architecture, à créer des diagrammes, à élaborer des calendriers et des checklists de lancement, à vérifier les quotas de service en fonction du profil de trafic prévu et à évaluer l'impact global sur vos projets.
Surveiller et réagir lors de l'exécution : lorsque votre pic d'activité ou votre événement de lancement commence, vous devez surveiller attentivement l'activité et réagir en conséquence. En cas de problème, il est essentiel de disposer d'un processus de gestion des incidents et d'escalade bien défini afin de réduire les efforts et le temps nécessaires pour l'identifier et le résoudre.
Examiner et documenter votre analyse : une fois le pic d'activité ou l'événement de lancement terminé, examinez et analysez l'événement, puis documentez les enseignements tirés afin de pouvoir les appliquer à votre prochain événement majeur.
Pour en savoir plus, consultez Bonnes pratiques de gestion des événements.
Demander et obtenir la capacité appropriée pour votre événement
La planification des capacités est un élément essentiel de la phase de préparation. Elle vous permet de déterminer la quantité de ressources cloud nécessaire pour que vos charges de travail disposent de tout ce dont elles ont besoin pour fonctionner efficacement. Lorsque vous vous préparez aux pics de trafic ou aux pics d'activité, assurez-vous que vos quotas correspondent à vos besoins en ressources afin d'éviter les pannes inattendues. Pour en savoir plus, consultez la section Assurer la capacité de votre événement.
Utiliser le planificateur de capacité
Le planificateur de capacité vous permet d'afficher l'utilisation historique et prévue de vos instances de machines virtuelles (VM), de vos volumes Persistent Disk et de vos GPU. Vous pouvez également consulter les réservations, réserver des ressources à l'avance, gérer les limites de quota de votre projet et configurer des demandes d'augmentation automatique des quotas. Pour en savoir plus, consultez Afficher les données d'utilisation et de prévision dans le planificateur de capacité.
Dans la console Google Cloud, accédez à la page Planificateur de capacité.
Utilisez le sélecteur de ressources dans la barre d'outils de la console pour sélectionner un projet, un dossier ou une organisation.
Sélectionnez le type de ressource Compute Engine pour lequel vous souhaitez afficher les données d'utilisation :
Pour afficher les données d'utilisation de vos VM, cliquez sur l'onglet Machine virtuelle s'il n'est pas déjà sélectionné.
Pour afficher les données d'utilisation de vos volumes de disques persistants, cliquez sur l'onglet Disque.
Pour afficher les données d'utilisation de vos GPU, cliquez sur l'onglet GPU.
Vous pouvez filtrer les éléments pour afficher différentes visualisations des données d'utilisation et de prévision de la ressource.
Activer l'outil d'ajustement de quota
L'outil d'ajustement des quotas surveille votre consommation de ressources et envoie de manière proactive des demandes d'ajustement de quota en votre nom pour que vous n'ayez pas à effectuer de demandes manuelles. Pour en savoir plus, consultez Fonctionnement de l'outil d'ajustement de quota.
Dans la console Google Cloud, accédez à la page IAM et administration > Quotas et limites du système.
Cliquez sur l'onglet Configurations.
Pour activer l'outil d'ajustement de quota, cliquez sur le bouton Activer.
Lorsque la colonne État indique Activé, l'outil d'ajustement de quota surveille votre utilisation et envoie des demandes d'ajustement de quota lorsque l'utilisation de la ressource approche de sa valeur de quota.
Demander un ajustement de quota
Si vos quotas ne sont pas suffisants, vous pouvez demander un ajustement de quota. Pour en savoir plus, consultez la page Afficher et gérer les quotas.
Dans la console Google Cloud, accédez à la page IAM et administration > Quotas et limites du système.
Cochez la case à côté du quota que vous souhaitez modifier.
Si vous le souhaitez, vous pouvez rechercher un quota à l'aide de l'option
Filtre.Cliquez sur
Modifier. Le volet Modifications de quotas s'affiche.Dans le champ Nouvelle valeur, saisissez la valeur de quota souhaitée. Certaines valeurs de quota sont associées à une unité de mesure. Le cas échéant, sélectionnez l'unité souhaitée dans la liste adjacente.
Si un message indique que vous allez supprimer le quota de remplacement en demandant un quota supérieur à celui-ci, cochez la case pour continuer, puis sélectionnez Demander un quota supérieur.
Dans le champ Description de la requête, saisissez une description, puis cliquez sur OK.
Cliquez sur Suivant et indiquez vos coordonnées.
Cliquez sur Envoyer la requête.
Si votre demande est refusée, vous pouvez essayer de demander une augmentation de quota en créant une demande d'assistance ou en contactant votre équipe de gestion de compte ou votre TAM.
Créer une réservation
Les réservations vous permettent de vous assurer que les ressources Compute Engine sont disponibles pour créer des VM avec le même matériel (mémoire et processeurs virtuels) et les mêmes ressources facultatives (GPU et disques SSD locaux) chaque fois que vous en avez besoin.
Une réservation à la demande est provisionnée au moment de votre requête, si la capacité demandée est disponible. Une réservation future vous permet de demander de la capacité à l'avance. Nous vous recommandons de réserver vos futurs événements bien à l'avance. Pour en savoir plus, consultez la section Réservations de ressources zonales Compute Engine.
Créer une réservation à la demande pour un seul projet
Dans la console Google Cloud, accédez à la page Réservations.
Dans l'onglet Réservations à la demande (par défaut), cliquez sur
Créer une réservation.La page Créer une réservation s'affiche.
Saisissez un nom pour votre réservation.
Sélectionnez la région et la zone dans lesquelles vous souhaitez réserver des ressources.
Dans le champ Type de partage, sélectionnez Local si cette option n'est pas déjà sélectionnée.
Pour permettre à une réservation de VM GPU d'être utilisée par des tâches d'entraînement personnalisées ou des tâches de prédiction Vertex AI, sélectionnez Partager la réservation dans la section Services Google Cloud.
Sélectionnez une option dans le champ Utiliser avec une instance de VM :
Pour autoriser les VM correspondantes à utiliser automatiquement cette réservation, sélectionnez l'option Utiliser automatiquement une réservation si elle n'est pas déjà sélectionnée.
Pour n'utiliser les ressources de cette réservation que lors de la création de VM correspondantes qui ciblent spécifiquement cette réservation par son nom, cliquez sur Sélectionner une réservation spécifique.
Saisissez le nombre d'instances de VM que vous souhaitez réserver.
Dans la section Configuration de la machine, procédez comme suit :
Pour spécifier les propriétés de vos VM à partir d'un modèle d'instance existant, sélectionnez Utiliser un modèle d'instance.
Spécifiez un modèle d'instance. Si vous sélectionnez un modèle régional, vous ne pouvez réserver que des ressources dans cette région.
Pour supprimer automatiquement la réservation à une heure spécifiée, cochez la case Activer la suppression automatique. La suppression automatique des réservations peut vous permettre d'éviter des frais inutiles lorsque vous arrêtez de consommer la réservation.
Pour créer la réservation, cliquez sur Créer.
La page Réservations s'affiche. La création de la réservation peut prendre jusqu'à une minute.
Créer une réservation future à projet unique
Dans la console Google Cloud, accédez à la page Réservations.
Cliquez sur l'onglet Réservations futures.
Cliquez sur
Créer une réservation future.La page Créer une réservation future s'ouvre.
Dans le champ Nom, saisissez le nom de la requête de réservation future.
Dans le champ Préfixe, saisissez un préfixe de nom. Le nom de chaque réservation créée automatiquement à partir de cette requête de réservation commence par ce préfixe.
Pour les champs Région et Zone, sélectionnez la région et la zone dans lesquelles vous souhaitez réserver des ressources.
Dans Heure de début, saisissez une heure de début pour la période de réservation. L'heure de début ne peut pas être ultérieure d'un an à la date et heure à laquelle vous envoyez une requête de réservation future pour examen. Pour disposer d'un temps suffisant pour potentiellement modifier, annuler ou supprimer la réservation future avant qu'elle ne bascule dans le délai de verrouillage, spécifiez une valeur recommandée pour l'heure de début.
Dans Heure de fin, saisissez une heure de fin pour la période de réservation d'au moins 14 jours. Dans la section Résumé de la durée, vous pouvez voir la durée de la période de réservation. Pour augmenter la probabilité que Google Cloudapprouve votre demande de réservation future après l'avoir envoyée pour examen, veillez à spécifier une valeur recommandée pour la période de réservation.
Dans la section Type de partage, sélectionnez Local si ce n'est pas déjà fait.
Dans Capacité totale nécessaire, saisissez le nombre total de VM que vous souhaitez réserver pour la période, la configuration de VM et les projets spécifiés dans cette requête de réservation future.
Dans la section Configuration de la machine, procédez comme suit :
Sélectionnez Utiliser un modèle d'instance.
Dans Modèle d'instance, sélectionnez le modèle d'instance de votre choix. Si vous sélectionnez un modèle d'instance régional, vous ne pouvez réserver que des ressources situées dans la même région que celle du modèle.
Dans la section Suppression automatique des réservations générées automatiquement, effectuez l'une des opérations suivantes:
Pour permettre à Compute Engine de supprimer automatiquement les réservations créées automatiquement pour votre requête de réservation future, procédez comme suit :
Cliquez sur le bouton Activer la suppression automatique pour définir l'activation, si ce n'est pas déjà fait.
Facultatif : Pour l'Heure de suppression automatique, saisissez une date et une heure à laquelle supprimer les réservations créées automatiquement. La date et l'heure doivent être postérieures à l'heure de fin de la période de réservation. Si vous laissez ce champ vide, les réservations créées automatiquement sont supprimées dans les deux heures suivant l'heure de fin de la période de réservation.
Sinon, cliquez sur le bouton Activer la suppression automatique pour le désactiver.
Pour terminer la création du brouillon de requête de réservation future, cliquez sur Enregistrer un brouillon.
La page Réservations s'affiche. La création de la requête de réservation future peut prendre jusqu'à une minute.
Se préparer à résoudre rapidement les problèmes pendant votre événement
La manière dont vous traitez, classez et résolvez les incidents de différents niveaux de gravité peut avoir une incidence significative sur vos opérations lors d'un événement. Veillez à utiliser un système de gestion des incidents centralisé pour un suivi efficace tout au long du cycle de vie des incidents.
En plus d'examiner vos contacts et d'activer Personalized Service Health, vous devez effectuer les opérations suivantes :
- Consulter les bonnes pratiques concernant l'utilisation de Customer Care
- Créer un plan de communication
- Assurer l'accès
Pour en savoir plus, consultez Se préparer à résoudre des problèmes pendant votre événement.
Examiner vos contacts
De nombreuses Google Cloud offres envoient des notifications pour partager des informations importantes avec les Google Cloud utilisateurs. Par défaut, ces notifications sont envoyées aux membres disposant de certains rôles IAM (Identity and Access Management). Avec les contacts essentiels, vous pouvez personnaliser les contacts qui reçoivent des notifications en fournissant votre propre liste de contacts. Pour en savoir plus, consultez Gérer les contacts pour les notifications.
Dans la console Google Cloud, accédez à la page IAM et administration > Contacts essentiels.
Assurez-vous que le nom de votre projet, dossier ou organisation apparaît dans le sélecteur de ressources de la barre d'outils de la console. Le sélecteur de ressources vous indique pour quel projet, dossier ou organisation vous gérez les contacts.
Pour répertorier les contacts par catégorie, sélectionnez Catégorie. Pour répertorier les contacts par ordre alphabétique, sélectionnez Contacts.
Activer Personalized Service Health
Personalized Service Health vous permet d'identifier les interruptions de service Google Cloud pertinentes pour vos projets afin de les gérer et d'y répondre efficacement. Pour en savoir plus, consultez la présentation de Personalized Service Health.
Assurez-vous d'avoir activé l'API Service Health avant votre événement, et vérifiez que votre organisation peut accéder au tableau de bord et configurer des alertes. Pour en savoir plus, consultez la section Gérer l'accès à Personalized Service Health.
- Dans la console Google Cloud, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.
-
Enable the Service Health API.
Gérer et optimiser vos ressources cloud
Gérez et optimisez les ressources utilisées par vos charges de travail Google Cloud. Cela implique de dimensionner les ressources de manière appropriée en fonction de l'utilisation réelle et de la demande, d'utiliser l'autoscaling pour l'allocation dynamique des ressources et d'examiner les recommandations d'architecture et de sécurité.
En plus d'examiner les recommandations Active Assist, vous devez effectuer les opérations suivantes :
- Prendre connaissance des bonnes pratiques Google Cloud
- Examiner l'évolutivité
- Examiner les versions de vos produits
- Examiner les alertes et les tableaux de bord
Pour en savoir plus, consultez Optimiser vos ressources cloud.
Examiner les recommandations Active Assist
Active Assist fait référence au portefeuille d'outils utilisé dansGoogle Cloud pour générer des recommandations et des insights afin de vous aider à optimiser vos projets Google Cloud . Pour en savoir plus, consultez la présentation d'Active Assist.
Dans la console Google Cloud, accédez au hub de recommandations.
Utilisez le sélecteur de ressources dans la barre d'outils de la console pour sélectionner unGoogle Cloud projet, un dossier ou une organisation.
Vous ne pouvez voir les recommandations au niveau d'une organisation ou d'un dossier que si vous disposez d'autorisations pour cette organisation ou ce dossier, quelles que soient les autorisations dont vous disposez pour les dossiers ou les projets qu'il contient.
Dans le volet de navigation, cliquez sur Toutes les recommandations.
Les recommandations que vous pouvez filtrer, trier et partager s'affichent. Vous pouvez explorer les recommandations en détail, voir quelles ressources sont affectées et l'impact que peut avoir une recommandation.
Pour en savoir plus sur une recommandation, cliquez sur une recommandation dans la colonne Recommandation.
Des données pertinentes qui peuvent vous aider à décider si vous souhaitez appliquer ou ignorer la recommandation s'affichent.
Si vous y êtes autorisé, vous pouvez appliquer ou ignorer une recommandation en cliquant sur le bouton correspondant.
Notez que certaines recommandations peuvent ne pas être directement applicables. Suivez les instructions détaillées dans la console pour les appliquer.
Programmer et effectuer des tests de charge
Les tests de charge permettent de déterminer si votre système peut évoluer lors de l'utilisation en production et d'identifier les goulots d'étranglement qui l'empêchent de s'ajuster.
Trois à cinq mois avant votre événement, vous devez effectuer des tests de charge sur les projets et les charges de travail critiques pour simuler des pics de trafic.
Examinez les implications des tests de charge en termes de quota et de coût, et envisagez de créer des alertes budgétaires Cloud Billing qui surveilleront les dépenses des services que vous allez solliciter le plus.
Après chaque test, évaluez les résultats, visualisez vos données d'utilisation et de prévision à l'aide du planificateur de capacité, et demandez des augmentations de quota si nécessaire. Dans ce document, consultez les sections Utiliser Capacity Planner et Demander un ajustement de quota.
Si vous avez besoin d'aide, contactez l'équipe chargée de votre compte ou votre TAM. Ils peuvent vous aider à capturer et à planifier les modifications de l'architecture afin d'améliorer la fiabilité et la disponibilité globales de vos services.
Programmer et effectuer des tests de reprise après sinistre
Si vous disposez d'une stratégie de reprise après sinistre (DR) robuste et éprouvée, vous pouvez minimiser l'impact des perturbations, réduire les délais de récupération et reprendre plus rapidement les opérations essentielles en cas de problème.
Votre stratégie de reprise après sinistre doit inclure des exigences détaillées concernant les mesures d'urgence, les opérations de sauvegarde et les procédures de reprise.
Un à trois mois avant l'événement, veillez à effectuer des simulations de scénarios de sinistres afin d'identifier les lacunes de vos plans de reprise après sinistre et de votre niveau de préparation.
Après chaque test, évaluez les résultats pour déterminer si des modifications architecturales sont nécessaires. Examinez et optimisez les ressources si nécessaire. Dans ce document, consultez la section Gérer et optimiser vos ressources cloud.
L'équipe chargée de votre compte ou votre TAM peut vous aider à effectuer des tests de reprise après sinistre, et vous expliquer comment comprendre et améliorer votre processus de réponse aux incidents. Pour en savoir plus, consultez le guide de planification de reprise après sinistre.
Récapitulatif des ressources
Le tableau suivant liste les guides auxquels il est fait référence dans ce document.
Prendre connaissance des bonnes pratiques de gestion des événements |
---|
Demander et obtenir la capacité appropriée pour votre événement |
|
Se préparer à résoudre rapidement les problèmes pendant votre événement |
Gérer et optimiser vos ressources cloud |
Programmer et effectuer des tests de charge |
Programmer et effectuer des tests de reprise après sinistre |