Lorsque vous gérez des événements de pic d'activité ou de trafic élevé dans le cloud, trois phases clés sont nécessaires:
- Préparation: effectuez les activités et les tâches nécessaires à la préparation de votre événement, y compris un examen de l'architecture, une planification de la capacité et la création de réservations.
- Exécution: lorsque votre événement commence, surveillez-le de près et réagissez en conséquence.
- Analyse: une fois votre événement terminé, analysez ce qui s'est bien passé, ce qui ne l'a pas été et comment améliorer vos futurs événements.
Vous devez comprendre et suivre certaines bonnes pratiques au cours de ces phases afin de pouvoir fournir vos services avec un temps d'arrêt minimal ou nul, et sans dégradation des performances ni de l'expérience utilisateur pendant votre événement.
Préparation: détaillez votre processus de planification d'événement
Pendant la phase de préparation d'un pic de capacité, vous devez contacter votre équipe de compte ou votre TAM pour vous aider à examiner votre architecture, à créer des diagrammes, des calendriers et des checklists de lancement, à vérifier les quotas de service en fonction de votre profil de trafic prévu et à déterminer l'impact global sur vos projets.
La planification doit commencer bien avant la date de votre événement. Dans certains cas, il peut être nécessaire de commencer à planifier des mois à l'avance lorsque votre service est encore en cours de développement. Constituez une équipe qui pourra vous aider à examiner le workflow d'événement proposé, l'audience attendue, vos exigences et critères de réussite, ainsi que la chaîne de diffusion multimédia de bout en bout. La phase de préparation doit inclure des évaluations des risques, une planification de l'atténuation et un examen de la préparation opérationnelle pour vous assurer que votre workflow est bien conçu.
Pour en savoir plus, consultez le Google Cloud framework d'architecture, qui fournit des recommandations pour aider les architectes, développeurs, administrateurs et autres professionnels du cloud à concevoir et exploiter une topologie cloud sécurisée, efficace, résiliente, performante et rentable.
Exécution: surveillance et réaction pendant l'exécution
Lorsque votre saison de pointe ou votre événement de lancement commence, vous devez surveiller de près l'activité et réagir si nécessaire. Une fois que vous avez configuré la surveillance, les alertes et la journalisation lors de la phase de préparation, vous pouvez surveiller le trafic, les journaux et les niveaux de quota critiques pour l'entreprise. Vous pouvez ensuite utiliser ces informations pour déterminer les causes premières et résoudre rapidement les problèmes. Pour en savoir plus, consultez la section Consulter les alertes et les tableaux de bord.
En cas de problème, un processus de gestion et d'escalade des incidents bien défini est essentiel pour réduire les efforts et le temps nécessaires pour résoudre le problème. Si ce n'est pas déjà fait, établissez un processus de gestion des incidents. Pour en savoir plus, consultez la section Préparer la résolution des problèmes lors de votre événement.
Analyse: examiner et documenter votre analyse
Une fois la saison de pointe ou l'événement de lancement terminés, examinez et analysez l'événement, puis documentez les enseignements tirés afin de pouvoir les appliquer à votre prochain événement majeur.
Concentrez-vous sur les domaines suivants:
Récapitulatif de la chronologie: indiquez quand votre trafic a commencé à augmenter et les événements clés (pics) pendant la période de l'événement. Indiquez quand, le cas échéant, des problèmes sont survenus.
Analyse des causes fondamentales: examinez les problèmes survenus. Y a-t-il quelque chose que vous ou Google Cloud auriez pu faire différemment ? Est-ce quelque chose que vous pourriez envisager pour la prochaine fois ? Documentez les enseignements tirés et les mesures nécessaires pour améliorer les choses à l'avenir.
Comparer les prédictions aux résultats réels: analysez vos prédictions de trafic par rapport au trafic réel que vous avez enregistré. Où des ressources supplémentaires étaient-elles nécessaires ? Où les ressources étaient-elles sous-utilisées ou inutiles ?
Rétrospective: partagez et examinez les informations précédentes avec les principales personnes concernées. Promuvez une culture sans blâme, dans laquelle vous partez du principe que toutes les personnes impliquées avaient de bonnes intentions et que vous vous concentrez sur l'identification des causes contribuant au problème, sans désigner d'individu ni d'équipe.