Cuando administras eventos de temporada alta o de tráfico alto en la nube, hay tres fases clave:
- Preparación: Completa actividades y tareas para prepararte para tu evento, incluida una revisión de la arquitectura, la planificación de la capacidad y la creación de reservas.
- Ejecución: Cuando comience el evento, obsérvalo de cerca y reacciona según corresponda.
- Análisis: Después de que finalice el evento, analiza lo que salió bien, lo que salió mal y cómo mejorar los eventos futuros.
Debes comprender y seguir ciertas prácticas recomendadas durante estas fases para que puedas ofrecer tus servicios con un tiempo de inactividad mínimo o sin él, y sin degradación del rendimiento ni de la experiencia del usuario durante el evento.
Preparación: detalla el proceso de planificación del evento
Durante la fase de preparación para un evento de capacidad máxima, debes interactuar con tu equipo de cuentas o tu TAM para que te ayuden a revisar tu arquitectura, crear diagramas, cronogramas y listas de tareas de lanzamiento, verificar las cuotas de servicio según tu perfil de tráfico previsto y determinar el impacto general en tus proyectos.
La planificación debe comenzar con bastante anticipación a la fecha del evento. En algunos casos, es posible que debas comenzar a planificar con meses de anticipación mientras tu servicio aún está en desarrollo. Reúne un equipo que pueda ayudarte a revisar el flujo de trabajo del evento propuesto, el público esperado, tus requisitos y criterios de éxito, y la cadena de entrega de contenido multimedia de extremo a extremo. La fase de preparación debe incluir evaluaciones de riesgos, planificación de mitigación y una revisión de preparación operativa para garantizar que tu flujo de trabajo esté bien diseñado.
Para obtener más información, consulta el framework de arquitectura, que proporciona recomendaciones para ayudar a los arquitectos, desarrolladores, administradores y otros profesionales de la nube a diseñar y operar una topología en la nube que sea segura, eficiente, resiliente, de alto rendimiento y rentable.Google Cloud
Ejecución: Supervisa y reacciona durante la ejecución
Cuando comience tu temporada alta o evento de lanzamiento, deberás supervisar con atención la actividad y reaccionar según sea necesario. Una vez que hayas configurado la supervisión, las alertas y el registro en la fase de preparación, podrás supervisar el tráfico, los registros y los niveles de cuota críticos para la empresa, y usar esta información para determinar las causas raíz y resolver los problemas rápidamente. Para obtener más información, consulta Revisa las alertas y los paneles.
Si se produce algún problema, un proceso de derivación y administración de incidentes bien definido es clave para reducir el esfuerzo y el tiempo que lleva abordar y resolver el problema. Si aún no lo hiciste, establece un proceso de administración de incidentes. Para obtener más información, consulta Prepárate para resolver problemas durante el evento.
Análisis: revisa y documenta tu análisis
Cuando finalice la temporada alta o el evento de lanzamiento, revisa y analiza el evento, y documenta las lecciones aprendidas para poder aplicarlas en tu próximo evento importante.
Enfócate en las siguientes áreas:
Resumen de la línea de tiempo: Captura cuándo comenzó a aumentar tu tráfico y los eventos clave (picos) durante el período del evento. Identifica cuándo surgieron problemas, si los hubo.
Análisis de la causa raíz: Investiga cualquier problema que haya ocurrido. ¿Hay algo que tú o Google Cloud podrían haber hecho de otra manera? ¿Es algo que deberíamos tener en cuenta para la próxima vez? Documenta las lecciones aprendidas y los pasos necesarios para mejorar en el futuro.
Comparar las predicciones con los valores reales: Analiza la predicción de tráfico en comparación con el tráfico real que registraste. ¿En qué áreas se necesitaron recursos adicionales? ¿En qué áreas los recursos se subutilizaron o no se necesitaron?
Revisión: Comparte y revisa la información anterior con las partes interesadas clave. Promueve una cultura sin culpas, en la que asumas que todas las personas involucradas tenían buenas intenciones y te enfoques en identificar las causas que contribuyeron sin señalar a ninguna persona o equipo.