Quando gestisci periodi di alta stagione o eventi con traffico elevato nel cloud, esistono tre fasi chiave:
- Preparazione: completa attività e attività di preparazione per l'evento, tra cui una revisione dell'architettura, la pianificazione della capacità e la creazione di prenotazioni.
- Esecuzione: quando inizia l'evento, monitoralo attentamente e reagisci di conseguenza.
- Analisi: al termine dell'evento, analizza cosa è andato bene, cosa no e come migliorare gli eventi futuri.
Durante queste fasi, devi comprendere e seguire alcune best practice per poter offrire i tuoi servizi con tempi di inattività minimi o nulli e senza alcun peggioramento del rendimento o dell'esperienza utente durante l'evento.
Preparazione: descrivi nel dettaglio la procedura di pianificazione dell'evento
Durante la fase di preparazione per un evento di picco della capacità, devi contattare il team dell'account o il TAM per farti aiutare a esaminare l'architettura, creare diagrammi, tempistiche e liste di controllo per il lancio, controllare le quote di servizio in base al profilo di traffico previsto e determinare l'impatto complessivo sui tuoi progetti.
La pianificazione deve iniziare molto prima della data dell'evento. In alcuni casi, potrebbe essere necessario iniziare a pianificare con mesi di anticipo, mentre il servizio è ancora in fase di sviluppo. Forma un team che possa aiutarti a esaminare il flusso di lavoro dell'evento proposto, il pubblico previsto, i requisiti e i criteri di successo, nonché la catena di distribuzione dei contenuti multimediali end-to-end. La fase di preparazione deve includere valutazioni dei rischi, pianificazione delle misure di mitigazione e una revisione dell'idoneità operativa per garantire che il flusso di lavoro sia ben progettato.
Per saperne di più, consulta il Google Cloud Architecture Framework che fornisce consigli per aiutare architetti, sviluppatori, amministratori e altri professionisti del cloud a progettare e gestire una topologia cloud sicura, efficiente, resiliente, ad alte prestazioni ed economica.
Esecuzione: monitora e reagisci durante l'esecuzione
Quando inizia la stagione di punta o l'evento di lancio, dovrai monitorare attentamente l'attività e reagire di conseguenza. Dopo aver configurato il monitoraggio, gli avvisi e il logging nella fase di preparazione, puoi monitorare il traffico, i log e i livelli di quota critici per l'attività e utilizzare queste informazioni per determinare le cause principali e risolvere rapidamente i problemi. Per ulteriori informazioni, consulta Esaminare avvisi e dashboard.
In caso di problemi, un processo di gestione e riassegnazione degli incidenti ben definito è fondamentale per ridurre lo sforzo e il tempo necessari per affrontarli e risolverli. Se non l'hai ancora fatto, definisci una procedura di gestione degli incidenti. Per maggiori informazioni, consulta Prepararsi a risolvere i problemi durante l'evento.
Analisi: rivedi e documenta l'analisi
Al termine della stagione di punta o dell'evento di lancio, esamina e analizza l'evento e documenta le lezioni apprese in modo da poterle applicare al prossimo evento importante.
Concentrati sulle seguenti aree:
Recap della sequenza temporale: acquisisci il momento in cui il traffico ha iniziato ad aumentare e gli eventi chiave (picchi) durante il periodo dell'evento. Identifica se si sono verificati problemi.
Analisi delle cause principali: esamina i problemi che si sono verificati. C'è qualcosa che tu o Google Cloud avreste potuto fare diversamente? È un aspetto da tenere presente per la prossima volta? Documenta le lezioni apprese e i passaggi necessari per migliorare in futuro.
Confronta le previsioni con i dati effettivi: analizza la previsione del traffico rispetto al traffico effettivo registrato. Dove erano necessarie risorse aggiuntive? Dove le risorse sono state sottoutilizzate o non necessarie?
Retrospective: condividi ed esamina le informazioni precedenti con gli stakeholder chiave. Promuovi una cultura senza colpe, in cui assumi che tutte le persone coinvolte abbiano avuto buone intenzioni e ti concentri sull'identificazione delle cause che hanno contribuito senza indicare alcun individuo o team.