Puoi creare criteri di avviso in base agli obiettivi del livello del servizio (SLO) per sapere se corri il rischio di violare un SLO. Seleziona l'SLO che vuoi monitorare, quindi configura un criterio di avviso per monitorare l'SLO. La condizione viene in genere espressa selezionando un valore di soglia che costituisce una violazione e un periodo per il quale la violazione è consentita. Se la soglia viene superata per un periodo superiore a quello consentito, viene attivata la norma di avviso.
Questa pagina descrive gli avvisi sulla velocità di consumo del budget di errore. Non tratta in dettaglio i criteri di avviso; presuppone che tu conosca già i concetti di base di condizioni e canali di notifica.
Per informazioni generali sui criteri di avviso e su come crearli, consulta Utilizzo dei criteri di avviso.
Per i passaggi specifici per la creazione di una policy di avviso basata su SLO, vedi quanto segue:
- Creazione di una policy di avviso utilizzando la console Google Cloud .
- Creazione di una policy di avviso utilizzando l'API Cloud Monitoring.
Burn rate del budget di errore
Il budget di errore per un periodo di conformità è (1 − obiettivo SLO) × (eventi idonei nel periodo di conformità). Se il tuo obiettivo SLO è del 95%, è accettabile che il 5% degli eventi misurati dal tuo SLI non vada a buon fine prima che l'obiettivo SLO venga mancato.
Il burn rate indica la velocità con cui consumi il budget di errore per un periodo di conformità. Il tasso di consumo dipende dal numero di eventi idonei e dal numero di eventi di errore ricevuti nel periodo di conformità. Ad esempio, se non si verificano eventi di errore, il budget di errore non viene utilizzato e il tasso di consumo è pari a zero. Per un esempio che illustra come calcolare il tempo di inattività massimo per un servizio, vedi Avviso sul burn rate.
La metrica del tasso di consumo è normalizzata in modo che un tasso di consumo superiore a uno indichi che se il tasso di errore misurato viene mantenuto in qualsiasi periodo di conformità futuro, il servizio non rientrerà nello SLO per quel periodo. Per saperne di più, vedi Budget di errore.
La metrica del tasso di consumo viene recuperata dal selettore delle serie temporali
select_slo_burn_rate
. Un criterio di avviso sul burn rate ti avvisa quando il budget di errore viene consumato più rapidamente di una soglia che definisci, misurata nel periodo di conformità dell'avviso. Esistono altri selettori di serie temporali. Per saperne di più, consulta la sezione Recupero dei dati SLO.
Puoi creare criteri di avviso che utilizzano alcuni di questi altri selettori di serie temporali, ma devi crearli utilizzando l'API Cloud Monitoring.
Panoramica della creazione di un criterio di avviso su uno SLO
La creazione di un criterio di avviso per uno SLO è simile alla creazione di un criterio di avviso per le metriche. Questa sezione esamina i passaggi generali per creare unacriterio di avvisoo.
Per creare un criterio di avviso per uno SLO, segui questi passaggi:
Identifica lo SLO su cui vuoi basare il criterio di avviso.
Crea una condizione per il criterio di avviso che utilizzi lo SLO scelto. Nella condizione, specifica un selettore di serie temporali da utilizzare per recuperare i dati SLO. Specifichi anche una durata, una soglia e un confronto che determinano quando lo SLO non è conforme.
Ad esempio, se utilizzi il selettore delle serie temporali per il burn rate, i dati recuperati riflettono il burn rate del budget di errore per lo SLO scelto.
La condizione è anche il punto in cui specifichi la soglia e la durata delle violazioni dello SLO prima di attivare un avviso. Ad esempio, vuoi che il burn rate superi di un determinato importo il tasso desiderato per un certo periodo prima di attivare un avviso. Il valore di "un importo superiore" è la soglia della condizione, mentre il valore di "un periodo" è la durata della condizione.
Identifica o crea un canale di notifica da utilizzare nel criterio di avviso.
Fornisci una documentazione che spieghi agli utenti cosa ha attivato il criterio di avviso.
Per informazioni generali sui criteri di avviso e su come crearli, consulta Utilizzo dei criteri di avviso.
Criteri di avviso e periodi di analisi
Quando recuperi i dati SLO per un criterio di avviso, specifichi un identificatore per lo SLO e un periodo di analisi retrospettiva. Il periodo di riferimento determina quanto indietro nel tempo è possibile recuperare i dati. È fondamentale sottolineare che il periodo di osservazione viene utilizzato anche come periodo di conformità per calcolare il rendimento e il budget di errore dell'SLO.
Al momento non è possibile basare gli avvisi sul tasso di consumo del budget di errore di uno SLO utilizzando un periodo di conformità superiore a 24 ore. In molti casi, approssimare il periodo di conformità a lungo termine (ad esempio 28 o 30 giorni) con uno inferiore a 24 ore è sufficiente ai fini del rilevamento delle interruzioni e della risposta operativa a breve termine.
Periodi di conformità più brevi consentono di rilevare i problemi più rapidamente; tuttavia, tieni presente che variazioni importanti del traffico e dei tassi di errore nel corso di una giornata potrebbero causare un'attivazione eccessivamente sensibile degli avvisi durante i periodi di traffico ridotto. Valuta la possibilità di utilizzare una soglia di burn rate significativamente superiore a 1 per ridurre la sensibilità degli avvisi in questi periodi.
Tipi di avvisi relativi al budget di errore
Quando configuri i criteri di avviso per monitorare il budget di errore, è una buona idea configurare due criteri di avviso correlati:
Avviso Fast-burn, che ti avvisa di una variazione improvvisa e significativa del consumo che, se non corretta, esaurirà il budget di errore molto presto. "A questo ritmo, esauriremo l'intero budget di errore del mese in due giorni!"
Per un avviso fast-burn, utilizza un periodo di ricerca più breve in modo da ricevere una notifica rapida se è emersa e persiste una condizione potenzialmente disastrosa, anche se per breve tempo. Se è davvero disastroso, non vuoi aspettare a lungo per accorgertene.
La soglia per il tasso di consumo per cui viene generato un avviso è molto più alta rispetto alla base ideale per il periodo di ricerca.
Avviso Slow-burn, che ti avvisa se viene rilevato un tasso di consumo che, in assenza di modifiche, esaurirà il budget di errore prima della fine del periodo di conformità. Questo tipo di condizione è meno urgente di una condizione fast-burn. "Stiamo superando leggermente il punto in cui vorremmo trovarci in questo momento del mese, ma non siamo ancora in grossi guai".
Per un avviso di tipo slow-burn, utilizza un periodo di ricerca più lungo per attenuare le variazioni del consumo a breve termine.
La soglia per cui viene generato un avviso di esaurimento lento è superiore al rendimento ideale per il periodo di analisi, ma non in modo significativo. Una policy basata su un periodo di analisi più breve con una soglia elevata potrebbe generare troppi avvisi, anche se i livelli di consumo a lungo termine si stabilizzano. Tuttavia, se il consumo rimane anche leggermente troppo alto per un periodo più lungo, alla fine esaurisce tutto il budget di errore.
Passaggi successivi
- Per creare una criterio di avviso basata su SLO utilizzando la console Google Cloud , consulta Creazione di una criterio di avviso (consoleGoogle Cloud ).
- Per creare una criterio di avviso basata su SLO utilizzando l'API Monitoring, consulta Creazione di una criterio di avviso (API).