Eseguire l'integrazione con Personalized Service Health

Sebbene le interruzioni del servizio siano inevitabili, una comunicazione trasparente e tempestiva è essenziale per valutare cosa sta succedendo, tenere informati gli stakeholder ed eseguire azioni per ridurre al minimo l'impatto sulla tua attività.

Il funzionamento di un'applicazione cloud affidabile è una responsabilità condivisa tra Google Cloud e gli sviluppatori di applicazioni. Quando si verifica un'interruzione del servizio, Google Cloud mira a comunicare rapidamente l'incidente e a fornire una valutazione dell'impatto. Devi valutare come ricevere le notifiche, intervenire sugli incidenti emergenti e gestire l'impatto sull'applicazione.

Personalized Service Health può aiutarti in questa procedura. Puoi integrarlo in vari modi per conoscere gli incidenti emergenti, valutare l'impatto sulle tue applicazioni e ricevere aggiornamenti da Google Cloud. Questo documento fornisce una panoramica su come ricevere indicatori di interruzioni del servizio da Google Cloud, inclusi consigli sull'integrazione.

Decidi dove eseguire l'integrazione

Personalized Service Health fornisce una visualizzazione personalizzata dei Google Cloud prodotti utilizzati dai tuoi progetti o dalla tua organizzazione. Ti consigliamo di eseguire l'integrazione con Personalized Service Health per ottenere la massima copertura e gamma di opzioni di integrazione.

Punto di integrazione Caso d'uso Vantaggi Dipendenze
Dashboard della console (Personalized Service Health) Visualizza interruzioni attive Personalizzati per i tuoi progetti, disponibili per impostazione predefinita Identity and Access Management (IAM)
Google Cloud console
Avvisi (Personalized Service Health) Notifiche proattive Personalizzato per i tuoi progetti, pratico e proattivo IAM
Cloud Logging
Cloud Monitoring
API (Service Health personalizzato) Integrare un altro sistema o strumento Personalizzato per i tuoi progetti o la tua organizzazione IAM

Scegliere il metodo di interazione con Personalized Service Health

Devi considerare Personalized Service Health nel contesto delle operazioni, del monitoraggio e del modello di risposta agli incidenti previsti. Valutando il modo in cui i tuoi team utilizzano gli indicatori durante e prima degli incidenti, puoi decidere come utilizzare Personalized Service Health.

La seguente tabella mostra come potresti interagire con lo stato del servizio personalizzato, a seconda della sua configurazione.

Scenario di esempio nella tua organizzazione Integrazione con Personalized Service Health Esempi di strumenti con cui potresti eseguire l'integrazione
Sviluppatori che sono di turno per alcune applicazioni Avvisi sui singoli progetti

Dashboard della console

Google Cloud Observability, PagerDuty
Risposta centralizzata agli incidenti in un'organizzazione Integrazione API con il sistema esistente utilizzando l'API OrganizationEvents (v1, v1beta) PagerDuty, dashboard personalizzate
Piattaforma interna per gestire risorse e operazioni cloud API Service Health
Avvisi per singoli progetti
Integrazione dell'API Service Health con una piattaforma di sviluppo interna
Backstage, Terraform
Molti progetti configurati e gestiti a livello di programmazione (ad esempio più di 1000) API Service Health
Notifiche automatizzate basate su API
Backstage, Terraform, PagerDuty

Utilizzare Personalized Service Health durante un incidente

Una volta eseguita l'integrazione con Personalized Service Health e iniziate a ricevere notifiche di avviso, Personalized Service Health fornisce informazioni sulle interruzioni che possono aiutarti a gestirne l'impatto. Google Cloud

Rileva e definisci l'ambito dell'incidente

Le domande che potresti porre in questa fase includono:

  • È un problema reale?
  • Puoi convalidare l'impatto?
  • Quali sono i sintomi?
  • Quali utenti, prodotti o parti dell'attività sono interessati? Quali aree geografiche?

Personalized Service Health ti aiuta a capire se il problema ha origine nel tuo progetto o in Google, in modo da poter implementare la risposta all'incidente appropriata. Ti consente di trovare e visualizzare le informazioni sugli eventi in modo da poter monitorare l'evento, i prodotti interessati e le località che interessano il tuo progetto.

Ecco alcuni passaggi che puoi seguire:

  1. Se l'hai configurato, rivedi l'avviso.
    • Che cosa ha causato l'attivazione di questo avviso?
    • In che modo questi avvisi si inseriscono in tutti gli altri avvisi potenzialmente specifici per prodotto?
  2. Accedi alla dashboard Service Health per il tuo progetto o la tua organizzazione. Puoi visualizzare a colpo d'occhio eventi, prodotti e località interessati e rispondere alle seguenti domande:
    • Quali dei tuoi progetti sono interessati?
    • Quali prodotti da cui dipende il tuo progetto sono interessati?
    • L'evento interessa risorse specifiche all'interno di queste località?
  3. Esamina gli eventi e comprendi il loro ambito, impatto e pertinenza per il tuo progetto.
  4. Identifica un evento che sembra collegato al problema che stai riscontrando.
  5. Trova i passaggi di verifica, la mitigazione (se disponibile) e il tempo di risoluzione previsto per l'evento.

Personalized Service Health ti aiuta a esaminare lo stato attuale e l'impatto degli incidenti che interessano il tuo progetto o la tua organizzazione, in modo da poterli gestire e rispondere in modo efficiente. Ad esempio, puoi dare la priorità in modo efficace identificando con precisione l'incidente con la priorità più alta.

Mitigare, risolvere o riassegnare l'incidente

Le domande che potresti porre in questa fase includono:

  • Come puoi risolvere il problema?
  • Puoi risolvere il problema direttamente?
  • Devi avviare un failover ora o aspettare ancora un po'?
  • A chi devi inviare una notifica per risolvere il problema?

Personalized Service Health ti aiuta a comprendere l'impatto di un incidente sui tuoi progetti e sulle tue risorse, a conoscere le soluzioni alternative disponibili e a ricevere aggiornamenti sul tempo di risoluzione stimato.

Monitorare l'avanzamento della risoluzione dell'incidente

La panoramica degli eventi nella dashboard Service Health identifica le informazioni chiave come sintomi e soluzioni alternative, necessarie per la mitigazione e mostra quando cambia lo stato. Questi dettagli ti consentono di:

  • Monitora un riepilogo in tempo reale del potenziale impatto man mano che la situazione si evolve.
  • Rimani aggiornato su eventuali nuovi sviluppi e sui tempi previsti per la prossima comunicazione o aggiornamento.
  • Visualizza la data di pubblicazione di un sintomo.
  • Scopri quando viene identificata una soluzione alternativa.
  • Controlla quando lo stato passa a Risolto.

Mentre monitori l'avanzamento, puoi eseguire le seguenti azioni:

  • Esamina le soluzioni alternative, se disponibili.
  • Implementa la risposta agli incidenti appropriata per il tuo progetto o organizzazione.
  • Continua a monitorare l'evento finché non viene mitigato o risolto.

Quando contattare l'assistenza

Google è a conoscenza degli eventi visualizzati nella dashboard di Service Health. Per sapere cosa sta facendo Google in merito a un evento, selezionalo per visualizzarne i dettagli.

Se un problema non sembra essere rappresentato in nessuno degli eventi nella dashboard, contatta l'assistenza.

Utilizzare Personalized Service Health con altre fonti di informazioni sugli incidenti

Indipendentemente dalla configurazione della tua azienda, utilizza Personalized Service Health come indicatore aggiuntivo quando valuti l'impatto degli incidenti. Assicurati di poter esaminare più fonti di informazioni sugli incidenti per poter decidere i passaggi successivi in base a dati e prove.

I motivi per utilizzare più fonti di informazioni sugli incidenti includono:

  • Un prodotto Google Cloud potrebbe essere interessato da un incidente in una determinata località, ma i tuoi progetti potrebbero non essere interessati perché si trovano in un'altra località.
  • Se il tuo sistema di pubblicazione ha due repliche complete in zone separate e un prodotto Google Cloud critico in una zona non funziona, Personalized Service Health ti informerà dell'errore. Tuttavia, i tuoi utenti potrebbero non essere effettivamente interessati e potresti non dover intervenire immediatamente.
  • Se il tuo progetto dipende da molti Google Cloud prodotti all'interno di una località, Personalized Service Health non saprà:
    • Se il tuo progetto richiede che tutti i prodotti siano funzionanti.
    • Se il tuo progetto continuerà a funzionare in caso di errore di un prodotto.
    • Se l'intera applicazione è interessata se uno o più prodotti non funzionano.
  • Anche Personalized Service Health può essere degradato o subire errori. Per verificare, puoi controllarne lo stato.

Dovrai interpretare gli indicatori di Personalized Service Health in modo appropriato per la tua configurazione.