Benachrichtigungs-Übersicht

Mithilfe von Benachrichtigungen können Sie sich über den Status und die Leistung Ihrer Air-Gap-Bereitstellungen auf dem Laufenden halten. Sie liefern zeitnahe Benachrichtigungen, wenn bestimmte Bedingungen erfüllt sind, sodass Sie Folgendes tun können:

  • Probleme proaktiv angehen: Probleme erkennen und darauf reagieren, bevor sie sich auf Nutzer oder Geschäftsabläufe auswirken.
  • Ausfallzeiten reduzieren: Minimieren Sie Dienstunterbrechungen, indem Sie schnell Korrekturmaßnahmen ergreifen.
  • Servicelevels aufrechterhalten: Sorgen Sie dafür, dass Ihre Anwendungen die Leistungs- und Verfügbarkeitsziele erreichen.
  • Betriebliche Statistiken erhalten: Sie können Trends und Muster in Ihrer Umgebung erkennen, um die Ressourcennutzung und Leistung zu optimieren.

Auf dieser Seite erhalten Sie einen Überblick über das Erstellen und Verwalten von Benachrichtigungen in Google Distributed Cloud (GDC) Air-Gap-Umgebungen. Sie erfahren, wie Sie Überwachungsdaten verwenden, um kritische Ereignisse in Ihren Anwendungen und Ihrer Infrastruktur proaktiv zu erkennen und darauf zu reagieren.

Arten von Benachrichtigungsrichtlinien

Messwertbasierte Benachrichtigungsrichtlinien verfolgen Überwachungsdaten und benachrichtigen bestimmte Personen, wenn eine Ressource eine vordefinierte Bedingung erfüllt. Eine Benachrichtigungsrichtlinie, die die CPU-Auslastung einer virtuellen Maschine überwacht, kann beispielsweise eine Benachrichtigung senden, wenn ein Ereignis die Richtlinie aktiviert. Alternativ kann eine Richtlinie, die eine Verfügbarkeitsdiagnose überwacht, Bereitschafts- und Entwicklungsteams benachrichtigen.

Wenn Sie wiederkehrende Ereignisse in Ihren Logs im Zeitverlauf beobachten möchten, können Sie mit logbasierten Messwerten Benachrichtigungsrichtlinien erstellen. Logbasierte Messwerte generieren numerische Daten aus Logging-Daten. Logbasierte Messwerte eignen sich für folgende Zwecke:

  • Zählen des Vorkommens einer Nachricht in Logs, beispielsweise einer Warnung oder eines Fehlers. Sie werden benachrichtigt, wenn die Anzahl der Ereignisse einen Grenzwert überschreitet.
  • Beobachten von Trends in Ihren Daten, z. B. von Latenzwerte in Ihren Logs. Sie können sich benachrichtigen lassen, wenn sich die Werte auf inakzeptable Weise ändern.
  • Erstellen von Diagrammen, um die aus Logs extrahierten numerischen Daten darzustellen.

In GDC können durch Benachrichtigungen Seiten und Tickets für kritische Fehler generiert werden. Seiten erfordern sofortige Maßnahmen von einem Kundenservicemitarbeiter, während Tickets weniger dringend sind.

Schlüsselkomponenten

Der GDC-Benachrichtigungsdienst verwendet die folgenden Komponenten:

  • Prometheus: Ein Open-Source-Monitoring-System, das häufig zum Erfassen und Speichern von Messwerten verwendet wird. Es bietet eine leistungsstarke Abfragesprache (PromQL) zum Definieren von Benachrichtigungsregeln.
  • Monitoring-Plattform: Ein verwalteter Monitoring-Dienst, der Messwerte aus verschiedenen Quellen, einschließlich Prometheus, erfasst. Sie bietet erweiterte Funktionen wie Grafana-Dashboards, benutzerdefinierte Messwerte und Benachrichtigungen.
  • Alertmanager: Eine Komponente, die für den Empfang, die Verarbeitung und das Weiterleiten von Benachrichtigungen zuständig ist. Sie unterstützt das Gruppieren, Stummschalten und Unterdrücken von Benachrichtigungen, um die Anzahl der Benachrichtigungen zu reduzieren und die Effizienz zu steigern.

Benachrichtigungsworkflow

GDC bietet ein Benachrichtigungs-Framework, das in verschiedene Monitoring-Tools und ‑Dienste eingebunden werden kann. Der typische Workflow umfasst die folgenden Phasen:

  1. Datenerhebung: Verwenden Sie Tools wie Prometheus und Fluent Bit, um Messwerte und Logs aus Ihren Anwendungen, Ihrer Infrastruktur und Kubernetes zu erfassen.
  2. Monitoring: Die erfassten Daten in Grafana-Dashboards speichern und visualisieren.
  3. Benachrichtigungsregeln: Definieren Sie Benachrichtigungsregeln basierend auf bestimmten Bedingungen, z. B. wenn die CPU-Auslastung einen Schwellenwert überschreitet oder die Anzahl der Anwendungsfehler eine bestimmte Rate überschreitet.
  4. Alertmanager: Alertmanager empfängt Benachrichtigungen, die durch die definierten Regeln ausgelöst werden, und kümmert sich um das Routing und die Stummschaltung von Benachrichtigungen.
  5. Benachrichtigungen: Sie können Benachrichtigungen über verschiedene Kanäle wie E-Mail, Nachrichten oder Webhooks erhalten.

Best Practices

Beachten Sie beim Einrichten von Benachrichtigungen die folgenden Best Practices:

  • Klare und umsetzbare Benachrichtigungen definieren: Ihre Benachrichtigungen sollten spezifische Informationen zum Problem enthalten und geeignete Maßnahmen vorschlagen.
  • Angemessene Schweregrade festlegen: Kategorisieren Sie Benachrichtigungen nach ihrer Auswirkung und Dringlichkeit, um Reaktionsmaßnahmen zu priorisieren.
  • Benachrichtigungsmüdigkeit vermeiden: Optimieren Sie Ihre Benachrichtigungsregeln, um Fehlalarme und unnötige Benachrichtigungen zu minimieren.
  • Regelmäßig Tests für Ihre Benachrichtigungen durchführen: Prüfen Sie, ob Ihre Benachrichtigungen richtig ausgelöst werden und ob Benachrichtigungen wie erwartet zugestellt werden.
  • Benachrichtigungsstrategie dokumentieren: Dokumentieren Sie Ihre Benachrichtigungsregeln, Benachrichtigungskanäle und Eskalierungsverfahren.