Benachrichtigungsrichtlinien mit Messwertschwellen erstellen

In diesem Dokument wird beschrieben, wie Sie mit der Google Cloud Console eine messwertbasierte Benachrichtigungsrichtlinie erstellen, mit der Benachrichtigungen gesendet werden, wenn die Werte eines Messwerts über oder unter dem Grenzwert für einen bestimmten Wiederholzeitraum liegen. Die Bedingung einer Benachrichtigungsrichtlinie kann beispielsweise erfüllt sein, wenn die CPU-Auslastung mindestens fünf Minuten lang über 80% liegt.

Dieser Inhalt gilt nicht für logbasierte Benachrichtigungsrichtlinien. Informationen zu logbasierten Benachrichtigungsrichtlinien, die Sie benachrichtigen, wenn eine bestimmte Nachricht in Ihren Logs angezeigt wird, finden Sie unter Logs überwachen.

In diesem Dokument wird Folgendes nicht beschrieben:

Hinweise

  1. Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Monitoring Editor (roles/monitoring.editor) für Ihr Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen und Ändern von Benachrichtigungsrichtlinien mit der Google Cloud Console benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

    Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

    Weitere Informationen zu Cloud Monitoring-Rollen finden Sie unter Zugriff mit Identity and Access Management steuern.

  2. Machen Sie sich mit den allgemeinen Konzepten von Benachrichtigungsrichtlinien vertraut. Weitere Informationen zu diesen Themen finden Sie unter Benachrichtigungen – Übersicht.

  3. Konfigurieren Sie die Benachrichtigungskanäle, über die Sie Benachrichtigungen erhalten möchten. Aus Gründen der Redundanz empfehlen wir, mehrere Benachrichtigungskanäle zu erstellen. Weitere Informationen finden Sie unter Benachrichtigungskanäle erstellen und verwalten.

Benachrichtigungsrichtlinie erstellen

So erstellen Sie eine Benachrichtigungsrichtlinie, die den Wert dieses Messwerts mit einem statischen Grenzwert vergleicht:

  1. Rufen Sie in der Google Cloud Console die Seite  Benachrichtigungen auf:

    Zu Benachrichtigungen

    Wenn Sie diese Seite über die Suchleiste suchen, wählen Sie das Ergebnis aus, dessen Zwischenüberschrift Monitoring ist.

  2. Wählen Sie Richtlinie erstellen aus.
  3. Wählen Sie die zu überwachende Zeitreihe aus:

    1. Klicken Sie auf Messwert auswählen, wählen Sie in den Menüs einen Ressourcentyp und einen Messwerttyp aus und klicken Sie dann auf Übernehmen.

      Das Menü Messwert auswählen enthält Funktionen, mit denen Sie die verfügbaren Messwerttypen finden können:

      • Verwenden Sie die Filterleiste, um einen bestimmten Messwerttyp zu finden. Wenn Sie beispielsweise util eingeben, werden im Menü nur Einträge angezeigt, die util enthalten. Einträge werden angezeigt, wenn sie einen Groß-/Kleinschreibungs-insensitiven „contains“-Test bestehen.
      • Wenn Sie alle Messwerttypen sehen möchten, auch die ohne Daten, klicken Sie auf  Aktiv. Standardmäßig werden in den Menüs nur Messwerttypen mit Daten angezeigt. Weitere Informationen finden Sie unter Messwert nicht im Menü aufgeführt.

      Sie können jeden integrierten Messwert oder jeden benutzerdefinierten Messwert überwachen.

    2. Optional: Wenn Sie einen Teil der Zeitreihe überwachen möchten, der mit den Mess- und Ressourcentypen übereinstimmt, die Sie im vorherigen Schritt ausgewählt haben, klicken Sie auf Filter hinzufügen. Wählen Sie im Filterdialogfeld das Label aus, nach dem gefiltert werden soll, einen Vergleichsoperator und dann den Filterwert aus. Der Filter zone =~ ^us.*.a$ verwendet beispielsweise einen regulären Ausdruck, um alle Zeitreihendaten abzugleichen, deren Zonenname mit us beginnt und auf a endet. Weitere Informationen finden Sie unter Ausgewählte Zeitreihe filtern.

    3. Optional: Wenn Sie ändern möchten, wie die Punkte in einer Zeitreihe ausgerichtet werden, legen Sie im Bereich Daten transformieren die Felder Rollierendes Zeitfenster und Funktion für rollierendes Zeitfenster fest.

      Wenn Sie einen protokollbasierten Messwert überwachen, empfehlen wir, das Menü Gleitender Zeitraum auf mindestens 10 Minuten festzulegen.

      Diese Felder geben an, wie die in einem Fenster aufgezeichneten Punkte kombiniert werden. Angenommen, das Fenster beträgt 15 Minuten und die Fensterfunktion ist max. Der ausgerichtete Punkt ist der Höchstwert aller Punkte in den letzten 15 Minuten. Weitere Informationen finden Sie unter Ausrichtung: Regularisierung innerhalb der Reihe.

      Sie können auch die Rate überwachen, mit der sich ein Messwert ändert, indem Sie das Feld Funktion für den gleitenden Durchschnitt auf prozentuale Änderung festlegen. Weitere Informationen finden Sie unter Änderungsrate beobachten.

    4. Optional: Kombinieren Sie Zeitreihen, wenn Sie die Anzahl der Zeitreihen reduzieren möchten, die durch eine Richtlinie überwacht werden, oder wenn Sie nur eine Sammlung von Zeitreihen überwachen möchten. Anstatt beispielsweise die CPU-Auslastung jeder VM-Instanz zu überwachen, können Sie den Durchschnitt der CPU-Auslastung für alle VMs in einer Zone berechnen und dann diesen Durchschnitt überwachen. Standardmäßig werden Zeitreihen nicht kombiniert. Allgemeine Informationen finden Sie unter Reduktion: Zeitreihen kombinieren.

      So kombinieren Sie alle Zeitreihen:

      1. Klicken Sie im Abschnitt Über Zeitachsen hinweg auf Maximieren.
      2. Legen Sie für das Feld Zeitreihenaggregation einen anderen Wert als none fest. Wenn Sie beispielsweise den Mittelwert der Zeitreihe anzeigen möchten, wählen Sie mean aus.
      3. Achten Sie darauf, dass das Feld Zeitachsen gruppieren nach leer ist.

      So kombinieren oder gruppieren Sie Zeitreihen nach Labelwerten:

      1. Klicken Sie im Abschnitt Über Zeitachsen hinweg auf Maximieren.
      2. Legen Sie für das Feld Zeitreihenaggregation einen anderen Wert als none fest.
      3. Wählen Sie im Feld Zeitachsen gruppieren nach die Labels aus, nach denen gruppiert werden soll.

      Wenn Sie beispielsweise nach dem Label zone gruppieren und dann das Aggregationsfeld auf den Wert mean festlegen, wird im Diagramm für jede Zone, für die Daten vorhanden sind, eine Zeitachse angezeigt. Die für eine bestimmte Zone angezeigte Zeitreihe ist der Durchschnitt aller Zeitreihen mit dieser Zone.

    5. Klicken Sie auf Weiter.

  4. Konfigurieren Sie den Bedingungstrigger:

    1. Belassen Sie im Feld Bedingungstyp den Standardwert Schwellenwert.

    2. Optional: Aktualisieren Sie das Menü Benachrichtigungstrigger mit den folgenden Werten:

      • Any time series violates (Wenn eine Zeitachse verstößt): Standardeinstellung. Wenn eine Zeitreihe den Grenzwert für das gesamte Wiederholungsfenster überschreitet, ist die Bedingung erfüllt.

      • Percent of time series violates (Wenn Prozentsatz an Zeitachsen verstößt): Ein Prozentsatz der Zeitreihen muss während des gesamten Wiederholungszeitraums gegen den Grenzwert verstoßen, bevor die Bedingung erfüllt ist. Sie können beispielsweise benachrichtigt werden, wenn 50% der beobachteten Zeitreihen den Grenzwert für das gesamte Wiederholungszeitraum überschreiten.

      • Number of time series violates (Wenn Anzahl an Zeitachsen verstößt): Eine bestimmte Anzahl von Zeitachsen muss während des gesamten Wiederholungszeitraums gegen den Grenzwert verstoßen, damit die Bedingung erfüllt ist. Sie können beispielsweise benachrichtigt werden, wenn 32 der beobachteten Zeitreihen den Grenzwert für das gesamte Testfenster überschreiten.

      • All time series violate (Wenn alle Zeitachsen verstoßen): Alle Zeitreihen müssen während des gesamten Wiederholungszeitraums den Grenzwert überschreiten, bevor die Bedingung erfüllt ist.

      Informationen zu den Intervallen, die in Monitoring zum Ausrichten und Messen von Zeitreihendaten verwendet werden, finden Sie unter Ausrichtungszeiträume und Testfenster.

    3. Geben Sie mit den Feldern Schwellenwertposition und Schwellenwert ein, wann der Wert eines Messwerts den Schwellenwert überschreitet. Wenn Sie diese Werte beispielsweise auf Über Schwellenwert und 0.3 setzen, wird der Grenzwert überschritten, wenn ein Messwert über 0.3 liegt.

    4. Optional: Wenn Sie festlegen möchten, wie lange Messwerte den Grenzwert überschreiten müssen, bevor Monitoring eine Benachrichtigung sendet, maximieren Sie Erweiterte Optionen und verwenden Sie das Menü Zeitfenster für Wiederholung.

      Der Standardwert ist No retest (Kein erneuter Test). Bei dieser Einstellung kann eine einzelne Messung zu einer Benachrichtigung führen. Weitere Informationen und ein Beispiel finden Sie unter Einstellungen für den Ausrichtungszeitraum und die Dauer.

    5. Optional: Wenn Sie festlegen möchten, wie die Bedingung beim Monitoring ausgewertet wird, wenn keine Daten mehr eingehen, maximieren Sie Erweiterte Optionen und verwenden Sie das Menü Auswertung fehlender Daten.

      Das Menü Auswertung fehlender Daten ist deaktiviert, wenn der Wert für das Fenster für den nochmaligen Test Kein nochmaliger Test ist.

      Google Cloud Console
      Feld „Bewertung fehlender Daten“
      Fazit Details
      Fehlende Daten (leer) Offene Vorfälle bleiben offen.
      Neue Vorfälle werden nicht geöffnet.

      Wenn eine Bedingung erfüllt ist, gilt das auch dann, wenn keine Daten mehr eingehen. Wenn für diese Bedingung bereits ein Vorfall geöffnet ist, bleibt er offen. Wenn ein Vorfall geöffnet ist und keine Daten eingehen, startet der Timer für die automatische Schließung nach einer Verzögerung von mindestens 15 Minuten. Wenn der Timer abläuft, wird der Vorfall geschlossen.

      Wenn Bedingungen nicht erfüllt werden, ist das auch dann der Fall, wenn keine Daten mehr eingehen.

      Fehlende Datenpunkte werden als Werte behandelt, die gegen die Richtlinienbedingung verstoßen Offene Vorfälle bleiben offen.
      Neue Vorfälle können geöffnet werden.

      Wenn eine Bedingung erfüllt ist, bleibt sie auch erfüllt, wenn keine Daten mehr eingehen. Wenn für diese Bedingung bereits ein Vorfall geöffnet ist, bleibt er offen. Wenn ein Vorfall geöffnet ist und während der Dauer der automatischen Schließung plus 24 Stunden keine Daten eingehen, wird er geschlossen.

      Wenn Bedingungen nicht erfüllt sind, führt diese Einstellung dazu, dass sich die Bedingung für Messwertschwellen wie eine metric-absence condition verhält. Wenn keine Daten innerhalb des im Fenster für den erneuten Test angegebenen Zeitraums eintreffen, wird die Bedingung als erfüllt ausgewertet. Bei einer Benachrichtigungsrichtlinie mit einer Bedingung wird ein Vorfall geöffnet, wenn die Bedingung erfüllt ist.

      Fehlende Datenpunkte werden als Werte behandelt, die nicht gegen die Richtlinienbedingung verstoßen Offene Vorfälle werden geschlossen.
      Neue Vorfälle werden nicht geöffnet.

      Bei erfüllten Bedingungen ist das nicht mehr der Fall, wenn keine Daten mehr eingehen. Wenn ein Vorfall aufgrund dieser Bedingung geöffnet ist, wird er geschlossen.

      Wenn Bedingungen nicht erfüllt werden, ist das auch dann der Fall, wenn keine Daten mehr eingehen.

    6. Klicken Sie auf Weiter.

  5. Optional: Erstellen Sie eine Benachrichtigungsrichtlinie mit mehreren Bedingungen.

    Die meisten Richtlinien überwachen einen einzelnen Messwerttyp. So kann eine Richtlinie beispielsweise die Anzahl der Byte überwachen, die in eine VM-Instanz geschrieben werden. Wenn Sie mehrere Messwerttypen überwachen möchten, erstellen Sie eine Richtlinie mit mehreren Bedingungen. Für jede Bedingung wird ein Messwerttyp überwacht. Nachdem Sie die Bedingungen erstellt haben, geben Sie an, wie sie kombiniert werden sollen. Weitere Informationen finden Sie unter Richtlinien mit mehreren Bedingungen.

    So erstellen Sie eine Benachrichtigungsrichtlinie mit mehreren Bedingungen:

    1. Klicken Sie für jede zusätzliche Bedingung auf Bedingung für Benachrichtigung hinzufügen und konfigurieren Sie die jeweilige Bedingung.
    2. Klicken Sie auf Weiter und konfigurieren Sie die Kombination der Bedingungen.
    3. Klicken Sie auf Weiter, um mit der Einrichtung von Benachrichtigungen und Dokumentation fortzufahren.
  6. Benachrichtigungen konfigurieren:

    1. Maximieren Sie das Menü Benachrichtigungen und Name und wählen Sie die gewünschten Benachrichtigungskanäle aus. Aus Gründen der Redundanz empfehlen wir, einer Benachrichtigungsrichtlinie mehrere Benachrichtigungskanaltypen hinzuzufügen. Weitere Informationen finden Sie unter Benachrichtigungskanäle verwalten.

    2. Optional: Wenn Sie benachrichtigt werden möchten, wenn ein Vorfall geschlossen wird, wählen Sie Beim Schließen von Vorfällen benachrichtigen aus. Wenn Sie eine Benachrichtigungsrichtlinie mit der Google Cloud Console erstellen, werden Benachrichtigungen standardmäßig nur beim Erstellen von Vorfällen gesendet.

    3. Optional: Wenn Sie ändern möchten, wie lange das Monitoring wartet, bevor ein Vorfall geschlossen wird, nachdem keine Daten mehr eingehen, wählen Sie eine Option aus dem Menü Dauer bis zur automatischen Schließung von Vorfällen aus. Wenn keine Daten mehr eingehen, wartet Monitoring standardmäßig sieben Tage, bevor ein geöffneter Vorfall geschlossen wird.

    4. Wählen Sie im Menü Richtlinienschweregrad eine Option aus. Bei Vorfällen und Benachrichtigungen wird der Schweregrad angezeigt.

    5. Optional: Wenn Sie der Benachrichtigungsrichtlinie benutzerdefinierte Labels hinzufügen möchten, gehen Sie im Abschnitt Richtliniennutzerlabels so vor:

      1. Klicken Sie auf Label hinzufügen und geben Sie im Feld Schlüssel einen Namen für das Label ein. Labelnamen müssen mit einem Kleinbuchstaben beginnen und dürfen Kleinbuchstaben, Ziffern, Unterstriche und Bindestriche enthalten. Geben Sie beispielsweise severity ein.
      2. Klicken Sie auf Wert und geben Sie einen Wert für das Label ein. Labelwerte dürfen Kleinbuchstaben, Ziffern, Unterstriche und Bindestriche enthalten. Geben Sie beispielsweise critical ein.

      Informationen dazu, wie Sie Richtlinienlabels zur Verwaltung Ihrer Benachrichtigungen verwenden können, finden Sie unter Vorfälle mit Labels versehen.

  7. Optional: Geben Sie im Abschnitt Dokumentation alle Inhalte ein, die in der Benachrichtigung enthalten sein sollen.

    Sie können die Dokumentation mit Nur-Text, Markdown und Variablen formatieren. Sie können auch Links hinzufügen, die Nutzern bei der Fehlerbehebung helfen, z. B. Links zu internen Playbooks, Google Cloud-Dashboards und externen Seiten. In der folgenden Dokumentationsvorlage wird beispielsweise ein CPU-Nutzungsvorfall für eine gce_instance-Ressource beschrieben. Sie enthält mehrere Variablen, die auf die REST-Ressourcen für Benachrichtigungsrichtlinien und Bedingungen verweisen. Die Dokumentationsvorlage leitet die Leser dann zu externen Seiten weiter, die bei der Fehlerbehebung helfen.

    Beim Erstellen von Benachrichtigungen ersetzt das Monitoring-System die Variablen in der Dokumentation durch ihre Werte. Die Werte ersetzen die Variablen nur in Benachrichtigungen. Im Vorschaubereich und an anderen Stellen in der Google Cloud Console wird nur die Markdown-Formatierung angezeigt.

    Vorschau

    ## CPU utilization exceeded
    
    ### Summary
    
    The ${metric.display_name} of the ${resource.type}
    ${resource.label.instance_id} in the project ${resource.project} has
    exceeded 90% for over 15 minutes.
    
    ### Additional resource information
    
    Condition resource name: ${condition.name}  
    Alerting policy resource name: ${policy.name}  
    
    ### Troubleshooting and Debug References
    
    Repository with debug scripts: example.com  
    Internal troubleshooting guide: example.com  
    ${resource.type} dashboard: example.com
    

    Format in Benachrichtigung

    Beispiel für die Darstellung von Dokumenten in einer Benachrichtigung

    Weitere Informationen finden Sie unter Benachrichtigungen mit benutzerdefinierter Dokumentation ergänzen und Kanalsteuerelemente verwenden.

  8. Klicken Sie auf Name der Benachrichtigung und geben Sie einen Namen für die Benachrichtigungsrichtlinie ein.

  9. Klicken Sie auf Richtlinie erstellen.

Ausgewählte Zeitreihe filtern

Filter sorgen dafür, dass nur Zeitreihen beobachtet werden, die bestimmte Kriterien erfüllen. Wenn Sie Filter anwenden, können Sie die Anzahl der Linien im Diagramm reduzieren, was die Leistung des Diagramms verbessern kann. Durch Aggregation können Sie die Menge der zu überwachenden Daten auch reduzieren. Filter stellen sicher, dass nur Zeitachsen verwendet werden, die bestimmte Kriterien erfüllen. Wenn Sie Filter anwenden, müssen weniger Zeitreihen ausgewertet werden, was die Leistung der Benachrichtigung verbessern kann.

Ein Filter besteht aus einem Label, einem Vergleich und einem Wert. Wenn Sie beispielsweise alle Zeitreihen abgleichen möchten, deren zone-Label mit "us-central1" beginnt, können Sie den Filter zone=~"us-central1.*" verwenden, der einen regulären Ausdruck für den Vergleich verwendet.

Wenn Sie nach der Projekt-ID oder dem Ressourcencontainer filtern, müssen Sie den Gleichheitsoperator (=) verwenden. Wenn Sie nach anderen Labels filtern, können Sie jeden unterstützten Vergleichsoperator verwenden. Normalerweise können Sie nach Messwert- und Ressourcenlabels sowie nach Ressourcengruppe filtern.

Wenn Sie mehrere Filterkriterien angeben, werden nur die Zeitreihen überwacht, die alle Kriterien erfüllen.

Um einen Filter hinzuzufügen, klicken Sie auf Filter hinzufügen, füllen Sie das Dialogfeld aus und klicken Sie dann auf Fertig. Im Dialogfeld verwenden Sie das Feld Filter, um das Kriterium auszuwählen, nach dem gefiltert werden soll, den Vergleichsoperator und dann den Wert. In jeder Zeile der folgenden Tabelle sind ein Vergleichsoperator, seine Bedeutung und ein Beispiel aufgeführt:

OperatorBedeutungBeispiel
= Entsprechung resource.labels.zone = "us-central1-a"
!= Ungleichheit resource.labels.zone != "us-central1-a"
=~ Gleichheit mit regulärem Ausdruck2 monitoring.regex.full_match("^us.*")
!=~ Ungleichheit mit regulärem Ausdruck2 monitoring.regex.full_match("^us.*")
starts_with Wert beginnt mit resource.labels.zone = starts_with("us")
ends_with Wert endet mit resource.labels.zone = ends_with("b")
has_substring Wert enthält resource.labels.zone = has_substring("east")
one_of Eine von resource.labels.zone = one_of("asia-east1-b", "europe-north1-a")
!starts_with Wert beginnt nicht mit resource.labels.zone != starts_with("us")
!ends_with Wert endet nicht mit resource.labels.zone != ends_with("b")
!has_substring Wert enthält nicht resource.labels.zone != has_substring("east")
!one_of Wert ist keiner der folgenden Werte resource.labels.zone != one_of("asia-east1-b", "europe-north1-a")

Fehlerbehebung

Dieser Abschnitt enthält Tipps zur Fehlerbehebung.

Messwert ist nicht im Menü der verfügbaren Messwerte aufgeführt

Wenn Sie einen Messwert überwachen möchten, der nicht im Menü Messwert auswählen aufgeführt ist, gehen Sie so vor:

  • Wenn Sie eine Benachrichtigungsrichtlinie erstellen möchten, die einen Google Cloud-Messwert überwacht, maximieren Sie das Menü Messwert auswählen und klicken Sie dann auf  Aktiv. Wenn diese Option deaktiviert ist, werden im Menü alle Messwerte für Google Cloud-Dienste und alle Messwerte mit Daten aufgeführt.

  • Wenn Sie eine Bedingung für einen benutzerdefinierten Messwerttyp konfigurieren möchten, bevor Daten für diesen Messwerttyp generiert werden, müssen Sie den Messwerttyp mit einem Monitoring-Filter angeben:

    1. Wählen Sie ? aus. in der Abschnittsüberschrift Messwert wählen und wählen Sie dann in der Kurzinfo Direkter Filtermodus aus.
    2. Geben Sie einen Monitoringfilter oder eine Zeitreihenauswahl ein. Informationen zur Syntax finden Sie in den folgenden Dokumenten:

Änderungsrate beobachten

Wenn Sie die Änderungsrate eines Messwerts beobachten möchten, legen Sie für das Feld Rollierende Fensterfunktion die Option Prozentuale Änderung fest. Bei der Auswertung der Bedingung berechnet Monitoring die Änderungsrate des Messwerts als Prozentsatz und vergleicht diesen Prozentsatz dann mit dem Schwellenwert der Bedingung. Dieser Vergleich umfasst zwei Schritte:

  1. Wenn die Zeitreihe die Messwertart DELTA oder CUMULATIVE hat, wird sie in eine Zeitreihe mit der Messwertart GAUGE konvertiert. Weitere Informationen zur Umwandlung finden Sie unter Arten, Typen und Conversions.
  2. Beim Monitoring wird der Prozentsatz der Änderung berechnet, indem der Durchschnittswert im letzten 10-Minuten-Bewegungsfenster mit dem Durchschnittswert aus dem 10-Minuten-Bewegungsfenster vor Beginn des Kalibrierungszeitraums verglichen wird.

Das 10-Minuten-Bewegungsfenster, das für Vergleiche in einer Richtlinie für Benachrichtigungen zur Änderungsrate verwendet wird, kann nicht geändert werden. Sie geben den Alignierungszeitraum jedoch an, wenn Sie die Bedingung erstellen.

Nächste Schritte

  • Wenn Sie eine Richtlinie erstellen möchten, die den Wert einer Zeitreihe mit einem dynamischen Grenzwert vergleicht, müssen Sie MQL verwenden. Weitere Informationen finden Sie unter Dynamische Schweregrade mit MQL erstellen.