Benachrichtigungsrichtlinien für fehlende Messwerte erstellen

In diesem Dokument wird beschrieben, wie Sie mit der Google Cloud Console eine Benachrichtigungsrichtlinie erstellen, mit der Benachrichtigungen gesendet werden, wenn für eine beobachtete Zeitreihe für einen bestimmten Zeitraum keine Daten vorhanden sind.

Bei Bedingungen für fehlende Messwerte muss innerhalb des maximalen Zeitraums nach Installation oder Änderung der Richtlinie mindestens eine erfolgreiche Messung durchgeführt werden, d. h. eine Messung, bei der Daten abgerufen werden. Dieser Zeitraum wird als Trigger-Abwesenheitszeit bezeichnet. Die maximal konfigurierbare Abwesenheitszeit für den Trigger beträgt 23,5 Stunden.

Nehmen wir beispielsweise an, Sie legen die Auslösezeit für den Fehlwert in einer Richtlinie für einen fehlenden Messwert auf 30 Minuten fest. Die Bedingung wird nicht erfüllt, wenn das Subsystem, das Messwertdaten schreibt, nie einen Datenpunkt geschrieben hat. Das Subsystem muss mindestens einen Datenpunkt ausgeben, auf den 30 Minuten lang keine weiteren Datenpunkte folgen dürfen.

Dieser Inhalt gilt nicht für logbasierte Benachrichtigungsrichtlinien. Informationen zu logbasierten Benachrichtigungsrichtlinien, die Sie benachrichtigen, wenn eine bestimmte Nachricht in Ihren Logs angezeigt wird, finden Sie unter Logs überwachen.

In diesem Dokument wird Folgendes nicht beschrieben:

Hinweise

  1. Um die Berechtigungen zu erhalten, die Sie zum Erstellen und Ändern von Benachrichtigungsrichtlinien mit der Google Cloud Console benötigen, bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Monitoring Editor (roles/monitoring.editor) für Ihr Projekt zuzuweisen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

    Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

    Weitere Informationen zu Cloud Monitoring-Rollen finden Sie unter Zugriff mit Identity and Access Management steuern.

  2. Machen Sie sich mit den allgemeinen Konzepten von Benachrichtigungsrichtlinien vertraut. Weitere Informationen zu diesen Themen finden Sie unter Benachrichtigungen – Übersicht.

  3. Konfigurieren Sie die Benachrichtigungskanäle, über die Sie Benachrichtigungen erhalten möchten. Aus Gründen der Redundanz empfehlen wir, mehrere Benachrichtigungskanäle zu erstellen. Weitere Informationen finden Sie unter Benachrichtigungskanäle erstellen und verwalten.

Benachrichtigungsrichtlinie erstellen

So erstellen Sie eine Benachrichtigungsrichtlinie, die Benachrichtigungen sendet, wenn für eine überwachte Zeitreihe für einen bestimmten Zeitraum keine Daten vorhanden sind:

  1. Rufen Sie in der Google Cloud Console die Seite  Benachrichtigungen auf:

    Zu Benachrichtigungen

    Wenn Sie diese Seite über die Suchleiste suchen, wählen Sie das Ergebnis aus, dessen Zwischenüberschrift Monitoring ist.

  2. Wählen Sie Richtlinie erstellen aus.
  3. Wählen Sie die zu überwachende Zeitreihe aus:

    1. Klicken Sie auf Messwert auswählen, wählen Sie in den Menüs einen Ressourcentyp und einen Messwerttyp aus und klicken Sie dann auf Übernehmen.

      Das Menü Messwert auswählen enthält Funktionen, mit denen Sie die verfügbaren Messwerttypen finden können:

      • Verwenden Sie die Filterleiste, um einen bestimmten Messwerttyp zu finden. Wenn Sie beispielsweise util eingeben, werden im Menü nur Einträge angezeigt, die util enthalten. Einträge werden angezeigt, wenn sie einen Groß-/Kleinschreibungs-insensitiven „contains“-Test bestehen.

      Sie können jeden integrierten Messwert oder jeden benutzerdefinierten Messwert überwachen.

    2. Optional: Wenn Sie einen Teil der Zeitreihe überwachen möchten, der mit den Mess- und Ressourcentypen übereinstimmt, die Sie im vorherigen Schritt ausgewählt haben, klicken Sie auf Filter hinzufügen. Wählen Sie im Filterdialogfeld das Label aus, nach dem gefiltert werden soll, einen Vergleichsoperator und dann den Filterwert aus. Der Filter zone =~ ^us.*.a$ verwendet beispielsweise einen regulären Ausdruck, um alle Zeitreihendaten abzugleichen, deren Zonenname mit us beginnt und auf a endet. Weitere Informationen finden Sie unter Ausgewählte Zeitreihe filtern.

    3. Optional: Wenn Sie ändern möchten, wie die Punkte in einer Zeitreihe ausgerichtet werden, legen Sie im Bereich Daten transformieren die Felder Rollierendes Zeitfenster und Funktion für rollierendes Zeitfenster fest.

      Wenn Sie einen protokollbasierten Messwert überwachen, empfehlen wir, das Menü Gleitender Zeitraum auf mindestens 10 Minuten festzulegen.

      Diese Felder geben an, wie die in einem Fenster aufgezeichneten Punkte kombiniert werden. Angenommen, das Fenster beträgt 15 Minuten und die Fensterfunktion ist max. Der ausgerichtete Punkt ist der Höchstwert aller Punkte in den letzten 15 Minuten. Weitere Informationen finden Sie unter Ausrichtung: Regularisierung innerhalb der Reihe.

    4. Optional: Kombinieren Sie Zeitreihen, wenn Sie die Anzahl der Zeitreihen reduzieren möchten, die durch eine Richtlinie überwacht werden, oder wenn Sie nur eine Sammlung von Zeitreihen überwachen möchten. Anstatt beispielsweise die CPU-Auslastung jeder VM-Instanz zu überwachen, können Sie den Durchschnitt der CPU-Auslastung für alle VMs in einer Zone berechnen und dann diesen Durchschnitt überwachen. Standardmäßig werden Zeitreihen nicht kombiniert. Allgemeine Informationen finden Sie unter Reduktion: Zeitreihen kombinieren.

      So kombinieren Sie alle Zeitreihen:

      1. Klicken Sie im Abschnitt Über Zeitachsen hinweg auf Maximieren.
      2. Legen Sie für das Feld Zeitreihenaggregation einen anderen Wert als none fest. Wenn Sie beispielsweise den Mittelwert der Zeitreihe anzeigen möchten, wählen Sie mean aus.
      3. Achten Sie darauf, dass das Feld Zeitachsen gruppieren nach leer ist.

      So kombinieren oder gruppieren Sie Zeitreihen nach Labelwerten:

      1. Klicken Sie im Abschnitt Über Zeitachsen hinweg auf Maximieren.
      2. Legen Sie für das Feld Zeitreihenaggregation einen anderen Wert als none fest.
      3. Wählen Sie im Feld Zeitachsen gruppieren nach die Labels aus, nach denen gruppiert werden soll.

      Wenn Sie beispielsweise nach dem Label zone gruppieren und dann das Aggregationsfeld auf den Wert mean festlegen, wird im Diagramm für jede Zone, für die Daten vorhanden sind, eine Zeitachse angezeigt. Die für eine bestimmte Zone angezeigte Zeitreihe ist der Durchschnitt aller Zeitreihen mit dieser Zone.

    5. Klicken Sie auf Weiter.

  4. Konfigurieren Sie den Bedingungstrigger:

    1. Wählen Sie als Bedingungstyp Fehlender Messwert aus.

    2. Optional: Aktualisieren Sie das Menü Benachrichtigungstrigger mit den folgenden Werten:

      • Any time series violates (Wenn eine Zeitachse verstößt): Standardeinstellung. Bei jeder Zeitreihe, die für den gesamten Zeitraum ohne Daten liegt, wird die Bedingung erfüllt.

      • Percent of time series violates (Wenn Prozentsatz an Zeitachsen verstößt): Für einen Prozentsatz der Zeitreihen müssen für den gesamten Zeitraum, in dem der Trigger nicht aktiv ist, keine Daten vorhanden sein, bevor die Bedingung erfüllt ist. Sie können sich beispielsweise benachrichtigen lassen, wenn für 50% der überwachten Zeitreihen keine Daten für die gesamte Zeitspanne ohne Trigger vorhanden sind.

      • Number of time series violates (Wenn Anzahl an Zeitachsen verstößt): Für eine bestimmte Anzahl von Zeitachsen müssen für den gesamten Zeitraum, in dem der Trigger nicht aktiv ist, keine Daten vorhanden sein, bevor die Bedingung erfüllt ist. Sie können beispielsweise benachrichtigt werden, wenn für 32 der überwachten Zeitreihen keine Daten für die gesamte Zeitspanne ohne Trigger vorhanden sind.

      • Alle Zeitreihen verstoßen: Alle Zeitreihen müssen für den gesamten Zeitraum der Triggerabwesenheit keine Daten enthalten, bevor die Bedingung erfüllt ist.

      Informationen zu den Intervallen, die in Monitoring zum Ausrichten und Messen von Zeitreihendaten verwendet werden, finden Sie unter Ausrichtungszeiträume und Testfenster.

    3. Geben Sie im Feld Trigger-Ausbleibzeit an, wie lange Messwertdaten fehlen müssen, bevor Sie vom Monitoring benachrichtigt werden.

    4. Klicken Sie auf Weiter.

  5. Optional: Erstellen Sie eine Benachrichtigungsrichtlinie mit mehreren Bedingungen.

    Die meisten Richtlinien überwachen einen einzelnen Messwerttyp. So kann eine Richtlinie beispielsweise die Anzahl der Byte überwachen, die in eine VM-Instanz geschrieben werden. Wenn Sie mehrere Messwerttypen überwachen möchten, erstellen Sie eine Richtlinie mit mehreren Bedingungen. Für jede Bedingung wird ein Messwerttyp überwacht. Nachdem Sie die Bedingungen erstellt haben, geben Sie an, wie sie kombiniert werden sollen. Weitere Informationen finden Sie unter Richtlinien mit mehreren Bedingungen.

    So erstellen Sie eine Benachrichtigungsrichtlinie mit mehreren Bedingungen:

    1. Klicken Sie für jede zusätzliche Bedingung auf Bedingung für Benachrichtigung hinzufügen und konfigurieren Sie die jeweilige Bedingung.
    2. Klicken Sie auf Weiter und konfigurieren Sie die Kombination der Bedingungen.
    3. Klicken Sie auf Weiter, um mit der Einrichtung von Benachrichtigungen und Dokumentation fortzufahren.
  6. Benachrichtigungen konfigurieren:

    1. Maximieren Sie das Menü Benachrichtigungen und Name und wählen Sie die gewünschten Benachrichtigungskanäle aus. Aus Gründen der Redundanz empfehlen wir, einer Benachrichtigungsrichtlinie mehrere Benachrichtigungskanaltypen hinzuzufügen. Weitere Informationen finden Sie unter Benachrichtigungskanäle verwalten.

    2. Optional: Wenn Sie benachrichtigt werden möchten, wenn ein Vorfall geschlossen wird, wählen Sie Beim Schließen von Vorfällen benachrichtigen aus. Wenn Sie eine Benachrichtigungsrichtlinie mit der Google Cloud Console erstellen, werden Benachrichtigungen standardmäßig nur beim Erstellen von Vorfällen gesendet.

    3. Optional: Wenn Sie ändern möchten, wie lange das Monitoring wartet, bevor ein Vorfall geschlossen wird, nachdem keine Daten mehr eingehen, wählen Sie eine Option aus dem Menü Dauer bis zur automatischen Schließung von Vorfällen aus. Wenn keine Daten mehr eingehen, wartet Monitoring standardmäßig sieben Tage, bevor ein geöffneter Vorfall geschlossen wird.

    4. Wählen Sie im Menü Richtlinienschweregrad eine Option aus. Bei Vorfällen und Benachrichtigungen wird der Schweregrad angezeigt.

    5. Optional: Wenn Sie der Benachrichtigungsrichtlinie benutzerdefinierte Labels hinzufügen möchten, gehen Sie im Abschnitt Richtliniennutzerlabels so vor:

      1. Klicken Sie auf Label hinzufügen und geben Sie im Feld Schlüssel einen Namen für das Label ein. Labelnamen müssen mit einem Kleinbuchstaben beginnen und dürfen Kleinbuchstaben, Ziffern, Unterstriche und Bindestriche enthalten. Geben Sie beispielsweise severity ein.
      2. Klicken Sie auf Wert und geben Sie einen Wert für das Label ein. Labelwerte dürfen Kleinbuchstaben, Ziffern, Unterstriche und Bindestriche enthalten. Geben Sie beispielsweise critical ein.

      Informationen dazu, wie Sie Richtlinienlabels zur Verwaltung Ihrer Benachrichtigungen verwenden können, finden Sie unter Vorfälle mit Labels versehen.

  7. Optional: Geben Sie im Abschnitt Dokumentation alle Inhalte ein, die in der Benachrichtigung enthalten sein sollen.

    Sie können die Dokumentation mit Nur-Text, Markdown und Variablen formatieren. Sie können auch Links hinzufügen, die Nutzern bei der Fehlerbehebung helfen, z. B. Links zu internen Playbooks, Google Cloud-Dashboards und externen Seiten. In der folgenden Dokumentationsvorlage wird beispielsweise ein CPU-Nutzungsvorfall für eine gce_instance-Ressource beschrieben. Sie enthält mehrere Variablen, die auf die REST-Ressourcen für Benachrichtigungsrichtlinien und Bedingungen verweisen. Die Dokumentationsvorlage leitet die Leser dann zu externen Seiten weiter, die bei der Fehlerbehebung helfen.

    Beim Erstellen von Benachrichtigungen ersetzt das Monitoring-System die Variablen in der Dokumentation durch ihre Werte. Die Werte ersetzen die Variablen nur in Benachrichtigungen. Im Vorschaubereich und an anderen Stellen in der Google Cloud Console wird nur die Markdown-Formatierung angezeigt.

    Vorschau

    ## CPU utilization exceeded
    
    ### Summary
    
    The ${metric.display_name} of the ${resource.type}
    ${resource.label.instance_id} in the project ${resource.project} has
    exceeded 90% for over 15 minutes.
    
    ### Additional resource information
    
    Condition resource name: ${condition.name}  
    Alerting policy resource name: ${policy.name}  
    
    ### Troubleshooting and Debug References
    
    Repository with debug scripts: example.com  
    Internal troubleshooting guide: example.com  
    ${resource.type} dashboard: example.com
    

    Format in Benachrichtigung

    Beispiel für die Darstellung von Dokumenten in einer Benachrichtigung

    Weitere Informationen finden Sie unter Benachrichtigungen mit benutzerdefinierter Dokumentation ergänzen und Kanalsteuerelemente verwenden.

  8. Klicken Sie auf Name der Benachrichtigung und geben Sie einen Namen für die Benachrichtigungsrichtlinie ein.

  9. Klicken Sie auf Richtlinie erstellen.

Ausgewählte Zeitreihe filtern

Filter sorgen dafür, dass nur Zeitreihen beobachtet werden, die bestimmte Kriterien erfüllen. Wenn Sie Filter anwenden, können Sie die Anzahl der Linien im Diagramm reduzieren, was die Leistung des Diagramms verbessern kann. Durch Aggregation können Sie die Menge der zu überwachenden Daten auch reduzieren. Filter stellen sicher, dass nur Zeitachsen verwendet werden, die bestimmte Kriterien erfüllen. Wenn Sie Filter anwenden, müssen weniger Zeitreihen ausgewertet werden, was die Leistung der Benachrichtigung verbessern kann.

Ein Filter besteht aus einem Label, einem Vergleich und einem Wert. Wenn Sie beispielsweise alle Zeitreihen abgleichen möchten, deren zone-Label mit "us-central1" beginnt, können Sie den Filter zone=~"us-central1.*" verwenden, der einen regulären Ausdruck für den Vergleich verwendet.

Wenn Sie nach der Projekt-ID oder dem Ressourcencontainer filtern, müssen Sie den Gleichheitsoperator (=) verwenden. Wenn Sie nach anderen Labels filtern, können Sie jeden unterstützten Vergleichsoperator verwenden. Normalerweise können Sie nach Messwert- und Ressourcenlabels sowie nach Ressourcengruppe filtern.

Wenn Sie mehrere Filterkriterien angeben, werden nur die Zeitreihen überwacht, die alle Kriterien erfüllen.

Um einen Filter hinzuzufügen, klicken Sie auf Filter hinzufügen, füllen Sie das Dialogfeld aus und klicken Sie dann auf Fertig. Im Dialogfeld verwenden Sie das Feld Filter, um das Kriterium auszuwählen, nach dem gefiltert werden soll, den Vergleichsoperator und dann den Wert. In jeder Zeile der folgenden Tabelle sind ein Vergleichsoperator, seine Bedeutung und ein Beispiel aufgeführt:

OperatorBedeutungBeispiel
= Entsprechung resource.labels.zone = "us-central1-a"
!= Ungleichheit resource.labels.zone != "us-central1-a"
=~ Gleichheit mit regulärem Ausdruck2 monitoring.regex.full_match("^us.*")
!=~ Ungleichheit mit regulärem Ausdruck2 monitoring.regex.full_match("^us.*")
starts_with Wert beginnt mit resource.labels.zone = starts_with("us")
ends_with Wert endet mit resource.labels.zone = ends_with("b")
has_substring Wert enthält resource.labels.zone = has_substring("east")
one_of Eine von resource.labels.zone = one_of("asia-east1-b", "europe-north1-a")
!starts_with Wert beginnt nicht mit resource.labels.zone != starts_with("us")
!ends_with Wert endet nicht mit resource.labels.zone != ends_with("b")
!has_substring Wert enthält nicht resource.labels.zone != has_substring("east")
!one_of Wert ist keiner der folgenden Werte resource.labels.zone != one_of("asia-east1-b", "europe-north1-a")