Fehler bei logbasierten Messwerten beheben

Auf dieser Seite finden Sie Informationen zur Fehlerbehebung für häufige Szenarien bei der Verwendung logbasierter Messwerte in Cloud Logging.

Messwerte können nicht aufgerufen oder erstellt werden

Logbasierte Messwerte gelten nur für ein einzelnes Google Cloud-Projekt oder für einen Logging-Bucket innerhalb eines Google Cloud-Projekts. Sie können keine protokollbasierten Messwerte für andere Google Cloud-Ressourcen wie Rechnungskonten oder Organisationen erstellen. Logbasierte Messwerte werden nur für Logs im Google Cloud-Projekt oder Bucket berechnet, in dem sie empfangen wurden.

Zum Erstellen von Messwerten benötigen Sie die entsprechenden IAM-Berechtigungen (Identity and Access Management). Weitere Informationen finden Sie unter Zugriffssteuerung mit IAM: Logbasierte Messwerte.

Im Messwert fehlen Logdaten

Das Fehlen von Daten in logbasierten Messwerten kann mehrere Gründe haben:

  • Neue Logeinträge stimmen möglicherweise nicht mit dem Filter Ihres Messwerts überein. Logbasierte Messwerte rufen Daten aus übereinstimmenden Log-Einträgen ab, die nach der Erstellung des Messwerts empfangen wurden. In Logging werden keine Backfills mit Messwerten aus früheren Logeinträgen durchgeführt.

  • Neue Logeinträge enthalten möglicherweise nicht das richtige Feld oder die Daten haben vielleicht nicht das richtige Format für die Extraktion durch Ihren Verteilungsmesswert. Prüfen Sie, ob Ihre Feldnamen und regulären Ausdrücke korrekt sind.

  • Die Messwertzählungen sind möglicherweise verzögert. Auch wenn zählbare Logeinträge im Log-Explorer angezeigt werden, kann es bis zu 10 Minuten dauern, bis die logbasierten Messwerte in Cloud Monitoring aktualisiert werden.

  • Die angezeigten Logeinträge werden möglicherweise spät oder gar nicht gezählt, weil ihr Zeitstempel zu weit in der Vergangenheit oder Zukunft liegt. Wenn der Empfang eines Logeintrags mehr als 24 Stunden in der Vergangenheit oder 10 Minuten in der Zukunft liegt, wird der Logeintrag nicht im logbasierten Messwert gezählt.

    Die Anzahl der spät ankommenden Einträge wird im logbasierten Messwert logging.googleapis.com/logs_based_metrics_error_count erfasst.

    Beispiel: Ein Logeintrag, der mit einem logbasierten Messwert übereinstimmt, trifft spät ein. Er hat einen timestamp von 14:30 Uhr am 20. Februar 2020 und einen receivedTimestamp von 14:45 Uhr am 21. Februar 2020. Dieser Eintrag wird nicht in den logbasierten Messwert einbezogen.

  • Der logbasierte Messwert wurde nach dem Eintreffen der Logeinträge erstellt, die für den Messwert gezählt werden könnten. Bei logbasierten Messwerten werden Logeinträge ausgewertet, die in Log-Buckets gespeichert sind. Logeinträge, die in der Protokollierung gespeichert sind, werden nicht berücksichtigt.

  • Der logbasierte Messwert weist Lücken in den Daten auf. Einige Datenlücken sind zu erwarten, da die Systeme, die die protokollbasierten Messdaten verarbeiten, nicht für die Persistenz jedes Messdatenpunkts garantieren. Wenn Lücken auftreten, sind sie in der Regel selten und von kurzer Dauer. Wenn Sie jedoch eine Benachrichtigungsrichtlinie haben, die einen logbasierten Messwert überwacht, können Lücken in den Daten zu einer falschen Benachrichtigung führen. Mit den Einstellungen in Ihrer Benachrichtigungsrichtlinie können Sie diese Wahrscheinlichkeit verringern.

    Beispiel: Alle fünf Minuten wird ein „Heartbeat“-Logeintrag geschrieben und mit einem logbasierten Messwert wird die Anzahl der „Heartbeat“-Logeinträge gezählt. Eine Benachrichtigungsrichtlinie summiert die Anzahl der Ereignisse in einem Fünf-Minuten-Intervall und benachrichtigt Sie, wenn die Gesamtzahl unter 1 liegt. Wenn in der Zeitreihe ein Datenpunkt fehlt, wird in der Benachrichtigungsrichtlinie ein synthetischer Wert eingefügt, der ein Duplikat der letzten Stichprobe ist und höchstwahrscheinlich null ist. Anschließend wird die Bedingung ausgewertet. Daher kann schon ein einzelner fehlender Datenpunkt dazu führen, dass der Summenwert null ist, was wiederum dazu führt, dass diese Benachrichtigungsrichtlinie eine Benachrichtigung sendet.

    Um das Risiko einer Falschmeldung zu verringern, konfigurieren Sie die Richtlinie so, dass mehrere „Heartbeat“-Protokolleinträge gezählt werden, nicht nur einer.

Der Ressourcentyp ist in Cloud Monitoring "nicht definiert"

Einige überwachte Cloud Logging-Ressourcentypen werden nicht direkt überwachten Cloud Monitoring-Ressourcentypen zugeordnet. Wenn Sie beispielsweise zuerst eine Benachrichtigungsrichtlinie oder ein Diagramm aus einem logbasierten Messwert erstellen, sehen Sie möglicherweise, dass der Ressourcentyp „nicht definiert“ ist.

Der Ressourcentyp ist nicht definiert.

Der überwachte Ressourcentyp ist entweder global oder einem anderen überwachten Ressourcentyp in Cloud Monitoring zugeordnet. In den Zuordnungen für reine Logging-Ressourcen erfahren Sie, welchen überwachten Ressourcentyp Sie auswählen müssen.

Vorfälle werden nicht erstellt oder sind falsch-positiv

Es kann zu falsch-positiven Vorfällen oder Situationen kommen, in denen das Monitoring keine Vorfälle aus logbasierten Messwerten erstellt, weil der Ausrichtungszeitraum für die Benachrichtigungsrichtlinie zu kurz ist. In den folgenden Fällen kann es zu Falschmeldungen kommen:

  • Wenn eine Benachrichtigungsrichtlinie die Logik weniger als verwendet.
  • Wenn eine Benachrichtigungsrichtlinie auf einer Perzentilbedingung für einen Verteilungsmesswert basiert.
  • Wenn es eine Lücke in den Messdaten gibt.

Falsch-positive Vorfälle können auftreten, weil Logeinträge ggf. zu spät an Logging gesendet wurden. Beispielsweise können die Logfelder timestamp und receiveTimestamp in einigen Fällen ein Delta von Minuten aufweisen. Wenn Logs in Log-Buckets gespeichert werden, gibt es außerdem eine inhärente Verzögerung zwischen dem Zeitpunkt, an dem die Logeinträge erzeugt werden, und dem Zeitpunkt, an dem Logging sie erhält. Das bedeutet, dass Logging bis zu einem späteren Zeitpunkt nach der Generierung der Logeinträge möglicherweise nicht die Gesamtzahl für einen bestimmten Logeintrag aufweist. Aus diesem Grund kann eine Benachrichtigungsrichtlinie mit weniger als Logik oder basierend auf einer Perzentilbedingung für einen Verteilungsmesswert zu einer falsch-positiven Benachrichtigung führen: Nicht alle Logeinträge wurden bereits berücksichtigt.

Logbasierte Messwerte unterliegen jedoch Eventual Consistency, da ein Logeintrag, der mit einem logbasierten Messwert übereinstimmt, an Logging mit einem timestamp gesendet werden kann, der deutlich älter oder neuer ist als der Log-receiveTimestamp.

Der logbasierte Messwert bedeutet, dass Logeinträge mit älteren Zeitstempeln empfangen werden können, nachdem vorhandene Logeinträge mit demselben Zeitstempel bereits von Logging empfangen wurden. Daher muss der Messwert aktualisiert werden.

Damit Benachrichtigungen auch bei pünktlichen Daten korrekt sind, empfehlen wir, den Ausrichtungszeitraum für die Bedingung auf mindestens 10 Minuten festzulegen. Insbesondere sollte dieser Wert groß genug sein, damit mehrere Logeinträge gezählt werden, die mit Ihrem Filter übereinstimmen. Wenn in einem logbasierten Messwert beispielsweise Heartbeat-Logeinträge gezählt werden, die alle N Minuten erwartet werden, legen Sie den Alignierungszeitraum auf 2N Minuten oder 10 Minuten fest, je nachdem, was länger ist:

  • Wenn Sie die Google Cloud Console verwenden, legen Sie den Alignierungszeitraum im Menü Rolling Window fest.

  • Wenn Sie die API verwenden, legen Sie den Alignierungszeitraum mit dem Feld aggregations.alignmentPeriod der Bedingung fest.

Messwert enthält zu viele Zeitachsen

Die Anzahl der Zeitachsen in einem Messwert hängt von der Anzahl der unterschiedlichen Kombinationen von Labelwerten ab. Die Anzahl der Zeitachsen wird als Kardinalität des Messwerts bezeichnet und darf 30.000 nicht überschreiten.

Da Sie eine Zeitachse für jede Kombination von Labelwerten generieren können, ist es nicht schwer, 30.000 Zeitachsen zu überschreiten,wenn Sie ein oder mehrere Labels mit einer hohen Anzahl von Werten haben. Sie sollten Messwerte mit hoher Kardinalität vermeiden.

Wenn die Kardinalität eines Messwerts zunimmt, kann der Messwert gedrosselt werden und einige Datenpunkte werden möglicherweise nicht in den Messwert geschrieben. Diagramme, die den Messwert anzeigen, können aufgrund der hohen Anzahl von Zeitachsen, die das Diagramm verarbeiten muss, langsam geladen werden. Möglicherweise fallen auch Kosten für API-Aufrufe zur Abfrage von Zeitachsendaten an. Einzelheiten hierzu finden Sie in der Preisübersicht zu Cloud Monitoring.

So vermeiden Sie es, Messwerte mit hoher Kardinalität zu erstellen:

  • Überprüfen Sie, ob die Labelfelder und regulären Extrahiererausdrücke mit Werten übereinstimmen, die eine beschränkte Kardinalität haben.

  • Vermeiden Sie das Extrahieren von Textnachrichten, die sich unbegrenzt wie Labelwerte ändern können.

  • Vermeiden Sie das Extrahieren numerischer Werte mit unbegrenzter Kardinalität.

  • Extrahieren Sie nur Werte von Labeln mit bekannter Kardinalität, z. B. Statuscodes mit einer Reihe bekannter Werte.

Mit diesen logbasierten Systemmesswerten können Sie die Auswirkungen des Hinzufügens oder Entfernens von Labels auf die Kardinalität Ihres Messwerts messen:

Wenn Sie diese Messwerte prüfen, können Sie die Ergebnisse weiter nach Messwertnamen filtern. Weitere Informationen finden Sie unter Messwerte auswählen: Filtern.

Messwertname ist ungültig

Wenn Sie einen Zähler oder einen Verteilungsmesswert erstellen, wählen Sie einen Messwertnamen aus, der unter den logbasierten Messwerten in Ihrem Google Cloud-Projekt einmalig ist.

Zeichenketten mit Messwertnamen dürfen nicht länger als 100 Zeichen sein und nur die folgenden Zeichen enthalten:

  • A-Z
  • a-z
  • 0-9
  • Die Sonderzeichen _-.,+!*',()%\/.

    Durch den Schrägstrich / wird eine Hierarchie der Namensteile innerhalb des Messwertnamens angegeben. Er darf nicht das erste Zeichen des Namens sein.

Messwerte sind falsch

Sie stellen fest, dass die für einen logbasierten Messwert gemeldeten Werte manchmal von der Anzahl der Logeinträge abweichen, die im Log-Explorer gemeldet werden.

So minimieren Sie die Abweichung:

  • Achten Sie darauf, dass Anwendungen keine doppelten Protokolleinträge senden. Logeinträge gelten als Duplikate, wenn sie dieselbe timestamp und insertId haben. Im Log-Explorer werden doppelte Logeinträge automatisch unterdrückt. Bei logbasierten Messwerten wird jedoch jeder Logeintrag gezählt, der mit dem Filter für den Messwert übereinstimmt.

  • Achten Sie darauf, dass ein Logeintrag an Cloud Logging gesendet wird, wenn der Zeitstempel weniger als 24 Stunden in der Vergangenheit oder weniger als 10 Minuten in der Zukunft liegt. Logeinträge, deren Zeitstempel nicht in diesen Grenzen liegen, werden nicht in logbasierten Messwerten gezählt.

Es kann nicht ausgeschlossen werden, dass es zu doppelten Logs kommt. Wenn bei der Verarbeitung eines Logeintrags ein interner Fehler auftritt, wird von Cloud Logging ein Wiederholungsprozess aufgerufen. Der Wiederholungsvorgang kann zu einem doppelten Logeintrag führen. Wenn es doppelte Logeinträge gibt, ist der Wert eines logbasierten Messwerts möglicherweise zu hoch, da bei diesen Messwerten jeder Logeintrag gezählt wird, der mit dem Filter für den Messwert übereinstimmt.

Labelwerte werden abgeschnitten

Werte für benutzerdefinierte Labels dürfen 1.024 Byte nicht überschreiten.

Benutzerdefinierter Protokollmesswert kann nicht gelöscht werden

Sie versuchen, einen benutzerdefinierten logbasierten Messwert über die Google Cloud Console zu löschen. Die Löschanfrage schlägt fehl und im Löschdialogfeld wird die Fehlermeldung There is an unknown error while executing this operation angezeigt.

Versuchen Sie Folgendes, um dieses Problem zu beheben:

  • Aktualisieren Sie die Seite Logbasierte Messwerte in der Google Cloud Console. Die Fehlermeldung wird möglicherweise aufgrund eines internen Zeitproblems angezeigt.

  • Ermitteln und löschen Sie alle Benachrichtigungsrichtlinien, die den logbasierten Messwert überwachen. Wenn Sie sich vergewissert haben, dass der logbasierte Messwert nicht von einer Benachrichtigungsrichtlinie überwacht wird, löschen Sie ihn. Logbasierte Messwerte, die von einer Benachrichtigungsrichtlinie überwacht werden, können nicht gelöscht werden.