Auf dieser Seite finden Sie Informationen zur Fehlerbehebung für häufige Szenarien bei der Verwendung logbasierter Messwerte in Cloud Logging.
Messwerte können nicht aufgerufen oder erstellt werden
Logbasierte Messwerte gelten nur für ein einzelnes Google Cloud Projekt oder für ein Logging-Bucket innerhalb eines Google Cloud Projekts. Sie können keine logbasierten Messwerte für andere Google CloudRessourcen wie Rechnungskonten oder Organisationen erstellen. Logbasierte Messwerte werden nur für Logs im Google Cloud Projekt oder -Bucket berechnet, in dem sie empfangen wurden.
Zum Erstellen von Messwerten benötigen Sie die entsprechenden IAM-Berechtigungen (Identity and Access Management). Weitere Informationen finden Sie unter Zugriffssteuerung mit IAM: Logbasierte Messwerte.
Im Messwert fehlen Logdaten
Das Fehlen von Daten in logbasierten Messwerten kann mehrere Gründe haben:
Neue Logeinträge stimmen möglicherweise nicht mit dem Filter Ihres Messwerts überein. Logbasierte Messwerte rufen Daten aus übereinstimmenden Log-Einträgen ab, die nach der Erstellung des Messwerts empfangen wurden. In Logging werden keine Backfills mit Messwerten aus früheren Logeinträgen durchgeführt.
Neue Logeinträge enthalten möglicherweise nicht das richtige Feld oder die Daten haben vielleicht nicht das richtige Format für die Extraktion durch Ihren Verteilungsmesswert. Prüfen Sie, ob Ihre Feldnamen und regulären Ausdrücke korrekt sind.
Die Messwertzählungen sind möglicherweise verzögert. Auch wenn zählbare Logeinträge im Log-Explorer angezeigt werden, kann es bis zu 10 Minuten dauern, bis die logbasierten Messwerte in Cloud Monitoring aktualisiert werden.
Die angezeigten Logeinträge werden möglicherweise spät oder gar nicht gezählt, weil ihr Zeitstempel zu weit in der Vergangenheit oder Zukunft liegt. Wenn der Empfang eines Logeintrags mehr als 24 Stunden in der Vergangenheit oder 10 Minuten in der Zukunft liegt, wird der Logeintrag nicht im logbasierten Messwert gezählt.
Die Anzahl der spät ankommenden Einträge wird im logbasierten Messwert
logging.googleapis.com/logs_based_metrics_error_count
erfasst.Beispiel: Ein Logeintrag, der mit einem logbasierten Messwert übereinstimmt, trifft spät ein. Er hat einen
timestamp
von 14:30 Uhr am 20. Februar 2020 und einenreceivedTimestamp
von 14:45 Uhr am 21. Februar 2020. Dieser Eintrag wird nicht in den logbasierten Messwert einbezogen.Der logbasierte Messwert wurde nach dem Eintreffen von Logeinträgen erstellt, die er möglicherweise zählt. Logbasierte Messwerte werten Logeinträge aus, wenn sie in Log-Buckets gespeichert werden. Diese Messwerte werten keine Logeinträge aus, die in Logging gespeichert sind.
Der logbasierte Messwert weist Lücken in den Daten auf. Einige Datenlücken sind zu erwarten, da die Systeme, die die logbasierten Messwertdaten verarbeiten, nicht die Persistenz jedes Messwertdatenpunkts garantieren. Lücken sind in der Regel selten und von kurzer Dauer. Wenn Sie jedoch eine Benachrichtigungsrichtlinie haben, die einen logbasierten Messwert überwacht, können Lücken in den Daten zu einer falschen Benachrichtigung führen. Mit den Einstellungen, die Sie in Ihrer Benachrichtigungsrichtlinie verwenden, lässt sich diese Wahrscheinlichkeit verringern.
Beispiel: Alle fünf Minuten wird ein Logeintrag vom Typ „Heartbeat“ geschrieben und ein logbasierter Messwert zählt die Anzahl der Logeinträge vom Typ „Heartbeat“. In einer Benachrichtigungsrichtlinie werden die Zählungen in einem Fünf-Minuten-Intervall summiert und Sie werden benachrichtigt, wenn die Summe kleiner als 1 ist. Wenn in der Zeitreihe ein Datenpunkt fehlt, wird in der Benachrichtigungsrichtlinie ein synthetischer Wert eingefügt, der ein Duplikat des letzten Beispiels ist und höchstwahrscheinlich null ist. Anschließend wird die Bedingung ausgewertet. Daher kann schon ein einzelner fehlender Datenpunkt dazu führen, dass der summierte Wert null ist. In diesem Fall wird durch diese Benachrichtigungsrichtlinie eine Benachrichtigung gesendet.
Um das Risiko einer falschen Benachrichtigung zu verringern, konfigurieren Sie die Richtlinie so, dass mehrere „Heartbeat“-Logeinträge gezählt werden, nicht nur einer.
Der Ressourcentyp ist in Cloud Monitoring "nicht definiert"
Einige überwachte Cloud Logging-Ressourcentypen werden nicht direkt überwachten Cloud Monitoring-Ressourcentypen zugeordnet. Wenn Sie beispielsweise zuerst eine Benachrichtigungsrichtlinie oder ein Diagramm aus einem logbasierten Messwert erstellen, sehen Sie möglicherweise, dass der Ressourcentyp „nicht definiert“ ist.
Der überwachte Ressourcentyp ist entweder global
oder einem anderen überwachten Ressourcentyp in Cloud Monitoring zugeordnet. In den Zuordnungen für reine Logging-Ressourcen erfahren Sie, welchen überwachten Ressourcentyp Sie auswählen müssen.
Labels in einer Benachrichtigung werden nicht aufgelöst
Sie erstellen einen logbasierten Messwert und dann eine Benachrichtigungsrichtlinie, um diesen logbasierten Messwert zu überwachen.
Im Dokumentationsfeld Ihrer Benachrichtigungsrichtlinie verweisen Sie auf die extrahierten Labels mit einer Variablen im Format ${log.extracted_label.KEY}
, wobei KEY
der Name ist, den Sie dem extrahierten Label gegeben haben. Das Label wird in der Benachrichtigung nicht aufgelöst.
Führen Sie einen der folgenden Schritte aus, um das Problem zu beheben:
Entfernen Sie den extrahierten Labelinhalt aus der Dokumentation. Benachrichtigungsrichtlinien, die logbasierte Messwerte überwachen, können keine Daten aus Logeinträgen extrahieren.
Logbasierte Benachrichtigung erstellen Mit diesen Benachrichtigungsrichtlinien können Daten aus dem Logeintrag extrahiert werden, der die Benachrichtigungsrichtlinie auslöst.
Vorfälle werden nicht erstellt oder sind falsch positiv
Sie können falsch-positive Vorfälle erhalten oder Situationen, in denen durch das Monitoring keine Vorfälle aus logbasierten Messwerten erstellt werden, da der Ausrichtungszeitraum für die Benachrichtigungsrichtlinie zu kurz ist. In den folgenden Szenarien können falsch positive Ergebnisse auftreten:
- Wenn eine Benachrichtigungsrichtlinie weniger als-Logik verwendet.
- Wenn eine Benachrichtigungsrichtlinie auf einer Prozentilbedingung für einen Verteilungsmesswert basiert.
- Wenn es eine Lücke bei den Messwertdaten gibt.
Falsch-positive Vorfälle können auftreten, weil Logeinträge ggf. zu spät an Logging gesendet wurden. Beispielsweise können die Logfelder timestamp
und receiveTimestamp
in einigen Fällen ein Delta von Minuten aufweisen. Wenn Logging Logs in Log-Buckets speichert, gibt es außerdem eine inhärente Verzögerung zwischen dem Zeitpunkt, an dem die Logeinträge erzeugt werden, und dem Zeitpunkt, an dem Logging sie erhält. Das bedeutet, dass Logging bis zu einem späteren Zeitpunkt nach der Generierung der Logeinträge möglicherweise nicht die Gesamtzahl für einen bestimmten Logeintrag aufweist. Aus diesem Grund kann eine Benachrichtigungsrichtlinie mit weniger als-Logik oder basierend auf einer Perzentilbedingung für Verteilungsmesswerte zu einer falsch-positiven Benachrichtigung führen: Nicht alle Logeinträge wurden bereits berücksichtigt.
Allerdings unterliegen logbasierte Messwerte Eventual Consistency, da ein Logeintrag, der mit einem logbasierten Messwert übereinstimmt, an Logging mit einem timestamp
gesendet werden kann, der deutlich älter oder neuer ist als der Log-receiveTimestamp
.
Der logbasierte Messwert bedeutet, dass Logeinträge mit älteren Zeitstempeln empfangen werden können, nachdem vorhandene Logeinträge mit demselben Zeitstempel bereits von Logging empfangen wurden. Daher muss der Messwert aktualisiert werden.
Damit Benachrichtigungen auch bei pünktlichen Daten korrekt bleiben, empfehlen wir, den Ausrichtungszeitraum für die Bedingung auf mindestens 10 Minuten festzulegen. Dieser Wert sollte insbesondere groß genug sein, damit mehrere Logeinträge, die Ihrem Filter entsprechen, gezählt werden. Wenn ein logbasierter Messwert beispielsweise „Heartbeat“-Logeinträge zählt, die alle N
Minuten erwartet werden, legen Sie den Ausrichtungszeitraum auf 2N
Minuten oder 10 Minuten fest, je nachdem, welcher Wert größer ist:
Wenn Sie die Google Cloud Console verwenden, legen Sie den Abgleichszeitraum im Menü Rolling window (Gleitendes Fenster) fest.
Wenn Sie die API verwenden, legen Sie den Abgleichszeitraum mit dem Feld
aggregations.alignmentPeriod
der Bedingung fest.
Messwert enthält zu viele Zeitachsen
Die Anzahl der Zeitachsen in einem Messwert hängt von der Anzahl der unterschiedlichen Kombinationen von Labelwerten ab. Die Anzahl der Zeitachsen wird als Kardinalität des Messwerts bezeichnet und darf 30.000 nicht überschreiten.
Da Sie eine Zeitachse für jede Kombination von Labelwerten generieren können, ist es nicht schwer, 30.000 Zeitachsen zu überschreiten,wenn Sie ein oder mehrere Labels mit einer hohen Anzahl von Werten haben. Sie sollten Messwerte mit hoher Kardinalität vermeiden.
Wenn die Kardinalität eines Messwerts zunimmt, kann der Messwert gedrosselt werden und einige Datenpunkte werden möglicherweise nicht in den Messwert geschrieben. Diagramme, die den Messwert anzeigen, können aufgrund der hohen Anzahl von Zeitachsen, die das Diagramm verarbeiten muss, langsam geladen werden. Möglicherweise fallen auch Kosten für API-Aufrufe zur Abfrage von Zeitachsendaten an. Weitere Informationen finden Sie im Abschnitt zu Cloud Monitoring auf der Seite Preise für Google Cloud Observability.
So vermeiden Sie es, Messwerte mit hoher Kardinalität zu erstellen:
Überprüfen Sie, ob die Labelfelder und regulären Extrahiererausdrücke mit Werten übereinstimmen, die eine beschränkte Kardinalität haben.
Speichern Sie beispielsweise keine Größen, Anzahlen oder Zeiträume in Labels. Speichern Sie auch keine Felder wie URLs, IP-Adressen oder eindeutige IDs, da diese alle zu einer großen Anzahl von Zeitreihen führen können.
Vermeiden Sie das Extrahieren von Textnachrichten, die sich unbegrenzt wie Labelwerte ändern können.
Vermeiden Sie das Extrahieren numerischer Werte mit unbegrenzter Kardinalität.
Extrahieren Sie nur Werte von Labels mit bekannter Kardinalität, z. B. Statuscodes mit einer Reihe bekannter Werte.
Mit diesen logbasierten Systemmesswerten können Sie die Auswirkungen des Hinzufügens oder Entfernens von Labels auf die Kardinalität Ihres Messwerts messen:
logging.googleapis.com/metric_throttled
logging.googleapis.com/time_series_count
logging.googleapis.com/metric_label_throttled
logging.googleapis.com/metric_label_cardinality
Wenn Sie diese Messwerte prüfen, können Sie die Ergebnisse weiter nach Messwertnamen filtern. Weitere Informationen finden Sie unter Messwerte auswählen: Filtern.
Messwertname ist ungültig
Wenn Sie einen Zähler oder einen Verteilungsmesswert erstellen, wählen Sie einen Messwertnamen aus, der unter den logbasierten Messwerten in Ihrem Google Cloud -Projekt einmalig ist.
Zeichenketten mit Messwertnamen dürfen nicht länger als 100 Zeichen sein und nur die folgenden Zeichen enthalten:
A
-Z
a
-z
0
-9
Die Sonderzeichen
_
-
.
,
+
!
*
'
,
(
)
%
\/
.Durch den Schrägstrich
/
wird eine Hierarchie der Namensteile innerhalb des Messwertnamens angegeben. Er darf nicht das erste Zeichen des Namens sein.
Messwerte sind nicht korrekt
Sie stellen fest, dass die für einen logbasierten Messwert gemeldeten Werte manchmal von der Anzahl der vom Log-Explorer gemeldeten Logeinträge abweichen.
So minimieren Sie die Abweichung:
Achten Sie darauf, dass Anwendungen keine doppelten Logeinträge senden. Logeinträge gelten als Duplikate, wenn sie denselben
timestamp
undinsertId
haben. Im Log-Explorer werden doppelte Logeinträge automatisch unterdrückt. Bei logbasierten Messwerten wird jedoch jeder Logeintrag gezählt, der dem Filter für den Messwert entspricht.Achten Sie darauf, dass ein Logeintrag an Cloud Logging gesendet wird, wenn der Zeitstempel weniger als 24 Stunden in der Vergangenheit oder weniger als 10 Minuten in der Zukunft liegt. Logeinträge, deren Zeitstempel nicht innerhalb dieser Grenzen liegen, werden von logbasierten Messwerten nicht berücksichtigt.
Es kann immer wieder zu doppelten Logs kommen. Wenn bei der Verarbeitung eines Logeintrags ein interner Fehler auftritt, wird von Cloud Logging ein Wiederholungsversuch gestartet. Der Wiederholungsversuch kann zu einem doppelten Logeintrag führen. Wenn doppelte Logeinträge vorhanden sind, kann der Wert eines logbasierten Messwerts zu groß sein, da mit diesen Messwerten jeder Logeintrag gezählt wird, der dem Filter für den Messwert entspricht.
Labelwerte werden abgeschnitten
Werte für benutzerdefinierte Labels dürfen 1.024 Byte nicht überschreiten.
Benutzerdefinierter Log-Messwert kann nicht gelöscht werden
Sie versuchen, einen benutzerdefinierten logbasierten Messwert über die Google Cloud -Konsole zu löschen.
Die Löschanfrage schlägt fehl und im Löschdialogfeld wird die Fehlermeldung There is an unknown error while executing this operation
angezeigt.
Versuchen Sie Folgendes, um dieses Problem zu beheben:
Aktualisieren Sie in der Google Cloud -Console die Seite Logbasierte Messwerte. Die Fehlermeldung wird möglicherweise aufgrund eines internen Zeitproblems angezeigt.
Suchen Sie nach Benachrichtigungsrichtlinien, die den logbasierten Messwert überwachen, und löschen Sie sie. Nachdem Sie bestätigt haben, dass der logbasierte Messwert nicht von einer Benachrichtigungsrichtlinie überwacht wird, löschen Sie ihn. Logbasierte Messwerte, die von einer Benachrichtigungsrichtlinie überwacht werden, können nicht gelöscht werden.