Google Distributed Cloud (nur Software) für VMware bietet mehrere Optionen für das Cluster-Logging und -Monitoring, darunter cloudbasierte verwaltete Dienste, Open-Source-Tools und validierte Kompatibilität mit kommerziellen Lösungen von Drittanbietern. In diesem Dokument werden diese Optionen beschrieben. Außerdem erhalten Sie grundlegende Informationen zur Auswahl der richtigen Lösung für Ihre Umgebung.
Optionen für Google Distributed Cloud
Sie haben mehrere Logging- und Monitoring-Optionen für Ihre Google Distributed Cloud:
- Cloud Logging und Cloud Monitoring
- Google Cloud Managed Service for Prometheus (Vorschau)
- Validierte Konfigurationen mit Lösungen von Drittanbietern
Cloud Logging und Cloud Monitoring
Google Cloud Observability (ehemals Stackdriver) ist die integrierte Beobachtbarkeitslösung für Google Cloud. Sie bietet eine vollständig verwaltete Logging-Lösung, Messwerterfassung, Monitoring, Dashboards und Benachrichtigungen. Cloud Monitoring überwacht Google Distributed Cloud-Cluster ähnlich wie cloudbasierte GKE-Cluster.
Sie können die clusterinternen Agents für den Umfang des Monitoring und Logging sowie die Ebene der erfassten Messwerte konfigurieren:
- Der Umfang des Logging und Monitoring kann nur auf Systemkomponenten (Standardeinstellung) oder auf Systemkomponenten und Anwendungen festgelegt werden
- Die Ebene der erfassten Messwerte kann für einen optimierten Satz von Messwerten oder für vollständige Messwerte konfiguriert werden
Weitere Informationen finden Sie in diesem Dokument unter Logging- und Monitoring-Agents für Anthos Clusters on VMware konfigurieren.
Cloud Logging und Cloud Monitoring sind die ideale Lösung für Kunden, die eine einzige, einfach zu konfigurierende und leistungsstarke cloudbasierte Beobachtbarkeitslösung benötigen. Wir empfehlen dringend Logging und Monitoring, wenn Sie Arbeitslasten nur in der Google Distributed Cloud oder in GKE und der Google Distributed Cloud ausführen. Für Anwendungen mit Komponenten, die in Google Distributed Cloud und in einer herkömmlichen lokalen Infrastruktur ausgeführt werden, sind andere Lösungen für eine End-to-End-Ansicht dieser Anwendungen zu empfehlen.
Weitere Informationen zur Architektur, Konfiguration und dazu, welche Daten standardmäßig für Google Distributed Cloud in Ihrem Google Cloud-Projekt repliziert werden, finden Sie im Abschnitt Funktionsweise von Logging und Monitoring für Google Distributed Cloud.
Weitere Informationen zu Cloud Logging finden Sie in der Dokumentation zu Cloud Logging.
Weitere Informationen zu Cloud Monitoring finden Sie in der Dokumentation zu Cloud Monitoring.
Drittanbieterlösungen
Google hat mit mehreren Logging- und Monitoring-Lösungs-Drittanbietern zusammengearbeitet, damit ihre Produkte mit Google Distributed Cloud kompatibel sind. Dazu gehören Datadog, Elastic und Splunk. Weitere validierte Drittanbieter werden in Zukunft hinzugefügt.
Weitere Informationen zur Verwendung von Drittanbieterlösungen mit Google Distributed Cloud finden Sie unter den folgenden Links:
- Logs in Google Distributed Cloud mit Splunk Connect erfassen
- Stretching Elastic’s capabilities with historical analysis, backups, and cross-cloud monitoring on Google Cloud Platform (Funktionen von Elastic um Verlaufsanalysen, Sicherungen und cloudübergreifende Überwachung auf der Google Cloud Platform erweitert)
Funktionsweise von Logging und Monitoring für Google Distributed Cloud
Logging- und Monitoring-Agents werden in jedem Cluster installiert und aktiviert, wenn Sie einen neuen Administrator- oder Nutzercluster erstellen. Die Agents erfassen Daten zu Systemkomponenten – der Umfang, den Sie konfigurieren können.
Wenn Sie die erfassten Daten in der Google Cloud Console aufrufen möchten, müssen Sie das Google Cloud-Projekt konfigurieren, in dem die Logs und Messwerte gespeichert sind, die Sie ansehen möchten.
Zu den Logging- und Monitoring-Agents in jedem Cluster gehören:
GKE-Messwert-Agent (
gke-metrics-agent
). Ein DaemonSet, das Messwerte an die Cloud Monitoring API sendet.Stackdriver Log Forwarder (
stackdriver-log-forwarder
). Ein Fluent Bit-DaemonSet, das Logs von jeder Maschine an Cloud Logging weiterleitet. Der Log Forwarder puffert die Logeinträge auf dem Knoten lokal und sendet sie bis zu vier Stunden lang noch einmal. Wenn der Zwischenspeicher voll ist oder der Log-Forwarder die Cloud Logging API länger als vier Stunden nicht erreichen kann, werden Logs gelöscht.Globaler GKE-Messwert-Agent (
gke-metrics-agent-global
). Ein Deployment, das Messwerte an die Cloud Monitoring API sendet.Metadata-Agent (
stackdriver-metadata-agent
). Ein Modul, das Metadaten für Kubernetes-Ressourcen wie Pods, Deployments, Knoten usw. an die Stackdriver Resource Metadata API sendet. Anhand dieser Daten können Sie Messwertabfragen anreichern und Abfragen nach Deployment-Name, Knotenname oder auch Kubernetes-Dienstname ausführen.kube-state-metrics: Ein Deployment, das den API-Server überwacht und Messwerte zum Status von Objekten generiert.
node-exporter: Ein DaemonSet, das Hardware- und Betriebssystemmesswerte generiert.
Mit dem folgenden Befehl können Sie alle Deployment-Agents aufrufen:
kubectl --kubeconfig CLUSTER_KUBECONFIG get deployments -l "managed-by=stackdriver" --all-namespaces
Dabei ist CLUSTER_KUBECONFIG der Pfad der kubeconfig-Datei für den Cluster.
Die Ausgabe dieses Befehls sieht so aus:
gke-metrics-agent-global 1/1 Running 0 4h31m stackdriver-metadata-agent-cluster-level 1/1 Running 0 4h31m
Mit dem folgenden Befehl können Sie alle DaemonSet-Agents aufrufen:
kubectl --kubeconfig CLUSTER_KUBECONFIG get daemonsets -l "managed-by=stackdriver" --all-namespaces
Die Ausgabe dieses Befehls sieht so aus:
gke-metrics-agent 1/1 Running 0 4h31m stackdriver-log-forwarder 1/1 Running 0 4h31m
Logging- und Monitoring-Agents für Google Distributed Cloud konfigurieren
Die mit Google Distributed Cloud installierten Agents erfassen abhängig von Ihren Einstellungen und Konfigurationen Daten zu Systemkomponenten, um Probleme mit Ihren Clustern zu warten und zu beheben.
Nur Systemkomponenten (Standardbereich)
Bei der Installation erfassen Agents Logs und Messwerte, einschließlich Leistungsdetails (z. B. CPU- und Speicherauslastung) und ähnliche Metadaten für von Google bereitgestellte Systemkomponenten. Dazu gehören alle Arbeitslasten im Administratorcluster und in Nutzerclustern Arbeitslasten in den Namespaces kube-system, gke-system, gke-connect, istio-system und config-management-system. Sie können die Agents wie in den folgenden Abschnitten beschrieben konfigurieren oder deaktivieren.
Der Umfang der erfassten Logs und Messwerte kann auch um Anwendungen erweitert werden. Anleitungen zum Aktivieren von Anwendungs-Logging und -Monitoring finden Sie unter Logging und Monitoring für Nutzeranwendungen aktivieren.
Optimierte Messwerte (Standardmesswerte)
Standardmäßig erfassen die im Cluster ausgeführten Messwert-Agents einen optimierten Satz von Container-, Kubelet- und Kube State Metrics-Messwerten und melden ihn an Google Cloud Observability (ehemals Stackdriver).
Es sind weniger Ressourcen erforderlich, um diese optimierten Messwerte zu erfassen, was die Gesamtleistung und die Skalierbarkeit verbessert. Dies ist besonders für Messwerte auf Containerebene und auf kube-Ebene wichtig, da die Anzahl der zu überwachenden Objekte sehr groß ist.
Wenn Sie optimierte Kube-State-Metrics-Messwerte deaktivieren möchten (nicht empfohlen), setzen Sie das Feld optimizedMetrics
in Ihrer benutzerdefinierten Stackdriver-Ressource auf false
. Weitere Informationen zum Ändern Ihrer benutzerdefinierten Stackdriver-Ressource finden Sie unter Stackdriver-Komponentenressourcen konfigurieren.
Alle Google Distributed Cloud-Messwerte, einschließlich der standardmäßig ausgeschlossenen Messwerte, finden Sie unter GKE Enterprise-Messwerte.
Stackdriver aktivieren und deaktivieren
Sie können Logging- und Monitoring-Agents vollständig aktivieren oder deaktivieren. Dazu aktivieren oder deaktivieren Sie die benutzerdefinierte Stackdriver-Ressource. Diese Feature befindet sich im Vorschaumodus.
Bevor Sie die Logging- und Monitoring-Agents deaktivieren, sollten Sie sich auf der Supportseite informieren, wie sich dies auf die SLAs des Google Cloud-Supports auswirkt.
Logging- und Monitoring-Agents erfassen lokal gespeicherte Daten entsprechend Ihrer Speicher- und Aufbewahrungskonfiguration. Die Daten werden in das bei der Installation angegebene Google Cloud-Projekt repliziert. Dazu wird ein Dienstkonto verwendet, das berechtigt ist, Daten in das Projekt zu schreiben. Sie können diese Agents jederzeit deaktivieren, wie zuvor beschrieben.
Sie können auch Daten verwalten und löschen, die von den Logging- und Monitoring-Agents an Cloud Logging und Cloud Monitoring gesendet wurden. Weitere Informationen finden Sie in der Dokumentation zu Cloud Monitoring.
Konfigurationsanforderungen für Logging und Monitoring
Zum Aufrufen von Cloud Logging- und Cloud Monitoring-Daten müssen Sie das Google Cloud-Projekt konfigurieren, in dem die gewünschten Logs und Messwerte gespeichert werden. Dieses Google Cloud-Projekt wird als Logging-Monitoring-Projekt bezeichnet.
Aktivieren Sie die folgenden APIs in Ihrem Logging-Monitoring-Projekt:
Weisen Sie Ihrem Logging-Monitoring-Dienstkonto in Ihrem Logging-Monitoring-Projekt die folgenden IAM-Rollen zu.
logging.logWriter
monitoring.metricWriter
stackdriver.resourceMetadata.writer
monitoring.dashboardEditor
opsconfigmonitoring.resourceMetadata.writer
Preise
Für die Systemlogs und -messwerte von GKE Enterprise fallen keine Gebühren an. Logs der Steuerungsebene, Messwerte der Steuerungsebene und eine ausgewählte Teilmenge der Kube State Metrics sind standardmäßig aktiviert für GKE-Cluster in Google Cloud, die bei der Clustererstellung in einem Projekt mit aktiviertem GKE Enterprise registriert werden. Für Logs der Steuerungsebene fallen Cloud Logging-Gebühren an, während standardmäßig aktivierte Messwerte ohne Aufpreis enthalten sind.
Eine Liste der enthaltenen GKE-Logs und -Messwerte finden Sie unter Welche Logs erfasst werden und Verfügbare Messwerte.
In einem Google Distributed Cloud-Cluster enthalten die Systemlogs und -messwerte von GKE Enterprise Folgendes:
- Logs und Messwerte aus allen Komponenten in einem Administratorcluster
- Logs und Messwerte aus Komponenten in diesen Namespaces in einem Nutzercluster:
kube-system
,gke-system
,gke-connect
,knative-serving
,istio-system
,monitoring-system
,config-management-system
,gatekeeper-system
,cnrm-system
Weitere Informationen finden Sie unter Preise für Google Cloud Observability.
Wenn Sie weitere Informationen wünschen und mehr über Guthaben für Cloud Logging-Messwerte wissen möchten, wenden Sie sich an den Vertrieb.