Auf dieser Seite wird erläutert, wie Sie unter- und überbereitgestellte Google Kubernetes Engine-Cluster (GKE) identifizieren. GKE bietet Statistiken und Empfehlungen für Szenarien zur Kostenoptimierung wie überdimensionierte und inaktive Cluster sowie für Szenarien zur Verbesserung der Zuverlässigkeit wie unterdimensionierte Cluster. GKE bietet entsprechende Empfehlungen zum Hoch- oder Herunterskalieren oder Löschen der Cluster. Informationen zu inaktiven Clustern finden Sie unter Inaktive GKE-Cluster identifizieren.
Nachdem Sie überprüft haben, ob die identifizierten Cluster von der Empfehlung zum Hoch- oder Herunterskalieren profitieren würden, können Sie die empfohlene Änderung vornehmen, um Kosten zu sparen oder die Zuverlässigkeit Ihres Clusters zu erhöhen. Wenn möglich, enthält die Empfehlung auch die prognostizierten monatlichen Einsparungen oder Kosten. Weitere Informationen finden Sie unter Kosten- oder Einsparungsschätzungen verstehen.
GKE bietet diese Informationen nicht für Autopilot-Cluster, die minimale Betriebskosten verursachen, da Sie nur für die Ressourcen bezahlen, die von Ihren Arbeitslasten angefordert werden. Weitere Informationen finden Sie unter Autopilot-Preise.
GKE überwacht Ihre Cluster und liefert Ihnen mit Active Assist Hinweise dazu, wie Sie Ihre Nutzung optimieren können. Dieser Dienst bietet Recommender, die Statistiken und Empfehlungen zur Verwendung von Ressourcen in Google Cloudgenerieren. Weitere Informationen zum Verwalten von Statistiken und Empfehlungen finden Sie unter Nutzung von GKE mit Statistiken und Empfehlungen optimieren.
Informationen und Empfehlungen zu unter- und überdimensionierten Clustern erhalten
GKE stellt diese Statistiken und Empfehlungen an den folgenden Stellen in der Google Cloud Console bereit:
- Auf der Seite Kubernetes-Cluster an den folgenden Stellen:
- Klicken Sie in der Liste Kubernetes-Cluster in der Spalte Benachrichtigungen für die entsprechenden Cluster
- Benachrichtigungsbanner auf der Seite Cluster für einen bestimmten Cluster
- FinOps-Hub
Die Empfehlungen haben auf der Seite Kubernetes-Cluster die folgenden Titel:
- Überdimensionierte Cluster: „Clusterressourcen zur Kostensenkung verringern“
- Unterprovisionierte Cluster: „Erhöhen Sie die Clusterressourcen, um die Zuverlässigkeit zu verbessern.“
Sie können diese Statistiken und Empfehlungen auch über die Google Cloud CLI oder die Recommender API mit den Untertypen CLUSTER_UNDERPROVISIONED
und CLUSTER_OVERPROVISIONED
abrufen.
Folgen Sie der Anleitung zum Aufrufen von Informationen und Empfehlungen.
Nachdem Sie unter- oder überdimensionierte Cluster identifiziert haben, lesen Sie die Hinweise zur Anpassung der Größe von Clustern.
So identifiziert GKE unter- und überprovisionierte Cluster
In der folgenden Tabelle werden die Signale beschrieben, die GKE verwendet, um unter- und überbereitgestellte Cluster zu identifizieren, die skaliert werden können, sowie der Schwellenwert für jedes Signal. Außerdem wird in dieser Tabelle die empfohlene Maßnahme für dieses Szenario aufgeführt.
Subtyp | Signal | Beobachtungszeitraum | Details | Empfehlung |
---|---|---|---|---|
CLUSTER_UNDERPROVISIONED |
Die CPU- oder Arbeitsspeichernutzung ist hoch | Letzte 30 Tage | Ein GKE-Cluster ist unterdimensioniert, wenn sowohl die CPU- als auch die Arbeitsspeicherauslastung in den letzten 30 Tagen durchschnittlich mehr als 80% pro Stunde betragen. | Cluster hochskalieren, um die Zuverlässigkeit zu erhöhen |
CLUSTER_OVERPROVISIONED |
Geringe CPU- und Arbeitsspeichernutzung | Letzte 30 Tage | Ein GKE-Cluster ist überdimensioniert, wenn die durchschnittliche CPU- und Arbeitsspeicherauslastung in den letzten 30 Tagen jede Stunde zwischen 7% und 20% lag. | Cluster herunterskalieren, um Kosten zu sparen |
GKE sendet keine Empfehlungen für Cluster, die vor weniger als 30 Tagen erstellt wurden.
Kostenschätzungen oder geschätzte Einsparungen
Wenn möglich, enthält die Empfehlung von GKE eine Schätzung der monatlichen Kosten oder Einsparungen, wenn Sie die Größe des Clusters anpassen. Diese Schätzung ergibt sich aus den Clusterkosten der letzten 30 Tage.
Geschätzte Kosten oder Einsparungen sind Prognosen, die auf früheren Ausgaben basieren. Sie sind keine Garantie für zukünftige Kosten oder Einsparungen.
Damit Sie diese Schätzungen sehen können, benötigen Sie die erforderliche billing.accounts.getSpendingInformation
-Berechtigung, um Ausgabeninformationen abzurufen. Weitere Informationen finden Sie unter Cloud Billing-Zugriff.
Weitere Informationen zu den Kosten aller Ihrer GKE-Cluster, einschließlich einer detaillierteren Aufschlüsselung nach Namespaces und Arbeitslasten, finden Sie unter Wichtige Ausgabeninformationen für Ihre GKE-Ressourcenzuordnung und Clusterkosten abrufen.
Weitere Informationen zu den Kosten für die Ausführung eines GKE-Cluster finden Sie unter GKE-Preise.
Überlegungen zur Größenanpassung von Clustern
Bevor Sie einer Empfehlung zum Skalieren eines Clusters nachkommen, sollten Sie Folgendes berücksichtigen:
- Sehen Sie sich die Ressourcennutzung von Anwendungen an, die in Ihrem Cluster ausgeführt werden, um zu sehen, wie sie sich verhalten und ob sie mehr oder weniger CPU und Arbeitsspeicher als erwartet verwenden. Eine Anleitung finden Sie unter Ressourcenanfragen analysieren.
- Bei Batchverarbeitungsarbeitslasten wird die Auslastung von Clusterressourcen aus Kostengründen möglicherweise bewusst hoch gehalten. Wenn die zugewiesenen Clusterressourcen für die im Cluster ausgeführten Batchjobs ausreichen, müssen Sie den stark ausgelasteten Cluster, der als unterdimensioniert identifiziert wurde, nicht hochskalieren.
Empfehlung zur Anpassung der Größe eines Clusters umsetzen
Im Folgenden erfahren Sie, wie Sie die Größe eines Clusters anpassen können, um die Ressourcennutzung zu optimieren.
Unterdimensionierten Cluster richtig dimensionieren
Um die Empfehlung zur Minimierung des Risikos von Zuverlässigkeitsproblemen durch die richtige Dimensionierung eines unterdimensionierten Clusters umzusetzen, müssen Sie die Ressourcen des Clusters erhöhen. Dazu können Sie beispielsweise folgende Aktionen ausführen:
- Aktivieren Sie Cluster Autoscaler und automatische Knotenbereitstellung oder passen Sie die Einstellungen an, um eine stärkere Aufskalierung zu ermöglichen.
- Sie können Ihren Cluster horizontal skalieren, indem Sie die Anzahl der Knoten erhöhen. Folgen Sie der Anleitung, um horizontal zu skalieren, indem Sie die Knotenzahl ändern.
- Wählen Sie einen größeren Maschinentyp für Ihre Knotenpools aus. Folgen Sie der Anleitung zum vertikalen Skalieren durch Ändern der Knotenmaschinenattribute.
- Überwachen und prüfen Sie die CPU- und Arbeitsspeicherressourcennutzung von Anwendungen, die in Ihrem Cluster ausgeführt werden. Prüfen Sie, ob Sie Anwendungen herunterskalieren können. Eine Anleitung zum Überwachen der Ressourcennutzung finden Sie unter Ressourcenanfragen analysieren.
Wenn Sie diese Empfehlung umsetzen, bleibt Ihr Cluster zuverlässig, da er über die entsprechende Menge an Ressourcen für seine Anwendungen verfügt.
Größe eines überdimensionierten Clusters anpassen
Wenn Sie die Empfehlung umsetzen möchten, Kosten durch die Anpassung der Größe eines überdimensionierten Clusters zu sparen, müssen Sie die Ressourcen des Clusters verringern. Passen Sie die CPU- und Arbeitsspeicherzuweisungen des Clusters an Ihre Arbeitslastanforderungen an. Dazu haben Sie folgende Möglichkeiten:
- Passen Sie Cluster Autoscaler und die automatische Knotenbereitstellung an, um nicht ausgelastete Ressourcen stärker herunterzuskalieren.
- Sie können Ihren Cluster horizontal herunterskalieren, indem Sie die Anzahl der Knoten verringern. Folgen Sie der Anleitung, um horizontal zu skalieren, indem Sie die Knotenzahl ändern.
- Wählen Sie einen kleineren Maschinentyp für Ihre Knotenpools aus. Folgen Sie der Anleitung, um vertikal zu skalieren, indem Sie die Knotenmaschinenattribute ändern.
- Überwachen und prüfen Sie die CPU- und Arbeitsspeicherressourcennutzung von Anwendungen, die in Ihrem Cluster ausgeführt werden. Prüfen Sie, ob Sie Anwendungen hochskalieren können. Eine Anleitung zum Überwachen der Ressourcennutzung finden Sie unter Ressourcenanfragen analysieren.
Wenn Sie diese Empfehlung umsetzen, verwenden Sie nicht mehr Ressourcen als für die Ausführung der Anwendungen Ihres Clusters erforderlich sind.
Nächste Schritte
- Kostenbezogene Optimierungsmesswerte ansehen
- Kostensenkung durch Herunterskalieren von GKE-Clustern außerhalb der Spitzenzeiten
- Nutzung von GKE mit Statistiken und Empfehlungen optimieren
- Best Practices zum Ausführen kostenoptimierter Kubernetes-Anwendungen in GKE
- 5 GKE-Funktionen zur Optimierung Ihrer Cluster