In diesem Leitfaden wird beschrieben, wie Sie sich auf Kapazitätsspitzen und hohe Zugriffszahlen vorbereiten, damit Sie Ihre Dienste mit minimaler oder gar keiner Ausfallzeit und ohne Leistungseinbußen oder Beeinträchtigungen der Nutzerfreundlichkeit bereitstellen können.
Beim Verwalten von Ereignissen in der Cloud gibt es drei wichtige Phasen:
- Vorbereitung: Führen Sie Aktivitäten und Aufgaben aus, um sich auf die Veranstaltung vorzubereiten, einschließlich einer Architekturüberprüfung, Kapazitätsplanung und Reservierungen.
- Ausführung: Beobachten Sie das Ereignis genau und reagieren Sie entsprechend.
- Analyse: Analysieren Sie nach der Veranstaltung, was gut funktioniert hat, was nicht und wie Sie zukünftige Veranstaltungen verbessern können.
In diesem Leitfaden liegt der Schwerpunkt auf der Vorbereitungsphase.
Checkliste
Führen Sie die folgenden Aufgaben aus, um sich auf ein Spitzenkapazitätsereignis vorzubereiten:
Klicken Sie auf Anleitung, um eine detaillierte Anleitung für diese Aufgabe direkt in der Google Cloud Console aufzurufen.
Hinweise
Je nachdem, welches Customer Care-Supportpaket Sie erworben haben, sollten Sie sich mit den verfügbaren Diensten zur Ereignisbereitschaft vertraut machen:
Erweiterter Support: Mit dem Support bei geplanten Ereignissen können Sie die Bereitschaft für Ihre Veranstaltungen, Einführungen und Migrationen optimieren. Dieser Mehrwertdienst deckt kritische Phasen kurzfristiger digitaler Ereignisse mit hohem Traffic ab, z. B. Neueröffnungen, Produkteinführungen oder Datenmigrationen.
Premium-Support: Sie können den Ereignisverwaltungsdienst für geplante Spitzenereignisse wie eine Produkteinführung oder ein wichtiges Verkaufsereignis nutzen. Bei diesem Dienst arbeiten Customer Care-Partner mit Ihnen zusammen, um einen Plan zu erstellen, Sie während des Ereignisses zu begleiten und Sie bei Folgendem zu unterstützen:
- Systeme auf wichtige Momente und hohe Arbeitslasten vorbereiten
- Notfalltests ausführen, um potenzielle Probleme proaktiv zu beheben
- Entwicklung und Implementierung eines schnelleren Pfads zur Lösung, um die Auswirkungen möglicher Probleme zu reduzieren
Nach dem Ereignis arbeitet Ihr Technical Account Manager (TAM) mit Ihnen zusammen, um die Ergebnisse zu prüfen und Empfehlungen für zukünftige Ereignisse zu geben. Wenden Sie sich an Ihren TAM, um loszulegen oder weitere Informationen zu erhalten.
Best Practices für die Ereignisverwaltung
Sie sollten bestimmte Best Practices für die Ereignisverwaltung kennen und befolgen:
Planung des Ereignisses im Detail: In der Vorbereitungsphase für ein Ereignis mit Spitzenkapazität sollten Sie sich an Ihr Account-Team oder TAM wenden, um Ihre Architektur zu überprüfen, Diagramme, Zeitpläne und Checklisten für die Einführung zu erstellen, Dienstkontingente basierend auf Ihrem erwarteten Traffic-Profil zu prüfen und die Gesamtauswirkungen auf Ihre Projekte zu ermitteln.
Während der Ausführung beobachten und reagieren: Wenn die Hauptsaison oder das Einführungsereignis beginnt, müssen Sie die Aktivitäten genau beobachten und bei Bedarf reagieren. Wenn Probleme auftreten, ist ein klar definierter Prozess für das Vorfallmanagement und die Eskalation wichtig, um den Aufwand und die Zeit für die Behebung des Problems zu reduzieren.
Analyse prüfen und dokumentieren: Wenn die Spitzensaison oder das Einführungsereignis vorbei ist, sollten Sie das Ereignis prüfen und analysieren. Dokumentieren Sie die gewonnenen Erkenntnisse, damit Sie sie auf das nächste wichtige Ereignis anwenden können.
Weitere Informationen finden Sie unter Best Practices für die Ereignisverwaltung.
Entsprechende Kapazität für Ihre Veranstaltung anfordern und sichern
Ein wichtiger Bestandteil der Vorbereitungsphase ist die Kapazitätsplanung. Dabei ermitteln Sie die Menge der erforderlichen Cloud-Ressourcen, damit Ihre Arbeitslasten effizient ausgeführt werden können. Achten Sie bei der Vorbereitung auf ein Ereignis mit hohem Traffic oder eine Hochsaison darauf, dass Ihre Kontingente Ihren Ressourcenanforderungen entsprechen, damit es nicht zu unerwarteten Fehlern kommt. Weitere Informationen finden Sie unter Kapazität für Ihre Veranstaltung sichern.
Kapazitätsplaner verwenden
Mit dem Kapazitätsplaner können Sie die bisherige und prognostizierte Nutzung Ihrer VM-Instanzen (virtuelle Maschine), nichtflüchtigen Volumes und GPUs abrufen. Außerdem können Sie Reservierungen ansehen, Ressourcen im Voraus reservieren, die Kontingentlimits Ihres Projekts verwalten und automatische Anfragen zur Kontingenterhöhung einrichten. Weitere Informationen finden Sie unter Nutzungs- und Prognosedaten im Kapazitätsplaner ansehen.
Rufen Sie in der Google Cloud Console die Seite Kapazitätsplaner auf.
Wählen Sie in der Symbolleiste der Console ein Projekt, einen Ordner oder eine Organisation aus.
Wählen Sie den Typ der Compute Engine-Ressource aus, für die Sie Nutzungsdaten aufrufen möchten:
Wenn Sie die Nutzungsdaten Ihrer VMs aufrufen möchten, klicken Sie auf den Tab Virtuelle Maschine, sofern er nicht bereits ausgewählt ist.
Wenn Sie die Nutzungsdaten Ihrer nichtflüchtigen Speicher-Volumes aufrufen möchten, klicken Sie auf den Tab Speicher.
Wenn Sie die Nutzungsdaten Ihrer GPUs aufrufen möchten, klicken Sie auf den Tab GPU.
Sie können Elemente filtern, um verschiedene Datenvisualisierungen für die Nutzungs- und Prognosedaten der Ressource zu sehen.
Kontingentanpassung aktivieren
Die Kontingentanpassung beobachtet Ihren Ressourcenverbrauch und sendet proaktiv Anfragen zur Kontingentanpassung in Ihrem Namen, sodass Sie keine manuellen Anfragen stellen müssen. Weitere Informationen finden Sie unter Funktionsweise des Kontingentanpassers.
Öffnen Sie in der Google Cloud Console die Seite IAM und Verwaltung > Kontingente und Systemlimits.
Klicken Sie auf den Tab Konfigurationen.
Wenn Sie den Kontingentsregler aktivieren möchten, klicken Sie auf den Schalter Aktivieren.
Wenn in der Spalte Status Aktiviert angezeigt wird, überwacht die Kontingentanpassung Ihre Nutzung und sendet Anfragen zur Kontingentanpassung, wenn die Ressourcennutzung den Kontingentwert erreicht.
Kontingentanpassung beantragen
Wenn Ihre Kontingente nicht ausreichen, können Sie eine Kontingentanpassung beantragen. Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten.
Öffnen Sie in der Google Cloud Console die Seite IAM und Verwaltung > Kontingente und Systemlimits.
Klicken Sie das Kästchen neben dem Kontingent an, das Sie aktualisieren möchten.
Optional können Sie auch über das Feld
Filter nach einem Kontingent suchen.Klicken Sie auf
Bearbeiten, um den Bereich Kontingentänderungen aufzurufen.Geben Sie im Feld Neuer Wert den gewünschten Kontingentwert ein. Einige Kontingentwerte haben eine Maßeinheit. Wählen Sie in diesem Fall in der nebenstehenden Liste die gewünschte Einheit aus.
Wenn Sie eine Meldung erhalten, dass Sie die Kontingentüberschreibung entfernen, wenn Sie ein Kontingent anfordern, das über der Überschreibung liegt, setzen Sie ein Häkchen in das Kästchen, um fortzufahren, und wählen Sie dann Höheres Kontingent beantragen aus.
Geben Sie im Feld Beschreibung der Anfrage eine Beschreibung ein und klicken Sie dann auf Fertig.
Klicken Sie auf Weiter und geben Sie Ihre Kontaktdaten an.
Klicken Sie auf Anfrage senden.
Wenn Ihre Anfrage abgelehnt wird, können Sie eine Kontingenterhöhung anfordern, indem Sie eine Supportanfrage erstellen oder sich an Ihr Account-Management-Team oder Ihren TAM wenden.
Reservierung erstellen
Mit Reservierungen sorgen Sie dafür, dass die Compute Engine-Ressourcen verfügbar sind, um VMs mit derselben Hardware (Arbeitsspeicher und vCPUs) und optionalen Ressourcen (GPUs und lokale SSD-Laufwerke) zu erstellen, wann immer Sie sie benötigen.
Eine On-Demand-Reservierung wird zur Zeit der Anforderung bereitgestellt, sofern die angeforderte Kapazität verfügbar ist. Mit einer zukünftigen Reservierung können Sie Kapazitäten im Voraus anfordern. Wir empfehlen Ihnen, zukünftige Reservierungen rechtzeitig vor Ihrem Event zu buchen. Weitere Informationen finden Sie unter Zonale Reservierungen von Compute Engine-Ressourcen.
On-Demand-Reservierung für ein einzelnes Projekt erstellen
Öffnen Sie in der Google Cloud Console die Seite Reservierungen.
Klicken Sie auf dem Tab On-Demand-Reservierungen (Standard) auf
Reservierung erstellen.Die Seite Reservierung erstellen wird geöffnet.
Geben Sie einen Namen für die Reservierung ein.
Wählen Sie die Region und die Zone aus, in der Sie Ressourcen reservieren möchten.
Wählen Sie als Freigabetyp die Option Lokal aus, falls sie noch nicht ausgewählt ist.
Wenn Sie zulassen möchten, dass eine Reservierung von GPU-VMs von benutzerdefinierten Trainingsjobs oder Vorhersagejobs in Vertex AI genutzt wird, wählen Sie im Abschnitt Google Cloud-Dienste die Option Reservierung freigeben aus.
Wählen Sie eine Option für Mit VM-Instanz verwenden aus:
Damit übereinstimmende VMs diese Reservierung automatisch verwenden können, wählen Sie Reservierung automatisch verwenden aus, falls diese Option noch nicht ausgewählt ist.
Wenn Sie die Ressourcen der Reservierung nur zum Erstellen übereinstimmender VMs verbrauchen möchten, die ausdrücklich namentlich auf diese Reservierung abzielen, klicken Sie auf Spezifische Reservierung auswählen.
Geben Sie die Anzahl der VM-Instanzen ein, die Sie reservieren möchten.
Führen Sie im Abschnitt Maschinenkonfiguration die folgenden Schritte aus:
Wählen Sie Instanzvorlage verwenden aus, um die Attribute Ihrer VMs aus einer vorhandenen Instanzvorlage anzugeben.
Geben Sie eine Instanzvorlage an. Wenn Sie eine regionale Vorlage auswählen, können Sie Ressourcen nur in dieser Region reservieren.
Wenn die Reservierung zu einer bestimmten Uhrzeit automatisch gelöscht werden soll, klicken Sie das Kästchen Automatische Löschung aktivieren an. Das automatische Löschen von Reservierungen kann nützlich sein, um unnötige Gebühren zu vermeiden, wenn Sie die Reservierung nicht mehr nutzen.
Klicken Sie zum Erstellen der Reservierung auf Erstellen.
Die Seite Reservierungen wird geöffnet. Das Erstellen der Reservierung kann bis zu einer Minute dauern.
Zukünftige Reservierung für ein einzelnes Projekt erstellen
Öffnen Sie in der Google Cloud Console die Seite Reservierungen.
Klicken Sie auf den Tab Zukünftige Reservierungen.
Klicken Sie auf
Zukünftige Reservierung erstellen.Die Seite Zukünftige Reservierung erstellen wird geöffnet.
Geben Sie unter Name einen Namen für die zukünftige Reservierungsanfrage ein.
Geben Sie unter Präfix ein Namenspräfix ein. Der Name jeder automatisch erstellten Reservierung aus dieser zukünftigen Reservierungsanfrage beginnt mit diesem Präfix.
Wählen Sie als Region und Zone die Region und Zone aus, in der Sie Ressourcen reservieren möchten.
Geben Sie unter Beginn eine Startzeit für den Reservierungszeitraum ein. Der Beginn darf nicht mehr als ein Jahr nach dem Datum und der Uhrzeit liegen, an dem Sie eine zukünftige Reservierungsanfrage zur Prüfung einreichen. Damit genügend Zeit bleibt, um die zukünftige Reservierung vor Eingabe der Sperrzeit optional zu ändern, zu stornieren oder zu löschen, müssen Sie einen empfohlenen Wert für die Startzeit angeben.
Geben Sie unter Ende ein Ende für den Reservierungszeitraum ein, das mindestens 14 Tage in der Zukunft liegt. Im Abschnitt Dauer – Zusammenfassung sehen Sie die Länge des Reservierungszeitraums. Wenn Sie die Wahrscheinlichkeit erhöhen möchten, dass Google Cloud Ihre zukünftige Reservierungsanfrage nach der Überprüfung genehmigt, geben Sie einen empfohlenen Wert für den Reservierungszeitraum an. Google Cloud
Wählen Sie im Abschnitt Freigabetyp die Option Lokal aus, falls sie noch nicht ausgewählt ist.
Geben Sie unter Erforderliche Gesamtkapazität die Gesamtzahl der VMs ein, die für den Zeitraum, die VM-Konfiguration und die Projekte, die in dieser zukünftigen Reservierungsanfrage angegeben sind, reserviert werden sollen.
Führen Sie im Abschnitt Maschinenkonfiguration die folgenden Schritte aus:
Wählen Sie Instanzvorlage verwenden aus.
Wählen Sie unter Instanzvorlage die gewünschte Instanzvorlage aus. Wenn Sie eine regionale Instanzvorlage auswählen, können Sie Ressourcen nur innerhalb der Region reservieren, in der sich die Vorlage befindet.
Führen Sie im Abschnitt Automatisch generierte Reservierungen automatisch löschen einen der folgenden Schritte aus:
So aktivieren Sie in Compute Engine das automatische Löschen der automatisch erstellten Reservierungen für Ihre zukünftige Reservierungsanfrage:
Klicken Sie auf die Ein/Aus-Schaltfläche Automatisches Löschen aktivieren, um die Position „Ein“ festzulegen, falls dies noch nicht geschehen ist.
Optional: Geben Sie unter Zeit bis zum automatischen Löschen ein Datum und eine Uhrzeit für das Löschen der automatisch erstellten Reservierungen ein. Das Datum und die Uhrzeit müssen nach dem Enddatum des Reservierungszeitraums liegen. Wenn Sie dieses Feld leer lassen, werden die automatisch erstellten Reservierungen innerhalb von zwei Stunden nach dem Ende des Reservierungszeitraums gelöscht.
Klicken Sie andernfalls auf die Ein/Aus-Schaltfläche Automatisches Löschen aktivieren, um die Position „Aus“ festzulegen.
Klicken Sie auf Entwurf speichern, um den Entwurf der zukünftigen Reservierungsanfrage fertigzustellen.
Die Seite Reservierungen wird geöffnet. Das Erstellen der zukünftige Reservierungsanfrage kann bis zu einer Minute dauern.
Schnelle Problemlösung während der Veranstaltung
Wie Sie auf Vorfälle unterschiedlicher Schwere reagieren, sie kategorisieren und lösen, kann sich erheblich auf Ihre Abläufe während eines Ereignisses auswirken. Verwenden Sie ein zentrales System zur Fehlerverwaltung, um den gesamten Fehlerlebenszyklus effektiv zu verfolgen.
Zusätzlich zur Überprüfung Ihrer Kontakte und Aktivierung der personalisierten Dienstbereitschaft sollten Sie Folgendes tun:
- Best Practices für die Zusammenarbeit mit dem Kundenservice
- Kommunikationsplan erstellen
- Zugriff ermöglichen
Weitere Informationen finden Sie unter Vorbereitung auf die Behebung von Problemen während der Veranstaltung.
Kontakte überprüfen
Viele Google Cloud Angebote senden Benachrichtigungen, um wichtige Informationen mit Google Cloud Nutzern zu teilen. Standardmäßig werden diese Benachrichtigungen an Mitglieder mit bestimmten IAM-Rollen (Identity and Access Management) gesendet. Mit „Wichtige Kontakte“ können Sie eine eigene Liste von Kontakten angeben und so festlegen, wer Benachrichtigungen erhält. Weitere Informationen finden Sie unter Kontakte für Benachrichtigungen verwalten.
Rufen Sie in der Google Cloud Console die Seite IAM und Verwaltung > Wichtige Kontakte auf.
Rufen Sie Wichtige Kontakte auf.
Prüfen Sie, ob der Name Ihres Projekts, Ihres Ordners oder Ihrer Organisation in der Ressourcenauswahl in der Symbolleiste der Console angezeigt wird. In der Ressourcenauswahl sehen Sie, für welches Projekt, welchen Ordner oder welche Organisation Sie Kontakte verwalten.
Um die Kontakte nach Kategorie aufzulisten, wählen Sie Kategorie aus. Wählen Sie Kontakte aus, um die Kontakte alphabetisch aufzulisten.
Personalized Service Health aktivieren
Mit Personalized Service Health können Sie Google Cloud Störungen bei Diensten erkennen, die für Ihre Projekte relevant sind, damit Sie diese effizient verwalten und darauf reagieren können. Weitere Informationen finden Sie in der Übersicht über die personalisierte Dienstbereitschaft.
Achten Sie darauf, dass Sie die Service Health API vor dem Ereignis aktiviert haben und dass Ihre Organisation auf das Dashboard zugreifen und Benachrichtigungen konfigurieren kann. Weitere Informationen finden Sie unter Zugriff auf den personalisierten Dienststatus verwalten.
- Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
-
Enable the Service Health API.
Cloud-Ressourcen verwalten und optimieren
Verwalten und optimieren Sie die Ressourcen, die von Ihren Arbeitslasten verwendet werden. Google CloudDazu gehört die richtige Ressourcengröße anhand der tatsächlichen Nutzung und Nachfrage, die Verwendung des Autoscaling für die dynamische Ressourcenzuweisung und die Überprüfung von Architektur- und Sicherheitsempfehlungen.
Zusätzlich zu den Active Assist-Empfehlungen sollten Sie Folgendes tun:
- Best Practices Google Cloud prüfen
- Skalierbarkeit prüfen
- Produktversionen prüfen
- Benachrichtigungen und Dashboards prüfen
Weitere Informationen finden Sie unter Cloud-Ressourcen optimieren.
Active Assist-Empfehlungen prüfen
Active Assist bezieht sich auf das Portfolio an Tools, das inGoogle Cloud verwendet wird, um Empfehlungen und Statistiken zur Optimierung Ihrer Google Cloud -Projekte zu generieren. Weitere Informationen finden Sie unter Was ist Active Assist?
Rufen Sie in der Google Cloud Console den Recommendation Hub auf.
Wählen Sie in der Symbolleiste der Console über die Ressourcenauswahl ein Projekt, einen Ordner oder eine Organisation aus.Google Cloud
Sie können Empfehlungen auf Organisations- oder Ordnerebene nur dann sehen, wenn Sie über Berechtigungen für diese Organisation oder diesen Ordner verfügen, unabhängig von Ihren Berechtigungen für Ordner oder Projekte innerhalb dieser Organisation oder dieses Ordners.
Klicken Sie im Navigationsbereich auf Alle Empfehlungen.
Es werden Empfehlungen angezeigt, die Sie filtern, sortieren und teilen können. Sie können die Empfehlungen im Detail untersuchen, sehen, welche Ressourcen betroffen sind und welche Auswirkungen die Anwendung einer Empfehlung haben könnte.
Wenn Sie mehr über eine Empfehlung erfahren möchten, klicken Sie in der Spalte Empfehlung auf die entsprechende Empfehlung.
Es werden relevante Daten angezeigt, die Ihnen bei der Entscheidung helfen können, ob Sie die Empfehlung anwenden oder ablehnen sollten.
Wenn Sie dazu berechtigt sind, können Sie eine Empfehlung anwenden oder ablehnen, indem Sie auf die entsprechende Schaltfläche klicken.
Beachten Sie, dass einige Empfehlungen möglicherweise nicht direkt anwendbar sind. Folgen Sie der Anleitung in der Console, um sie anzuwenden.
Lasttests planen und durchführen
Mit Lasttests können Sie feststellen, ob Ihr System bei der Produktion erfolgreich skaliert wird, und Engpässe finden, die die Skalierung verhindern.
Drei bis fünf Monate vor dem Ereignis sollten Sie Lasttests für kritische Projekte und Arbeitslasten durchführen, um Spitzenlasten zu simulieren.
Prüfen Sie die Auswirkungen der Kontingente und Kosten der Lasttests und überlegen Sie, Cloud Billing-Budgetbenachrichtigungen zu erstellen, mit denen die Kosten der Dienste überwacht werden, die am stärksten beansprucht werden.
Bewerten Sie nach jedem Test die Ergebnisse und verwenden Sie den Kapazitätsplaner, um Ihre Nutzungs- und Prognosedaten zu visualisieren und bei Bedarf Kontingenterhöhungen anzufordern. Weitere Informationen finden Sie in diesem Dokument unter Capacity Planner verwenden und Kontingentanpassung beantragen.
Wenn Sie Hilfe benötigen, wenden Sie sich an Ihr Account-Management-Team oder Ihren TAM. Sie können Ihnen helfen, Architekturänderungen zu erfassen und zu planen, um die Zuverlässigkeit und Verfügbarkeit Ihrer Dienste insgesamt zu verbessern.
Notfallwiederherstellungstests planen und durchführen
Wenn Sie eine robuste und gut getestete Notfallwiederherstellungsstrategie haben, können Sie die Auswirkungen von Störungen minimieren, schnellere Wiederherstellungszeiten erreichen und wichtige Vorgänge schneller wieder aufnehmen, wenn ein Problem auftritt.
Ihre Notfallwiederherstellungsstrategie sollte detaillierte Anforderungen für die Reaktion im Notfall, Sicherungsvorgänge und Wiederherstellungsverfahren definieren.
Führen Sie ein bis drei Monate vor dem Ereignis Simulationen von Notfallszenarien durch, um Lücken in Ihren Notfallwiederherstellungsplänen und Ihrer Bereitschaft zu erkennen.
Bewerten Sie nach jedem Test die Ergebnisse, um festzustellen, ob architektonische Änderungen erforderlich sind. Prüfen und optimieren Sie die Ressourcen nach Bedarf. Weitere Informationen finden Sie in diesem Dokument unter Cloud-Ressourcen verwalten und optimieren.
Ihr Account-Team oder TAM kann Ihnen bei Ihren Notfallwiederherstellungstests helfen und Ihnen zeigen, wie Sie Ihren Notfallwiederherstellungsprozess verstehen und verbessern können. Weitere Informationen finden Sie im Leitfaden zur Planung der Notfallwiederherstellung.
Zusammenfassung der Ressourcen
In der folgenden Tabelle sind die Leitfäden aufgeführt, auf die in diesem Dokument verwiesen wird.
Best Practices für die Ereignisverwaltung |
---|
Entsprechende Kapazität für Ihre Veranstaltung anfordern und sichern |
|
Schnelle Problemlösung während der Veranstaltung |
Cloud-Ressourcen verwalten und optimieren |
Lasttests planen und durchführen |
Notfallwiederherstellungstests planen und durchführen |