Die Säule „Operative Exzellenz“ im Google Cloud Well-Architected Framework enthält Empfehlungen für den effizienten Betrieb von Arbeitslasten auf Google Cloud. Operational Excellence in der Cloud umfasst das Entwerfen, Implementieren und Verwalten von Cloud-Lösungen, die Wert, Leistung, Sicherheit und Zuverlässigkeit bieten. Die Empfehlungen in diesem Säule helfen Ihnen, Arbeitslasten kontinuierlich zu verbessern und anzupassen, um den dynamischen und sich ständig weiterentwickelnden Anforderungen in der Cloud gerecht zu werden.
Die Säule „Operational Excellence“ ist für die folgenden Zielgruppen relevant:
- Führungskräfte: Ein Framework zum Einrichten und Aufrechterhalten von Operational Excellence in der Cloud und zum Sicherstellen, dass Cloud-Investitionen einen Mehrwert bieten und Geschäftsziele unterstützen.
- Cloud-Betriebsteams: Anleitung zum Verwalten von Vorfällen und Problemen, zum Planen von Kapazitäten, zum Optimieren der Leistung und zum Verwalten von Änderungen.
- Site Reliability Engineers (SREs): Best Practices, mit denen Sie eine hohe Dienstzuverlässigkeit erreichen können, einschließlich Monitoring, Reaktion auf Vorfälle und Automatisierung.
- Cloud-Architekten und ‑Entwickler: Betriebliche Anforderungen und Best Practices für die Design- und Implementierungsphasen, damit Lösungen für betriebliche Effizienz und Skalierbarkeit konzipiert werden.
- DevOps-Teams: Anleitungen zu Automatisierung, CI/CD-Pipelines und Änderungsmanagement, um eine schnellere und zuverlässigere Softwarebereitstellung zu ermöglichen.
Um operative Exzellenz zu erreichen, sollten Sie Automatisierung, Orchestrierung und datengestützte Erkenntnisse nutzen. Automatisierung trägt dazu bei, den Arbeitsaufwand zu minimieren. Außerdem werden sich wiederholende Aufgaben optimiert und es werden Schutzmaßnahmen für sie eingerichtet. Die Orchestrierung hilft, komplexe Prozesse zu koordinieren. Datengestützte Statistiken ermöglichen eine evidenzbasierte Entscheidungsfindung. Wenn Sie diese Best Practices anwenden, können Sie Cloud-Vorgänge optimieren, Kosten senken, die Dienstverfügbarkeit verbessern und die Sicherheit erhöhen.
Operational Excellence in der Cloud geht über die technischen Fähigkeiten bei Cloud-Vorgängen hinaus. Dazu gehört ein kultureller Wandel, der kontinuierliches Lernen und Experimentieren fördert. Teams müssen in die Lage versetzt werden, Innovationen zu entwickeln, zu iterieren und eine Wachstumsmentalität zu entwickeln. Eine Kultur der operativen Exzellenz fördert eine kollaborative Umgebung, in der Einzelpersonen ermutigt werden, Ideen auszutauschen, Annahmen zu hinterfragen und Verbesserungen voranzutreiben.
Prinzipien und Empfehlungen für operative Exzellenz, die speziell für KI- und ML-Arbeitslasten gelten, finden Sie im Well-Architected Framework unter KI- und ML-Perspektive: Operative Exzellenz.
Grundprinzipien
Die Empfehlungen in der Säule „Operative Exzellenz“ des Well-Architected Frameworks sind den folgenden Grundprinzipien zugeordnet:
- Betriebsbereitschaft und Leistung mit CloudOps sicherstellen: Cloud-Lösungen müssen betriebliche und Leistungsanforderungen erfüllen. Dazu müssen Service Level Objectives (SLOs) definiert und umfassende Überwachung, Leistungstests und Kapazitätsplanung durchgeführt werden.
- Vorfälle und Probleme verwalten: Minimieren Sie die Auswirkungen von Cloud-Vorfällen und verhindern Sie ein erneutes Auftreten durch umfassende Beobachtbarkeit, klare Verfahren zur Reaktion auf Vorfälle, gründliche Retrospektiven und präventive Maßnahmen.
- Cloud-Ressourcen verwalten und optimieren: Optimieren und verwalten Sie Cloud-Ressourcen mithilfe von Strategien wie Right-Sizing und Autoscaling sowie durch den Einsatz effektiver Tools zur Kostenüberwachung.
- Änderungen automatisieren und verwalten: Prozesse automatisieren, Änderungsmanagement optimieren und den Aufwand manueller Arbeit reduzieren.
- Kontinuierlich verbessern und innovativ sein: Konzentrieren Sie sich auf laufende Verbesserungen und die Einführung neuer Lösungen, um wettbewerbsfähig zu bleiben.
Beitragende
Autoren:
- Ryan Cox | Principal Architect
- Hadrian Knotz | Enterprise Architect
Weitere Beitragende:
- Daniel Lees | Cloudsicherheitsarchitekt
- Filipe Gracio, PhD | Customer Engineer
- Gary Harmson | Principal Architect
- Jose Andrade | Enterprise Infrastructure Customer Engineer
- Kumar Dhanagopal | Cross-Product Solution Developer
- Nicolas Pintaux | Customer Engineer, Application Modernization Specialist
- Radhika Kanakam | Senior Program Manager, Cloud GTM
- Samantha He | Technical Writer
- Zach Seils | Networking Specialist
- Wade Holmes | Global Solutions Director