Die Säule für operative Exzellenz im Google Cloud Well-Architected Framework gibt Empfehlungen für den effizienten Betrieb von Arbeitslasten mit Google Cloud. Operative Exzellenz in der Cloud beinhaltet das Entwerfen, Implementieren und Verwalten von Cloud-Lösungen, die einen Mehrwert, Leistung, Sicherheit und Zuverlässigkeit bieten. Die Empfehlungen in dieser Säule helfen Ihnen, Arbeitslasten kontinuierlich zu verbessern und anzupassen, um den dynamischen und sich ständig weiterentwickelnden Anforderungen in der Cloud gerecht zu werden.
Die Säule für operative Exzellenz ist für die folgenden Zielgruppen relevant:
- Manager und Führungskräfte: Ein Framework zum Etablieren und Aufrechterhalten der operativen Exzellenz in der Cloud und um sicherzustellen, dass Cloud-Investitionen einen Mehrwert liefern und die Geschäftsziele unterstützen.
- Cloud-Operations-Teams: Anleitungen zum Umgang mit Vorfällen und Problemen, zum Planen von Kapazität, zur Leistungsoptimierung und zum Bewältigen von Änderungen.
- Site Reliability Engineers (SREs): Best Practices, mit denen Sie ein hohes Maß an Dienstzuverlässigkeit erreichen, einschließlich Monitoring, Reaktion auf Vorfälle und Automatisierung.
- Cloud Architects und Cloud Engineers: Betriebsanforderungen und Best Practices für die Design- und Implementierungsphase, damit Lösungen auf betriebliche Effizienz und Skalierbarkeit ausgelegt sind.
- DevOps-Teams: Anleitungen zur Automatisierung, CI/CD-Pipelines und zum Änderungsmanagement, um eine schnellere und zuverlässigere Softwarebereitstellung zu ermöglichen.
Für operative Exzellenz sollten Sie auf Automatisierung, Orchestrierung und datengesteuerte Erkenntnisse setzen. Automatisierung hilft, Arbeitsaufwand zu reduzieren. Sie optimiert und erstellt auch Schutzmaßnahmen für sich wiederholende Aufgaben. Orchestrierung hilft bei der Koordinierung komplexer Prozesse. Datengesteuerte Erkenntnisse ermöglichen evidenzbasierte Entscheidungsfindungen. Mit diesen Praktiken können Sie den Cloud-Betrieb optimieren, Kosten senken, die Dienstverfügbarkeit verbessern und die Sicherheit erhöhen.
Operative Exzellenz in der Cloud geht über technische Kompetenz für Cloud-Vorgänge hinaus. Sie umfasst einen kulturellen Wandel, der kontinuierliches Lernen und Experimentieren fördert. Teams müssen in die Lage versetzt werden, Innovationen zu entwickeln, zu iterieren und Wachstum zu fördern. Eine Kultur der operativen Exzellenz fördert eine kooperative Umgebung, in der Personen ermutigt werden, Ideen auszutauschen, Annahmen zu hinterfragen und Verbesserungen voranzutreiben.
Die Prinzipien und Empfehlungen für operative Exzellenz, die speziell für KI- und ML-Arbeitslasten gelten, finden Sie im Well-Architected Framework unter AI and MLperspektive: Operative Exzellenz.
Grundprinzipien
Die Empfehlungen in der Säule „Operational Excellence“ des Well-Architected Framework entsprechen den folgenden Grundprinzipien:
- Betriebliche Bereitschaft und Leistung mit CloudOps sichern: Cloud-Lösungen müssen die Betriebs- und Leistungsanforderungen erfüllen. Dazu definieren Sie Service Level Objectives (SLOs) und führen umfassende Monitoring-, Leistungstests und Kapazitätspläne durch.
- Vorfälle und Probleme verwalten: Minimieren Sie die Auswirkungen von Cloud-Vorfällen und verhindern Sie Wiederholungen durch umfassende Beobachtbarkeit, klare Verfahren zur Reaktion auf Vorfälle, gründliche Rückblicke und vorbeugende Maßnahmen.
- Verwaltung und Optimierung von Cloud-Ressourcen: Cloud-Ressourcen mithilfe von Strategien wie Größenanpassung, Autoscaling und effektives Kostenmonitoring-Tools optimieren und verwalten.
- Änderungen automatisieren und verwalten: Prozesse automatisieren, das Änderungsmanagement optimieren und den Aufwand für manuelle Arbeit entlasten
- Kontinuierlich verbessern und innovativ sein: Konzentrieren Sie sich auf laufende Verbesserungen und die Einführung neuer Lösungen, um wettbewerbsfähig zu bleiben.
Beitragende
Autoren:
- Ryan Cox | Principal Architect
- Hadrian Knotz | Unternehmensarchitekt
Weitere Beitragende:
- Daniel Lees | Cloudsicherheitsarchitekt
- Filipe Gracio, PhD | Customer Engineer
- Gary Harmson | Principal Architect
- Jose Andrade | Enterprise Infrastructure Customer Engineer
- Kumar Dhanagopal | Cross-Product Solution Developer
- Nicolas Pintaux | Customer Engineer, Application Modernization Specialist
- Radhika Kanakam | Senior Program Manager, Cloud GTM
- Samantha He | Technical Writer
- Zach Seils | Networking Specialist
- Wade Holmes | Global Solutions Director