Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Last reviewed 2024-10-31 UTC
Die Säule „Operative Exzellenz“ im Google Cloud Well-Architected Framework enthält Empfehlungen für den effizienten Betrieb von Arbeitslasten auf Google Cloud.
Operational Excellence in der Cloud umfasst das Entwerfen, Implementieren und Verwalten von Cloud-Lösungen, die Wert, Leistung, Sicherheit und Zuverlässigkeit bieten. Die Empfehlungen in diesem Säule helfen Ihnen, Arbeitslasten kontinuierlich zu verbessern und anzupassen, um den dynamischen und sich ständig weiterentwickelnden Anforderungen in der Cloud gerecht zu werden.
Die Säule „Operational Excellence“ ist für die folgenden Zielgruppen relevant:
Führungskräfte: Ein Framework zum Einrichten und Aufrechterhalten von Operational Excellence in der Cloud und zum Sicherstellen, dass Cloud-Investitionen einen Mehrwert bieten und Geschäftsziele unterstützen.
Cloud-Betriebsteams: Anleitung zum Verwalten von Vorfällen und Problemen, zum Planen von Kapazitäten, zum Optimieren der Leistung und zum Verwalten von Änderungen.
Site Reliability Engineers (SREs): Best Practices, mit denen Sie eine hohe Dienstzuverlässigkeit erreichen können, einschließlich Monitoring, Reaktion auf Vorfälle und Automatisierung.
Cloud-Architekten und ‑Entwickler: Betriebliche Anforderungen und Best Practices für die Design- und Implementierungsphasen, damit Lösungen für betriebliche Effizienz und Skalierbarkeit konzipiert werden.
DevOps-Teams: Anleitungen zu Automatisierung, CI/CD-Pipelines und Änderungsmanagement, um eine schnellere und zuverlässigere Softwarebereitstellung zu ermöglichen.
Um operative Exzellenz zu erreichen, sollten Sie Automatisierung, Orchestrierung und datengestützte Erkenntnisse nutzen. Automatisierung trägt dazu bei, den Arbeitsaufwand zu minimieren. Außerdem werden sich wiederholende Aufgaben optimiert und es werden Schutzmaßnahmen für sie eingerichtet. Die Orchestrierung hilft, komplexe Prozesse zu koordinieren. Datengestützte Statistiken ermöglichen eine evidenzbasierte Entscheidungsfindung. Wenn Sie diese Best Practices anwenden, können Sie Cloud-Vorgänge optimieren, Kosten senken, die Dienstverfügbarkeit verbessern und die Sicherheit erhöhen.
Operational Excellence in der Cloud geht über die technischen Fähigkeiten bei Cloud-Vorgängen hinaus. Dazu gehört ein kultureller Wandel, der kontinuierliches Lernen und Experimentieren fördert. Teams müssen in die Lage versetzt werden, Innovationen zu entwickeln, zu iterieren und eine Wachstumsmentalität zu entwickeln. Eine Kultur der operativen Exzellenz fördert eine kollaborative Umgebung, in der Einzelpersonen ermutigt werden, Ideen auszutauschen, Annahmen zu hinterfragen und Verbesserungen voranzutreiben.
Prinzipien und Empfehlungen für operative Exzellenz, die speziell für KI- und ML-Arbeitslasten gelten, finden Sie im Well-Architected Framework unter KI- und ML-Perspektive: Operative Exzellenz.
Grundprinzipien
Die Empfehlungen in der Säule „Operative Exzellenz“ des Well-Architected Frameworks sind den folgenden Grundprinzipien zugeordnet:
Betriebsbereitschaft und Leistung mit CloudOps sicherstellen: Cloud-Lösungen müssen betriebliche und Leistungsanforderungen erfüllen. Dazu müssen Service Level Objectives (SLOs) definiert und umfassende Überwachung, Leistungstests und Kapazitätsplanung durchgeführt werden.
Vorfälle und Probleme verwalten: Minimieren Sie die Auswirkungen von Cloud-Vorfällen und verhindern Sie ein erneutes Auftreten durch umfassende Beobachtbarkeit, klare Verfahren zur Reaktion auf Vorfälle, gründliche Retrospektiven und präventive Maßnahmen.
Cloud-Ressourcen verwalten und optimieren: Optimieren und verwalten Sie Cloud-Ressourcen mithilfe von Strategien wie Right-Sizing und Autoscaling sowie durch den Einsatz effektiver Tools zur Kostenüberwachung.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2024-10-31 (UTC)."],[[["\u003cp\u003eThe operational excellence pillar of the Google Cloud Well-Architected Framework offers guidance for running workloads efficiently on Google Cloud, focusing on value, performance, security, and reliability.\u003c/p\u003e\n"],["\u003cp\u003eKey audiences for this framework include managers, cloud operations teams, SREs, cloud architects, engineers, and DevOps teams, all of whom can leverage it for best practices.\u003c/p\u003e\n"],["\u003cp\u003eAchieving operational excellence involves automation, orchestration, and data-driven insights to optimize cloud operations, reduce costs, improve service availability, and enhance security.\u003c/p\u003e\n"],["\u003cp\u003eThe core principles of operational excellence in the framework include ensuring operational readiness, managing incidents, optimizing resources, automating change, and continuously improving.\u003c/p\u003e\n"],["\u003cp\u003eThe framework promotes a cultural shift towards continuous learning, collaboration, and innovation in cloud operations, which is in addition to operational technical proficiency.\u003c/p\u003e\n"]]],[],null,["# Well-Architected Framework: Operational excellence pillar\n\n| To view the content in the operational excellence pillar on a single page or to to get a PDF output of the content, see [View on one page](/architecture/framework/operational-excellence/printable).\n\nThe operational excellence pillar in the\n[Google Cloud Well-Architected Framework](/architecture/framework)\nprovides recommendations to operate workloads efficiently on Google Cloud.\nOperational excellence in the cloud involves designing, implementing, and\nmanaging cloud solutions that provide value, performance, security, and\nreliability. The recommendations in this pillar help you to continuously improve\nand adapt workloads to meet the dynamic and ever-evolving needs in the cloud.\n\nThe operational excellence pillar is relevant to the following audiences:\n\n- **Managers and leaders**: A framework to establish and maintain operational excellence in the cloud and to ensure that cloud investments deliver value and support business objectives.\n- **Cloud operations teams**: Guidance to manage incidents and problems, plan capacity, optimize performance, and manage change.\n- **Site reliability engineers (SREs)**: Best practices that help you to achieve high levels of service reliability, including monitoring, incident response, and automation.\n- **Cloud architects and engineers**: Operational requirements and best practices for the design and implementation phases, to help ensure that solutions are designed for operational efficiency and scalability.\n- **DevOps teams**: Guidance about automation, CI/CD pipelines, and change management, to help enable faster and more reliable software delivery.\n\nTo achieve operational excellence, you should embrace automation,\norchestration, and data-driven insights. Automation helps to eliminate toil. It\nalso streamlines and builds guardrails around repetitive tasks. Orchestration\nhelps to coordinate complex processes. Data-driven insights enable\nevidence-based decision-making. By using these practices, you can optimize cloud\noperations, reduce costs, improve service availability, and enhance security.\n\nOperational excellence in the cloud goes beyond technical proficiency in cloud\noperations. It includes a cultural shift that encourages continuous learning and\nexperimentation. Teams must be empowered to innovate, iterate, and adopt a\ngrowth mindset. A culture of operational excellence fosters a collaborative\nenvironment where individuals are encouraged to share ideas, challenge\nassumptions, and drive improvement.\n\n\nFor operational excellence principles and recommendations that are specific to AI and ML workloads, see\n[AI and ML perspective: Operational excellence](/architecture/framework/perspectives/ai-ml/operational-excellence)\nin the Well-Architected Framework.\n\nCore principles\n---------------\n\nThe recommendations in the operational excellence pillar of the Well-Architected Framework\nare mapped to the following core principles:\n\n- [Ensure operational readiness and performance using CloudOps](/architecture/framework/operational-excellence/operational-readiness-and-performance-using-cloudops): Ensure that cloud solutions meet operational and performance requirements by defining service level objectives (SLOs) and by performing comprehensive monitoring, performance testing, and capacity planning.\n- [Manage incidents and problems](/architecture/framework/operational-excellence/manage-incidents-and-problems): Minimize the impact of cloud incidents and prevent recurrence through comprehensive observability, clear incident response procedures, thorough retrospectives, and preventive measures.\n- [Manage and optimize cloud resources](/architecture/framework/operational-excellence/manage-and-optimize-cloud-resources): Optimize and manage cloud resources through strategies like right-sizing, autoscaling, and by using effective cost monitoring tools.\n- [Automate and manage change](/architecture/framework/operational-excellence/automate-and-manage-change): Automate processes, streamline change management, and alleviate the burden of manual labor.\n- [Continuously improve and innovate](/architecture/framework/operational-excellence/continuously-improve-and-innovate): Focus on ongoing enhancements and the introduction of new solutions to stay competitive.\n\nContributors\n------------\n\nAuthors:\n\n- [Ryan Cox](https://www.linkedin.com/in/ryanlcox) \\| Principal Architect\n- [Hadrian Knotz](https://www.linkedin.com/in/hadrianknotz) \\| Enterprise Architect\n\n\u003cbr /\u003e\n\nOther contributors:\n\n- [Daniel Lees](https://www.linkedin.com/in/daniellees) \\| Cloud Security Architect\n- [Filipe Gracio, PhD](https://www.linkedin.com/in/filipegracio) \\| Customer Engineer, AI/ML Specialist\n- [Gary Harmson](https://www.linkedin.com/in/garyharmson) \\| Principal Architect\n- [Jose Andrade](https://www.linkedin.com/in/jmandrade) \\| Customer Engineer, SRE Specialist\n- [Kumar Dhanagopal](https://www.linkedin.com/in/kumardhanagopal) \\| Cross-Product Solution Developer\n- [Nicolas Pintaux](https://www.linkedin.com/in/nicolaspintaux) \\| Customer Engineer, Application Modernization Specialist\n- [Radhika Kanakam](https://www.linkedin.com/in/radhika-kanakam-18ab876) \\| Program Lead, Google Cloud Well-Architected Framework\n- [Samantha He](https://www.linkedin.com/in/samantha-he-05a98173) \\| Technical Writer\n- [Zach Seils](https://www.linkedin.com/in/zachseils) \\| Networking Specialist\n- [Wade Holmes](https://www.linkedin.com/in/wholmes) \\| Global Solutions Director\n\n\u003cbr /\u003e"]]