Dieses Prinzip in der Säule „Zuverlässigkeit“ des Google Cloud Well-Architected Framework hilft Ihnen, Zuverlässigkeitsziele zu definieren, die für Ihre Arbeitslasten in Google Cloudtechnisch realisierbar sind.
Dieser Grundsatz ist für den Fokusbereich Umfang der Zuverlässigkeit relevant.
Übersicht über die Grundsätze
Gestalten Sie Ihre Systeme so, dass sie gerade zuverlässig genug sind, um die Nutzerzufriedenheit zu gewährleisten. Es mag kontraintuitiv erscheinen, aber ein Ziel von 100% Zuverlässigkeit ist oft nicht die effektivste Strategie. Eine höhere Zuverlässigkeit kann zu deutlich höheren Kosten führen, sowohl in Bezug auf finanzielle Investitionen als auch auf potenzielle Einschränkungen bei Innovationen. Wenn Nutzer bereits mit dem aktuellen Serviceniveau zufrieden sind, kann es sich lohnen, die Bemühungen zur Steigerung der Zufriedenheit zu reduzieren. Stattdessen können Sie Ressourcen besser an anderer Stelle einsetzen.
Sie müssen herausfinden, ab welchem Zuverlässigkeitsniveau Ihre Nutzer zufrieden sind, und den Punkt bestimmen, an dem die Kosten für inkrementelle Verbesserungen die Vorteile überwiegen. Wenn Sie dieses Niveau an ausreichender Zuverlässigkeit erreicht haben, können Sie Ressourcen strategisch zuweisen und sich auf Funktionen und Verbesserungen konzentrieren, die Ihren Nutzern einen größeren Mehrwert bieten.
Empfehlungen
Berücksichtigen Sie die Empfehlungen in den folgenden Unterabschnitten, um realistische Zuverlässigkeitsziele festzulegen.
Einige Fehler in Kauf nehmen und Komponenten priorisieren
Streben Sie eine hohe Verfügbarkeit wie 99,99% Betriebszeit an, aber setzen Sie kein Ziel von 100 % Betriebszeit. Erkennen Sie an, dass einige Fehler unvermeidlich sind.
Die Lücke zwischen 100% Betriebszeit und einem Ziel von 99,99% ist die zulässige Ausfallzeit. Diese Lücke wird oft als Fehlerbudget bezeichnet. Mit dem Fehlerbudget können Sie Risiken eingehen und Innovationen vorantreiben. Das ist für jedes Unternehmen unerlässlich, um wettbewerbsfähig zu bleiben.
Priorisieren Sie die Zuverlässigkeit der wichtigsten Komponenten im System. Akzeptieren Sie, dass weniger kritische Komponenten eine höhere Fehlertoleranz haben können.
Zuverlässigkeit und Kosten in Einklang bringen
Um das optimale Zuverlässigkeitsniveau für Ihr System zu ermitteln, sollten Sie gründliche Kosten-Nutzen-Analysen durchführen.
Berücksichtigen Sie Faktoren wie Systemanforderungen, die Folgen von Fehlern und die Risikobereitschaft Ihrer Organisation für die jeweilige Anwendung. Berücksichtigen Sie dabei Ihre Messwerte für die Notfallwiederherstellung, z. B. das Recovery Time Objective (RTO) und das Recovery Point Objective (RPO). Legen Sie fest, welches Maß an Zuverlässigkeit innerhalb des Budgets und anderer Einschränkungen akzeptabel ist.
Suchen Sie nach Möglichkeiten, die Effizienz zu steigern und die Kosten zu senken, ohne die wesentlichen Zuverlässigkeitsfunktionen zu beeinträchtigen.