Mit diesem Prinzip der Zuverlässigkeit des Google Cloud Well-Architected Framework können Sie die Erfahrung Ihrer Nutzer bewerten und die Ergebnisse dann Zuverlässigkeitszielen und Messwerten zuordnen.
Dieses Prinzip ist für den Bereich Schwerpunkt der Zuverlässigkeit relevant.
Prinzip – Übersicht
Beobachtbarkeitstools liefern große Datenmengen, aber nicht alle Daten stehen in direktem Zusammenhang mit den Auswirkungen auf die Nutzer. Sie können beispielsweise eine hohe CPU-Auslastung, langsame Servervorgänge oder sogar abgestürzte Aufgaben beobachten. Wenn diese Probleme die Nutzerfreundlichkeit jedoch nicht beeinträchtigen, sind sie nicht zu einem Ausfall führen.
Um die Nutzererfahrung zu messen, müssen Sie zwischen internem Systemverhalten und nutzerseitigen Problemen unterscheiden. Konzentrieren Sie sich auf Messwerte wie die Erfolgsquote von Nutzeranfragen. Verlassen Sie sich nicht ausschließlich auf serverbezogene Messwerte wie die CPU-Nutzung, da dies zu irreführenden Schlussfolgerungen über die Zuverlässigkeit Ihres Dienstes führen kann. Echte Zuverlässigkeit bedeutet, dass Nutzer Ihre Anwendung oder Ihren Dienst konsistent und effektiv verwenden können.
Empfehlungen
Beachten Sie die Empfehlungen in den folgenden Abschnitten, um die Nutzererfahrung effektiv zu messen.
Nutzererfahrung analysieren
Priorisieren Sie Messwerte, die die tatsächliche Erfahrung Ihrer Nutzer widerspiegeln, um die Zuverlässigkeit Ihres Dienstes wirklich zu verstehen. Messen Sie beispielsweise die Erfolgsquote bei Abfragen, die Anwendungslatenz und die Fehlerraten der Nutzer.
Idealerweise sollten diese Daten direkt über das Gerät oder den Browser des Nutzers erfasst werden. Wenn diese direkte Datenerhebung nicht möglich ist, verschieben Sie den Messpunkt im System schrittweise weiter vom Nutzer weg. Sie können beispielsweise den Load-Balancer oder den Front-End-Dienst als Messpunkt verwenden. So können Sie Probleme erkennen und beheben, bevor sie sich erheblich auf Ihre Nutzer auswirken.
Nutzerpfade analysieren
Sie können Tracing-Tools wie Cloud Trace verwenden, um nachzuvollziehen, wie Nutzer mit Ihrem System interagieren. Wenn Sie die Schritte eines Nutzers durch Ihre Anwendung durchlaufen, können Sie Engpässe und Latenzprobleme erkennen, die die Nutzererfahrung beeinträchtigen können. Cloud Trace erfasst detaillierte Leistungsdaten für jeden Hop in Ihrer Dienstarchitektur. Mit diesen Daten kannst du Leistungsprobleme effizienter erkennen und beheben, was zu einer zuverlässigeren und zufriedeneren Nutzererfahrung führen kann.