根據使用者體驗目標定義可靠性

Last reviewed 2024-12-30 UTC

Google Cloud 良好架構架構可靠性支柱中的這項原則可協助您評估使用者體驗,然後將結果對應至可靠性目標和指標。

這項原則與可靠性的範圍 焦點區域相關。

原則總覽

可觀察性工具會提供大量資料,但並非所有資料都與對使用者的影響直接相關。舉例來說,您可能會發現 CPU 使用率偏高、伺服器作業速度緩慢,甚至是工作異常終止。不過,如果這些問題不會影響使用者體驗,就不會構成服務中斷。

如要評估使用者體驗,您必須區分內部系統行為和使用者面臨的問題。請著重於使用者要求的成功率等指標。請勿只依賴以伺服器為中心的指標 (例如 CPU 用量),這可能會導致對服務可靠性的錯誤結論。真正的可靠性是指使用者可以持續且有效地使用您的應用程式或服務。

建議

為協助您有效評估使用者體驗,請參考下列各節的建議。

評估使用者體驗

如要真正瞭解服務的可靠性,請將反映使用者實際體驗的指標列為優先。舉例來說,您可以評估使用者的查詢成功率、應用程式延遲時間和錯誤率。

理想情況下,您應直接從使用者的裝置或瀏覽器收集這類資料。如果無法直接收集資料,請將評估點逐漸移離系統中的使用者。舉例來說,您可以使用負載平衡器或前端服務做為評估點。這項做法有助於您在問題對使用者造成重大影響前,找出並解決問題。

分析使用者歷程

如要瞭解使用者如何與系統互動,您可以使用 Cloud Trace 等追蹤工具。您可以追蹤使用者在應用程式中的歷程,找出可能會降低使用者體驗的瓶頸和延遲問題。Cloud Trace 會擷取服務架構中每個中繼的詳細效能資料。這項資料有助於您更有效率地找出並解決效能問題,進而提供更可靠且令人滿意的使用者體驗。