관측 가능성 도구는 많은 양의 데이터를 제공하지만 모든 데이터가 사용자에게 미치는 영향과 직접적으로 관련이 있는 것은 아닙니다. 예를 들어 CPU 사용량이 높거나 서버 작업이 느리거나 태스크가 비정상 종료될 수 있습니다. 하지만 이러한 문제가 사용자 환경에 영향을 미치지 않는다면 서비스 중단으로 간주되지 않습니다.
사용자 환경을 측정하려면 내부 시스템 동작과 사용자 대상 문제를 구분해야 합니다. 사용자 요청의 성공률과 같은 측정항목에 집중합니다. 서비스 안정성에 관한 잘못된 결론을 내릴 수 있는 CPU 사용량과 같은 서버 중심 측정항목에만 의존하지 마세요. 진정한 안정성은 사용자가 애플리케이션이나 서비스를 일관되고 효과적으로 사용할 수 있음을 의미합니다.
권장사항
사용자 환경을 효과적으로 측정하려면 다음 섹션의 권장사항을 고려하세요.
사용자 환경 측정
서비스의 안정성을 제대로 파악하려면 사용자의 실제 경험을 반영하는 측정항목을 우선시하세요. 예를 들어 사용자의 쿼리 성공률, 애플리케이션 지연 시간, 오류율을 측정합니다.
이 데이터는 사용자 기기 또는 브라우저에서 직접 수집하는 것이 좋습니다. 이 직접 데이터 수집이 불가능한 경우 시스템에서 측정 지점을 사용자로부터 점진적으로 더 멀리 이동하세요. 예를 들어 부하 분산기 또는 프런트엔드 서비스를 측정 지점으로 사용할 수 있습니다. 이 접근 방식을 사용하면 문제가 사용자에게 심각한 영향을 미치기 전에 문제를 식별하고 해결할 수 있습니다.
사용자 여정 분석
사용자가 시스템과 상호작용하는 방식을 이해하려면 Cloud Trace와 같은 추적 도구를 사용하면 됩니다.
애플리케이션을 통한 사용자의 여정을 추적하면 사용자 경험을 저하시킬 수 있는 병목 현상과 지연 시간 문제를 찾을 수 있습니다. Cloud Trace는 서비스 아키텍처의 각 홉에 대한 자세한 성능 데이터를 캡처합니다.
이 데이터를 통해 성능 문제를 더 효율적으로 식별하고 해결할 수 있으므로 더 안정적이고 만족스러운 사용자 환경을 제공할 수 있습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2024-12-30(UTC)"],[[["This principle focuses on assessing user experience to establish reliability goals and metrics within the Google Cloud Well-Architected Framework's reliability pillar."],["Distinguishing between internal system behavior and user-facing issues is crucial, as only the latter truly impacts service reliability."],["Prioritizing metrics that directly reflect user experience, such as query success ratio, application latency, and error rates, is more effective than solely relying on server-centric metrics like CPU usage."],["Measuring user experience data directly from user devices or browsers is ideal; however, if not feasible, data collection should occur as close to the user as possible, like at a load balancer or frontend service."],["Analyzing user journeys with tracing tools, like Cloud Trace, helps identify bottlenecks and latency issues that negatively impact user experience, thus improving overall service reliability."]]],[]]