사용자 환경 목표에 따라 안정성 정의

Google Cloud Well-Architected Framework의 안정성 원칙에서 이 원칙을 사용하면 사용자 환경을 평가하고 그 결과를 안정성 목표 및 측정항목에 매핑할 수 있습니다.

이 원칙은 신뢰성의 범위 지정 중점 영역과 관련이 있습니다.

원칙 개요

관측 가능성 도구는 많은 양의 데이터를 제공하지만 모든 데이터가 사용자에게 미치는 영향과 직접적인 관련이 있는 것은 아닙니다. 예를 들어 높은 CPU 사용량, 느린 서버 작업 또는 비정상 종료 작업이 발생할 수 있습니다. 그러나 이러한 문제가 사용자 환경에 영향을 미치지 않는다면 서비스 중단으로 간주되지 않습니다.

사용자 환경을 측정하려면 내부 시스템 동작과 사용자에게 표시되는 문제를 구분해야 합니다. 사용자 요청의 성공률과 같은 측정항목에 초점을 맞춥니다. CPU 사용량과 같은 서버 중심 측정항목에만 의존하지 마세요. 서비스 안정성에 대한 잘못된 결론으로 이어질 수 있습니다. 진정한 안정성은 사용자가 애플리케이션 또는 서비스를 일관되고 효과적으로 사용할 수 있음을 의미합니다.

권장사항

사용자 환경을 효과적으로 측정하려면 다음 섹션의 권장사항을 고려하세요.

사용자 경험 측정

서비스의 안정성을 제대로 이해하려면 사용자의 실제 환경을 반영하는 측정항목에 우선순위를 두세요. 예를 들어 사용자의 쿼리 성공률, 애플리케이션 지연 시간, 오류율을 측정할 수 있습니다.

사용자의 기기나 브라우저에서 직접 이 데이터를 수집하는 것이 가장 좋습니다. 이러한 직접 데이터 수집이 불가능하면 측정 포인트를 시스템에서 사용자로부터 점차 멀리 떨어뜨립니다. 예를 들어 부하 분산기 또는 프런트엔드 서비스를 측정 지점으로 사용할 수 있습니다. 이 접근 방식을 통해 사용자에게 큰 영향을 미치기 전에 문제를 식별하고 해결할 수 있습니다.

사용자 여정 분석

사용자가 시스템과 상호작용하는 방식을 이해하려면 Cloud Trace와 같은 추적 도구를 사용하면 됩니다. 사용자의 애플리케이션 여정을 따라가다 보면 사용자 환경을 저하시킬 수 있는 병목 현상과 지연 시간 문제를 발견할 수 있습니다. Cloud Trace는 서비스 아키텍처의 각 에 대한 자세한 성능 데이터를 캡처합니다. 이 데이터는 성능 문제를 보다 효율적으로 식별하고 해결하여 보다 안정적이고 만족스러운 사용자 환경을 제공하는 데 도움이 됩니다.