안정성에 관한 현실적인 타겟 설정

Last reviewed 2024-12-30 UTC

Google Cloud Well-Architected Framework의 안정성 부문에서 이 원칙을 따르면 Google Cloud에서 워크로드에 대해 기술적으로 실현 가능한 안정성 목표를 정의할 수 있습니다.

이 원칙은 안정성의 범위 지정 중점사항과 관련이 있습니다.

원칙 개요

사용자가 만족할 만큼만 시스템을 안정적으로 설계하세요. 직관적이지 않게 보일 수 있지만 100% 안정성을 목표로 하는 것이 가장 효과적인 전략이 아닌 경우가 많습니다. 안정성을 높이면 재정적 투자와 혁신에 대한 잠재적 제한 측면에서 비용이 크게 증가할 수 있습니다. 사용자가 현재 서비스 수준에 이미 만족하고 있다면 만족도를 더 높이려는 노력의 투자수익이 낮을 수 있습니다. 대신 다른 곳에 리소스를 더 잘 사용할 수 있습니다.

사용자가 만족하는 안정성 수준을 결정하고, 추가 개선 비용이 이점보다 커지는 지점을 결정해야 합니다. 이러한 충분한 신뢰성 수준을 결정하면 전략적으로 리소스를 할당하고 사용자에게 더 큰 가치를 제공하는 기능과 개선사항에 집중할 수 있습니다.

권장사항

현실적인 안정성 타겟을 설정하려면 다음 하위 섹션의 권장사항을 고려하세요.

일부 실패 허용 및 구성요소 우선순위 지정

99.99% 업타임과 같은 고가용성을 목표로 하되 100% 업타임을 목표로 설정하지는 마세요. 일부 실패는 불가피함을 인정합니다.

100% 가동시간과 99.99% 목표의 차이는 허용되는 장애입니다. 이 격차를 흔히 오류 예산이라고 합니다. 오류 예산을 사용하면 위험을 감수하고 혁신할 수 있으며 이는 모든 비즈니스가 경쟁력을 유지하는 데 필수적입니다.

시스템에서 가장 중요한 구성요소의 안정성을 우선시합니다. 덜 중요한 구성요소는 장애에 대한 허용 범위가 더 높을 수 있음을 인정합니다.

신뢰성과 비용의 균형

시스템의 최적의 안정성 수준을 확인하려면 철저한 비용 편익 분석을 실행하세요.

시스템 요구사항, 장애의 결과, 특정 애플리케이션에 대한 조직의 위험 허용 범위와 같은 요소를 고려하세요. 복구 시간 목표 (RTO) 및 복구 지점 목표 (RPO)와 같은 재해 복구 측정항목을 고려해야 합니다. 예산 및 기타 제약 조건 내에서 허용되는 안정성 수준을 결정합니다.

필수적인 안정성 기능을 저해하지 않으면서 효율성을 개선하고 비용을 절감할 방법을 찾아보세요.