필요한 안정성 수준을 결정한 후에는 단일 장애점을 방지하도록 시스템을 설계해야 합니다.
시스템의 모든 중요한 구성요소는 여러 머신, 영역, 리전에 걸쳐 복제되어야 합니다.
예를 들어 중요한 데이터베이스는 한 리전에만 있을 수 없으며 메타데이터 서버는 하나의 영역 또는 리전에만 배포할 수 없습니다. 이러한 예시에서 유일한 영역이나 리전에서 중단이 발생하면 시스템에 전역 중단이 발생합니다.
권장사항
중복 시스템을 빌드하려면 다음 하위 섹션의 권장사항을 고려하세요.
장애 도메인 식별 및 서비스 복제
개별 VM에서 리전까지 시스템의 장애 도메인을 매핑하고 장애 도메인 전체에 중복성을 고려하여 설계합니다.
고가용성을 보장하려면 여러 영역과 리전에 서비스와 애플리케이션을 배포하고 복제하세요. 영역 또는 리전 서비스 중단 시 서비스와 애플리케이션을 계속 사용할 수 있도록 자동 장애 조치를 위해 시스템을 구성합니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2024-12-30(UTC)"],[[["This content emphasizes the importance of resource redundancy in the Google Cloud Well-Architected Framework's reliability pillar, helping to prevent system failures."],["Systems should be designed to avoid single points of failure by replicating critical components across multiple machines, zones, and regions."],["To achieve high availability, services and applications should be distributed across multiple zones and regions, with automatic failover mechanisms implemented for outages."],["It is crucial to monitor failure domains and address any detected issues promptly, using tools like the Google Cloud Service Health dashboard."],["Regularly simulating failures, similar to a fire drill, is recommended to validate replication and failover strategies' effectiveness."]]],[]]