이 페이지는 Cloud Translation API를 통해 번역되었습니다.

Compute Engine 기반 멀티 리전 배포

Last reviewed 2025-08-11 UTC

이 문서에서는 Google Cloud의 여러 리전에 있는 Compute Engine VM에서 실행되는 다중 계층 애플리케이션을 위한 참조 아키텍처를 제공합니다. 이 참조 아키텍처를 사용하면 애플리케이션을 최소한으로 변경하면서 온프레미스 애플리케이션을 클라우드로 효율적으로 다시 호스팅(리프트 앤 시프트)할 수 있습니다. 또한 이 문서에서는 클라우드 애플리케이션의 멀티 리전 아키텍처를 빌드할 때 고려해야 하는 설계 요소에 대해서도 설명합니다. 이 문서는 클라우드 설계자를 대상으로 합니다.

아키텍처

다음 다이어그램은 두 Google Cloud 리전에 배포된 격리된 스택에서 활성-활성 모드로 실행되는 애플리케이션의 아키텍처를 보여줍니다. 각 리전에서 애플리케이션은 영역 3개에서 독립적으로 실행됩니다. 이 아키텍처는 Google Cloud 멀티 리전 배포 archetype에 따라 정렬되므로 Google Cloud 토폴로지가 영역 및 리전 서비스 중단 시에도 견고하고 애플리케이션 사용자에게 짧은 지연 시간을 제공합니다.

전역 부하 분산기를 사용하는 멀티 리전 아키텍처

이 아키텍처는 Infrastructure as a Service(IaaS) 클라우드 모델을 기반으로 합니다. Google Cloud에 필요한 인프라 리소스(컴퓨팅, 네트워킹, 스토리지)를 프로비저닝하고 애플리케이션 스택의 운영체제, 미들웨어, 더 높은 레이어에 대한 전체 제어와 응답성을 유지합니다. IaaS 및 기타 클라우드 모델에 대한 자세한 내용은 PaaS, IaaS, SaaS, CaaS 비교: 차이점은 무엇인가요?를 참조하세요.

앞선 다이어그램에서는 다음 구성요소가 포함됩니다.

구성요소	목적
전역 외부 부하 분산기	전역 외부 부하 분산기는 사용자 요청을 수신하여 애플리케이션에 배포합니다. 전역 외부 부하 분산기는 단일 애니캐스트 IP 주소를 공지하지만 Google 프런트엔드(GFE)에서 다수의 프록시로 구현됩니다. 클라이언트 요청은 클라이언트와 가장 가까운 GFE로 전달됩니다.
웹 계층의 리전 관리형 인스턴스 그룹(MIG)	애플리케이션의 웹 계층은 리전 MIG의 일부인 Compute Engine VM에 배포됩니다. 이러한 MIG는 전역 부하 분산기의 백엔드입니다. 각 MIG에는 서로 다른 영역 3개에 있는 Compute Engine VM이 포함됩니다. 이러한 각 VM은 애플리케이션 웹 계층의 독립 인스턴스를 호스팅합니다.
리전 내부 부하 분산기	각 리전의 내부 부하 분산기는 트래픽을 웹 계층 VM에서 해당 리전의 애플리케이션 계층 VM으로 분산합니다.
애플리케이션 계층의 리전 MIG	애플리케이션 계층은 리전 MIG의 일부인 Compute Engine VM에 배포됩니다. 각 리전의 MIG는 해당 리전의 내부 부하 분산기 백엔드입니다. 각 MIG에는 서로 다른 영역 3개에 있는 Compute Engine VM이 포함됩니다. 각 VM은 애플리케이션 계층의 독립적인 인스턴스를 호스팅합니다.
Compute Engine VM에 배포된 서드 파티 데이터베이스	이 문서의 아키텍처는 두 리전의 Compute Engine VM에 배포된 서드 파티 데이터베이스(예: PostgreSQL)를 보여줍니다. 데이터베이스에 리전 간 복제를 설정하고 각 리전에 데이터베이스를 구성하여 다른 리전의 데이터베이스로 장애 조치할 수 있습니다. 복제 및 장애 조치 기능은 사용하는 데이터베이스에 따라 달라집니다. 서드 파티 데이터베이스를 설치 및 관리하려면 복제, 업데이트 적용, 모니터링, 가용성 보장을 위한 추가 노력과 운영 비용이 필요합니다. 멀티 리전 Spanner 인스턴스와 같은 완전 관리형 데이터베이스를 사용하면 서드 파티 데이터베이스 설치 및 관리 오버헤드를 방지하고 기본 제공 고가용성(HA) 기능을 활용할 수 있습니다.
가상 프라이빗 클라우드 네트워크 및 서브넷	아키텍처의 모든 Google Cloud 리소스는 서로 다른 두 리전에 서브넷이 있는 단일 VPC 네트워크를 사용합니다. 요구사항에 따라 여러 VPC 네트워크와 서브넷을 사용하는 아키텍처를 빌드할 수 있습니다. 자세한 내용은 여러 VPC 네트워크 생성 여부 결정을 참조하세요.
Cloud Storage 이중 리전 버킷	데이터베이스 백업은 이중 리전 Cloud Storage 버킷에 저장됩니다. 또는 백업 및 DR 서비스를 사용하여 데이터베이스 백업을 생성, 저장, 관리할 수 있습니다.

사용 제품

이 참조 아키텍처에는 다음과 같은 Google Cloud 제품이 사용됩니다.

Compute Engine: Google 인프라에서 가상 머신을 만들고 실행할 수 있는 안전하고 맞춤설정 가능한 컴퓨팅 서비스입니다.
Cloud Load Balancing: 확장 가능한 고성능 전역 및 리전 부하 분산기 포트폴리오입니다.
Cloud Storage: 다양한 데이터 유형에 적합한 저비용, 무제한 객체 스토어입니다. Google Cloud내부 및 외부에서 데이터에 액세스할 수 있고 중복성을 위해 여러 위치에 복제됩니다.
가상 프라이빗 클라우드(VPC): Google Cloud 워크로드에 확장 가능한 전역 네트워킹 기능을 제공하는 가상 시스템입니다. VPC에는 VPC 네트워크 피어링, Private Service Connect, 비공개 서비스 액세스, 공유 VPC가 포함됩니다.

사용 사례

이 섹션에서는 Compute Engine의 멀티 리전 배포가 적합한 사용 사례를 설명합니다.

온프레미스 애플리케이션의 효율적인 마이그레이션

이 참조 아키텍처를 사용하면 애플리케이션을 최소한으로 변경하면서 온프레미스 애플리케이션을 클라우드로 재호스팅(리프트 앤 시프트)하도록 Google Cloud 토폴로지를 빌드할 수 있습니다. 이 참조 아키텍처의 모든 애플리케이션 계층은 Compute Engine VM에서 호스팅됩니다. 이 방식을 사용하면 온프레미스 애플리케이션을 클라우드로 효율적으로 마이그레이션하고 Google Cloud에서 제공하는 비용 이점, 신뢰성, 성능, 운영 간소함을 활용할 수 있습니다.

지리적으로 분산된 사용자를 위한 고가용성

업무상 중요하고 리전 서비스 중단에 대한 고가용성과 견고성이 필수적인 애플리케이션에는 멀티 리전 배포를 사용하는 것이 좋습니다. 어떤 이유로든 리전을 사용할 수 없게 되더라도 (자연 재해로 인한 대규모 중단 포함) 애플리케이션 사용자에게 다운타임이 발생하지 않습니다. 트래픽은 다른 사용 가능한 리전의 애플리케이션으로 라우팅됩니다. 데이터가 동기식으로 복제되는 경우 복구 시간 목표(RTO)는 거의 0입니다.

애플리케이션 사용자를 위한 지연 시간 감소

사용자가 대륙과 같은 특정 지리적 영역 내에 있는 경우 멀티 리전 배포를 사용하면 가용성과 성능 간에 최적의 균형을 얻을 수 있습니다. 리전 중 하나에서 서비스 중단이 발생하면 전역 부하 분산기는 해당 리전에서 시작된 요청을 다른 리전으로 보냅니다. 리전이 지리적 영역 내에 있으므로 성능이 크게 영향을 받지 않습니다.

설계 대안

위의 아키텍처는 Cloud CDN을 사용한 에지 캐싱과 같이 배포 신뢰성을 향상시키기 위해 특정 기능을 지원하는 전역 부하 분산기를 사용합니다. 이 섹션에서는 리전 부하 분산기와 Cloud DNS를 사용하는 대체 아키텍처를 설명합니다. 이 대체 아키텍처는 다음과 같은 추가 기능을 지원합니다.

지정된 리전에서 전송 계층 보안(TLS) 종료
지정한 리전의 콘텐츠를 제공 가능. 그러나 리전은 특정 시점에 성능이 가장 우수한 리전이 아닐 수 있습니다.
패스 스루 네트워크 부하 분산기를 사용하는 경우 다양한 연결 프로토콜

리전 부하 분산기와 전역 부하 분산기의 차이점에 대한 자세한 내용은 전역 부하 분산과 리전 부하 분산 비교 및 작업 모드를 참조하세요.

리전 부하 분산기와 DNS를 사용하는 멀티 리전 아키텍처

위 다이어그램의 대체 아키텍처는 영역 및 리전 서비스 중단에 대해 견고합니다. Cloud DNS 공개 영역은 사용자 요청을 적절한 리전으로 라우팅합니다. 리전 외부 부하 분산기는 사용자 요청을 수신하여 각 리전 내 애플리케이션의 웹 계층 인스턴스에 배포합니다. 이 아키텍처의 다른 구성요소는 전역 부하 분산기 기반 아키텍처의 구성요소와 동일합니다.

설계 고려사항

이 섹션에서는 이 참조 아키텍처를 사용하여 시스템 설계, 보안, 안정성, 운영 효율성, 비용, 성능에 대한 특정 요구사항을 충족하는 아키텍처를 개발하는 데 도움이 되는 안내를 제공합니다.

워크로드의 아키텍처를 빌드할 때는 Google Cloud Well-Architected Framework의 권장사항과 추천을 고려하세요.

시스템 설계

이 섹션에서는 멀티 리전 배포에 사용할 Google Cloud 리전을 선택하고 적절한 Google Cloud서비스를 선택하는 데 도움이 되는 안내를 제공합니다.

리전 선택

애플리케이션을 배포해야 하는 Google Cloud 리전을 선택할 때 다음 요소와 요구사항을 고려합니다.

각 리전의 Google Cloud 서비스 가용성. 자세한 내용은 위치별 제공 제품을 참조하세요.
각 리전에서 Compute Engine 머신 유형 사용 가용성. 자세한 내용은 리전 및 영역을 참조하세요.
최종 사용자 지연 시간 요구사항
Google Cloud 리소스 비용
리전 간 데이터 전송 비용
규제 기관 요구사항

이러한 요소와 요구사항 중 일부는 장단점과 관련될 수 있습니다. 예를 들어 가장 비용 효율적인 리전의 탄소 발자국이 가장 낮은 것은 아닐 수 있습니다. 자세한 내용은 Compute Engine 리전 선택 권장사항을 참고하세요.

컴퓨팅 인프라

이 문서의 참조 아키텍처는 애플리케이션의 특정 계층에 Compute Engine VM을 사용합니다. 애플리케이션 요구사항에 따라 다른 Google Cloud 컴퓨팅 서비스 중에서 선택할 수 있습니다.

컨테이너: Google Kubernetes Engine(GKE) 클러스터에서 컨테이너화된 애플리케이션을 실행할 수 있습니다. GKE는 컨테이너화된 애플리케이션의 배포, 확장, 관리를 자동화하는 컨테이너 조정 엔진입니다.
서버리스: 인프라 리소스를 설정하고 운영하는 대신 데이터와 애플리케이션에 IT 노력을 집중하려는 경우 Cloud Run과 같은 서버리스 서비스를 사용할 수 있습니다.

VM, 컨테이너 또는 서버리스 서비스 사용 여부 결정에는 구성 유연성과 관리 노력 간의 균형이 맞아야 합니다. VM 및 컨테이너는 더 많은 구성 유연성을 제공하지만 개발자가 리소스를 관리해야 합니다. 서버리스 아키텍처에서는 최소한의 관리 노력이 필요한 사전 구성된 플랫폼에 워크로드를 배포합니다.Google Cloud의 워크로드에 적합한 컴퓨팅 서비스를 선택하는 방법에 대한 자세한 내용은 Google Cloud에서 애플리케이션 호스팅을 참조하세요.

스토리지 서비스

이 문서에 표시된 아키텍처는 모든 등급에 리전 Persistent Disk 볼륨을 사용합니다. 영구 디스크는 한 리전 내 두 영역 간에 데이터를 동기식으로 복제합니다.

Google Cloud Hyperdisk는 Persistent Disk보다 우수한 성능, 유연성, 효율성을 제공합니다. Hyperdisk Balanced를 사용하면 IOPS와 처리량을 별도로, 동적으로 프로비저닝할 수 있으므로, 다양한 워크로드에 맞게 볼륨을 조정할 수 있습니다.

여러 위치에 복제되는 저비용 스토리지를 원한다면 Cloud Storage 리전, 이중 리전 또는 멀티 리전 버킷을 사용할 수 있습니다.

리전 버킷의 데이터는 리전의 영역 간에 동기식으로 복제됩니다.
이중 리전 또는 멀티 리전 버킷의 데이터는 최소 두 개 이상의 지리적 위치에 중복 저장됩니다. 메타데이터는 리전 간에 동기식으로 기록되며 데이터는 비동기식으로 복제됩니다. 이중 리전 버킷의 경우 객체가 목표 복구 시간(RPO) 15분 내에 리전 쌍 간에 복제되는 터보 복제를 사용할 수 있습니다. 자세한 내용은 데이터 가용성 및 내구성을 참조하세요.

웹 계층 또는 애플리케이션 계층의 모든 VM과 같이 한 리전의 여러 VM 간에 공유되는 데이터를 저장하려면 Filestore 리전 인스턴스를 사용하면 됩니다. Filestore 리전 인스턴스에 저장하는 데이터는 리전 내 영역 3개에 동기식으로 복제됩니다. 이 복제는 고가용성을 보장하고 영역 서비스 중단에 대한 견고성을 보장합니다. 공유 구성 파일, 일반적인 도구 및 유틸리티, 중앙 집중식 로그를 Filestore 인스턴스에 저장하고 인스턴스를 여러 VM에 마운트할 수 있습니다. 리전 서비스 중단에 대한 견고성을 확보하려면 Filestore 인스턴스를 다른 리전으로 복제할 수 있습니다. 자세한 내용은 인스턴스 복제를 참조하세요.

데이터베이스가 Microsoft SQL Server인 경우 SQL Server용 Cloud SQL을 사용하는 것이 좋습니다. Cloud SQL이 구성 요구사항을 지원하지 않거나 운영체제에 액세스해야 하는 경우 Microsoft SQL Server 장애 조치 클러스터 인스턴스(FCI)를 배포할 수 있습니다. 이 시나리오에서는 완전 관리형 Google Cloud NetApp Volumes를 사용하여 데이터베이스에 지속적인 가용성(CA) SMB 스토리지를 제공할 수 있습니다.

워크로드에 맞게 스토리지를 설계할 때는 기능적 특성, 복원력 요구사항, 성능 기대치, 비용 목표를 고려합니다. 자세한 내용은 클라우드 워크로드에 최적화된 스토리지 전략 설계를 참조하세요.

데이터베이스 서비스

이 문서의 참조 아키텍처에서는 Compute Engine VM에 배포된 서드 파티 데이터베이스를 사용합니다. 서드 파티 데이터베이스를 설치 및 관리하려면 업데이트 적용, 가용성 모니터링 및 보장, 백업 수행, 장애 복구와 같은 노력과 비용이 필요합니다.

Cloud SQL, PostgreSQL용 AlloyDB, Bigtable, Spanner 또는Firestore와 같은 완전 관리형 데이터베이스 서비스를 사용하면 서드 파티 데이터베이스를 설치하고 관리하는 데 드는 수고와 비용을 줄일 수 있습니다. Google Cloud 데이터베이스 서비스는 업타임 서비스수준계약(SLA)을 제공하며 확장성과 모니터링 가능성을 위한 기본 기능을 포함합니다.

워크로드에 Oracle 데이터베이스가 필요한 경우 Compute Engine VM에 데이터베이스를 배포하거나 Oracle Database@Google Cloud를 사용할 수 있습니다. 자세한 내용은 Google Cloud의 Oracle 워크로드를 참고하세요.

멀티 리전 배포에 사용할 데이터베이스를 선택하고 설정할 때 리전 간 데이터 일관성을 위한 애플리케이션 요구사항을 고려하고 성능과 비용의 절충점을 파악합니다.

애플리케이션에 strong consistency가 필요한 경우(모든 사용자가 항상 같은 데이터를 읽어야 함) 데이터는 아키텍처의 모든 리전에 동기식으로 복제되어야 합니다. 하지만 데이터를 읽을 수 있으려면 기록된 데이터를 리전 간에 실시간으로 복제해야 하므로 동기식 복제를 사용하면 비용이 증가하고 성능이 저하될 수 있습니다.
애플리케이션에서 eventual consistency를 톨러레이션(toleration)할 수 있는 경우 데이터를 비동기식으로 복제할 수 있습니다. 데이터를 리전 간에 동기식으로 복제할 필요가 없으므로 성능을 개선하는 데 도움이 됩니다. 하지만 데이터가 요청 시점에 완전히 복제되지 않을 수 있으므로 다른 리전의 사용자가 다른 데이터를 읽을 수 있습니다.

네트워크 설계

비즈니스 및 기술 요구사항을 충족하는 네트워크 설계를 선택하세요. 단일 VPC 네트워크 또는 여러 VPC 네트워크를 사용할 수 있습니다. 자세한 내용은 다음 문서를 참조하세요.

보안, 개인 정보 보호, 규정 준수

이 섹션에서는 이 참조 아키텍처를 사용하여Google Cloud 에 워크로드의 보안, 개인 정보 보호, 규정 준수 요구사항을 충족하는 리전 토폴로지를 설계하고 빌드할 때 고려해야 하는 요소를 설명합니다.

외부 위협으로부터 보호

DDoS 공격 및 교차 사이트 스크립팅(XSS)과 같은 위협으로부터 애플리케이션을 보호하려면 Google Cloud Armor 보안 정책을 사용하면 됩니다. 각 정책은 평가해야 하는 특정 조건과 조건이 충족될 때 수행할 작업을 지정하는 일련의 규칙입니다. 예를 들어 들어오는 트래픽의 소스 IP 주소가 특정 IP 주소나 CIDR 범위와 일치할 경우, 해당 트래픽이 거부되도록 규칙을 지정할 수 있습니다. 사전 구성된 웹 애플리케이션 방화벽 (WAF) 규칙을 적용할 수도 있습니다. 자세한 내용은 보안 정책 개요를 참조하세요.

VM의 외부 액세스

이 문서에서 설명하는 참조 아키텍처에서 Compute Engine VM은 인터넷의 인바운드 액세스가 필요하지 않습니다. 이러한 VM에는 외부 IP 주소를 할당하지 마세요.비공개 내부 IP 주소만 있는 Google Cloud 리소스는 여전히 Private Service Connect 또는 비공개 Google 액세스를 사용하여 특정 Google API 및 서비스에 액세스할 수 있습니다. 자세한 내용은 서비스 비공개 액세스 옵션을 참조하세요.

이 참조 아키텍처의 Compute Engine VM과 같이 비공개 IP 주소만 있는 Google Cloud 리소스에서 보안 아웃바운드 연결을 사용 설정하려면 Secure Web Proxy 또는 Cloud NAT를 사용하면 됩니다.

서비스 계정 권한

아키텍처의 Compute Engine VM의 경우 기본 서비스 계정을 사용하는 대신 전용 서비스 계정을 만들고 서비스 계정이 액세스할 수 있는 리소스를 지정하는 것이 좋습니다. 기본 서비스 계정에는 필요하지 않을 수 있는 권한까지 포함해 광범위한 권한이 부여 되어 있습니다. 전용 서비스 계정을 만들어 필수 권한만 부여하도록 조정할 수 있습니다. 자세한 내용은 서비스 계정 권한 제한을 참조하세요.

SSH 보안

아키텍처 내 Compute Engine VM에 대한 SSH 연결 보안을 강화하려면 IAP(Identity-Aware Proxy) 및 Cloud OS 로그인 API를 구현하세요. IAP를 사용하면 사용자 ID 및 Identity and Access Management(IAM) 정책을 기반으로 네트워크 액세스를 제어할 수 있습니다. Cloud OS 로그인 API를 사용하면 사용자 ID 및 IAM 정책을 기반으로 Linux SSH 액세스를 제어할 수 있습니다. 네트워크 액세스 관리에 관한 자세한 내용은 SSH 로그인 액세스 제어 권장사항을 참조하세요.

디스크 암호화

기본적으로 Persistent Disk 볼륨에 저장되는 데이터는Google-owned and Google-managed encryption keys를 사용하여 암호화됩니다. 추가 보호 조치로 Cloud Key Management Service(Cloud KMS)에서 소유하고 관리하는 키를 사용하여 Google-owned and managed key 를 암호화할 수 있습니다. 자세한 내용은 Hyperdisk 볼륨의 디스크 암호화 정보 및 고객 관리 암호화 키로 데이터 암호화를 참조하세요.

네트워크 보안

아키텍처에서 리소스 간 네트워크 트래픽을 제어하려면 적절한 Cloud 차세대 방화벽(NGFW) 정책을 구성해야 합니다.

데이터 보존 고려사항

리전 부하 분산기를 사용하여 데이터 상주 요구사항을 충족하는 데 도움이 되는 멀티 리전 아키텍처를 빌드할 수 있습니다. 예를 들어 유럽의 한 국가에서 모든 사용자 데이터를 물리적으로 유럽 내에 있는 데이터 센터에 저장하고 액세스하도록 요구할 수 있습니다. 이 요구사항을 충족하려면 리전 부하 분산기 기반 아키텍처를 사용하면 됩니다. 이 아키텍처에서 애플리케이션은 유럽의Google Cloud 리전에서 실행되며 개발자는 지오펜싱 라우팅 정책과 함께 Cloud DNS를 사용하여 리전 부하 분산기를 통해 트래픽을 라우팅합니다. 데이터베이스 계층에 대한 데이터 상주 요구사항을 충족하려면 리전 간 복제 대신 샤딩된 아키텍처를 사용합니다. 이 방법을 사용하면 각 리전의 데이터가 격리되지만 데이터베이스에 리전 간 고가용성과 장애 조치를 구현할 수는 없습니다.

추가 보안 고려사항

워크로드의 아키텍처를 빌드할 때는 엔터프라이즈 기반 청사진 및 Google Cloud Well-Architected Framework: 보안, 개인 정보 보호, 규정 준수에서 제공하는 플랫폼 수준 보안 권장사항과 추천을 고려하세요.

안정성

이 섹션에서는 이 참조 아키텍처를 사용하여 Google Cloud에서 멀티 리전 배포를 위한 안정적인 인프라를 빌드하고 운영할 때 고려해야 하는 설계 요소를 설명합니다.

인프라 중단에 대한 견고성

멀티 리전 배포 아키텍처에서는 인프라 스택의 개별 구성요소가 실패하면 작동 중인 적절한 용량의 구성요소가 각 계층에 하나 이상 존재할 경우 애플리케이션이 요청을 처리할 수 있습니다. 예를 들어 웹 서버 인스턴스가 실패하면 부하 분산기가 사용자 요청을 다른 사용할 수 있는 웹 서버 인스턴스로 전달합니다. 웹 서버 또는 앱 서버 인스턴스를 호스팅하는 VM이 충돌하면 MIG가 VM을 자동으로 다시 만듭니다.

리전별 리소스이기 때문에 영역 서비스 중단이 발생해도 부하 분산기는 영향을 받지 않습니다. 영역 서비스 중단은 개별 Compute Engine VM에 영향을 줄 수 있습니다. 그러나 VM이 리전 MIG에 있으므로 애플리케이션의 가용성 및 응답성이 유지됩니다. 리전 MIG는 새 VM을 자동으로 생성하여 구성된 VM 수를 최소한으로 유지합니다. Google에서 영역 서비스 중단이 해결된 후에는 배포된 모든 영역에서 애플리케이션이 예상한 대로 작동하는지 확인해야 합니다.

한 리전의 모든 영역에서 중단이 발생하거나 리전 전체에서 중단이 발생한 경우 다른 리전의 애플리케이션은 계속 사용할 수 있고 응답합니다. 전역 외부 부하 분산기가 중단의 영향을 받지 않는 리전으로 트래픽을 전달합니다. Google에서 리전 중단을 해결한 후에는 중단이 발생한 리전에서 애플리케이션이 예상한 대로 작동하는지 확인해야 합니다.

이 아키텍처에서 두 리전에 모두 중단이 발생하면 애플리케이션을 사용할 수 없습니다. Google에서 중단이 해결될 때까지 기다린 후 애플리케이션이 예상한 대로 작동하는지 확인해야 합니다.

MIG 자동 확장

여러 리전 MIG에서 애플리케이션을 실행하는 경우 격리된 영역 서비스 중단이나 리전 서비스 중단 중에도 애플리케이션을 계속 사용할 수 있습니다. 스테이트리스(Stateless) MIG의 자동 확장 기능을 사용하면 예측 가능한 수준에서 애플리케이션 가용성과 성능을 유지할 수 있습니다.

스테이트리스(Stateless) MIG의 자동 확장 동작을 제어하려면 평균 CPU 사용률과 같은 대상 사용률 측정항목을 지정하면 됩니다. 스테이트리스(Stateless) MIG에 일정 기반 자동 확장도 구성할 수 있습니다. 스테이트풀(Stateful) MIG를 자동 확장할 수 없습니다. 자세한 내용은 인스턴스 그룹 자동 확장을 참조하세요.

MIG 크기 한도

MIG의 크기를 결정할 때는 MIG에서 만들 수 있는 VM 수에 대한 기본 및 최대 한도를 고려하세요. 자세한 내용은 MIG에서 VM 추가 및 삭제를 참고하세요.

VM 자동 복구

간혹 애플리케이션을 호스팅하는 VM이 실행 중이고 사용 가능할 수 있지만 애플리케이션 자체에 문제가 있을 수 있습니다. 애플리케이션이 중단되거나, 비정상 종료되거나, 메모리가 부족할 수 있습니다. 애플리케이션이 예상대로 응답하는지 확인하려면 MIG의 자동 복구 정책의 일부로 애플리케이션 기반 상태 점검을 구성하면 됩니다. 특정 VM의 애플리케이션이 응답하지 않으면 MIG에서 VM을 자동 복구 (복구)합니다. 자동 복구 구성에 관한 자세한 내용은 고가용성을 위한 VM 복구 정보를 참고하세요.

VM 배치

이 문서에서 설명하는 아키텍처에서 애플리케이션 계층과 웹 계층은 여러 영역에 분산된 Compute Engine VM에서 실행됩니다. 이러한 분산은 영역의 서비스 중단에 대한 애플리케이션의 견고성을 보장합니다.

아키텍처의 견고성을 향상시키기 위해서는 분산 배치 정책을 만들고 이를 MIG 템플릿에 적용하면 됩니다. MIG에서 VM을 만들 때 각 영역 내의 VM을 여러 물리적 서버(호스트라고 함)에 배치하므로 VM이 개별 호스트 오류에 대해 견고합니다. 자세한 내용은 분산 배치 정책을 만들고 VM에 적용을 참조하세요.

VM 용량 계획

Compute Engine VM을 프로비저닝해야 할 때 VM 용량이 확보되도록 하려면 예약을 만들면 됩니다. 예약을 사용하면 특정 영역에서 선택한 머신 유형에 지정된 VM 수에 따라 일정 용량을 보장할 수 있습니다. 예약은 프로젝트에 따라 다르게 지정할 수 있고 여러 프로젝트 간에 공유할 수 있습니다. 예약에 대한 자세한 내용은 예약 유형 선택을 참조하세요.

스테이트풀(Stateful) 스토리지

애플리케이션 설계에서 권장사항은 스테이트풀(Stateful) 로컬 디스크가 필요하지 않도록 하는 것입니다. 하지만 요구사항이 있는 경우 VM을 복구하거나 다시 만들 때 데이터가 보존되도록 영구 디스크를 스테이트풀(Stateful)로 구성할 수 있습니다. 하지만 새 버전이고 보안 패치가 적용된 최신 이미지로 영구 디스크를 업데이트할 수 있도록 부팅 디스크를 스테이트리스(Stateless)로 유지하는 것이 좋습니다. 자세한 내용은 MIG에서 스테이트풀(Stateful) 영구 디스크 구성을 참조하세요.

데이터 내구성

백업 및 DR을 사용하여 Compute Engine VM의 백업을 생성, 저장, 관리할 수 있습니다. 백업 및 DR은 백업 데이터를 애플리케이션에서 읽을 수 있는 원본 형식으로 저장합니다. 필요한 경우 데이터 이동이나 준비 활동 없이 장기 백업 스토리지에서 데이터를 직접 사용하여 워크로드를 프로덕션으로 복원할 수 있습니다.

Compute Engine은 다음과 같이 Persistent Disk 볼륨에 저장된 데이터의 내구성을 보장하는 데 도움이 되는 옵션을 제공합니다.

스냅샷을 사용하여 Persistent Disk 볼륨의 특정 시점 상태를 캡처할 수 있습니다. 스냅샷은 데이터 무결성을 보장하는 자동 체크섬을 통해 여러 리전에 중복 저장됩니다. 스냅샷은 기본적으로 증분적으로 사용되므로 저장공간이 적게 사용되고 비용이 절약됩니다. 스냅샷은 구성 가능한 Cloud Storage 위치에 저장됩니다. 스냅샷 사용 및 관리에 대한 추가 권장사항은 Compute Engine 디스크 스냅샷 권장사항을 참조하세요.
영역 서비스 중단이 발생하더라도 Persistent Disk의 데이터가 계속 사용 가능하도록 하려면 리전 Persistent Disk 또는 Hyperdisk Balanced High Availability를 사용할 수 있습니다. 이러한 디스크 유형에서는 데이터가 동일 리전 내 두 영역 간에 동기식으로 복제됩니다. 자세한 내용은 동기식 디스크 복제 정보를 참조하세요.

데이터베이스 가용성

Compute Engine VM에 배포된 데이터베이스에 영역 간 장애 조치를 구현하려면 기본 데이터베이스 오류를 식별하는 메커니즘과 대기 데이터베이스에 장애 조치를 수행할 프로세스가 필요합니다. 장애 조치 메커니즘의 세부 사항은 사용하는 데이터베이스에 따라 달라집니다. 관찰자 인스턴스를 설정하여 기본 데이터베이스 오류를 감지하고 장애 조치를 조정할 수 있습니다. 분할 브레인 상황을 방지하고 불필요한 장애 조치를 방지하려면 장애 조치 규칙을 적절하게 구성해야 합니다. PostgreSQL 데이터베이스에 장애 조치를 구현하는 데 사용할 수 있는 아키텍처의 예시는 Compute Engine 기반 PostgreSQL 클러스터의 고가용성을 위한 아키텍처를 참조하세요.

추가 안정성 고려사항

워크로드의 클라우드 아키텍처를 빌드할 때는 다음 문서에서 제공하는 안정성 관련 권장사항과 추천을 검토합니다.

비용 최적화

이 섹션에서는 이 참조 아키텍처를 사용하여 빌드하는 멀티 리전 Google Cloud 토폴로지의 설정 및 운영 비용을 최적화하는 방법을 안내합니다.

VM 머신 유형

VM 인스턴스의 리소스 사용률 최적화에 도움이 되도록 Compute Engine에서 머신 유형 권장사항을 제공합니다. 권장사항에 따라 워크로드의 컴퓨팅 요구사항과 일치하는 머신 유형을 선택합니다. 예측 가능한 리소스 요구사항이 있는 워크로드의 경우 커스텀 머신 유형을 사용하여 머신 유형을 필요에 맞게 맞춤설정하고 비용을 절약할 수 있습니다.

VM 프로비저닝 모델

애플리케이션이 내결함성인 경우 스팟 VM을 사용하면 애플리케이션 및 웹 계층의 VM에 대한 Compute Engine 비용을 줄일 수 있습니다. 스팟 VM 비용은 일반 VM보다 훨씬 저렴합니다. 하지만 Compute Engine에서 스팟 VM을 사전에 중지하거나 삭제하여 용량을 확보할 수 있습니다.

스팟 VM은 선점을 허용할 수 있지만 고가용성 요구사항이 없는 일괄 작업에 적합합니다. 스팟 VM은 일반 VM과 동일한 머신 유형, 옵션, 성능을 제공합니다. 하지만 영역의 리소스 용량이 제한되면 MIG는 필요한 용량을 다시 사용할 수 있게 될 때까지 지정된 대상 크기로 자동으로 수평 확장(즉, VM 만들기)하지 못할 수 있습니다.

VM 리소스 사용률

스테이트리스(Stateless) MIG의 자동 확장 기능을 사용하면 애플리케이션에서 트래픽 증가를 원활하게 처리할 수 있으며 리소스 필요성이 줄어들면 비용을 절감할 수 있습니다. 스테이트풀(Stateful) MIG를 자동 확장할 수 없습니다.

서드 파티 라이선스

서드 파티 워크로드를 Google Cloud로 마이그레이션할 때 사용자 라이선스 사용(BYOL)을 통해 비용을 절감할 수 있습니다. 예를 들어 Microsoft Windows Server VM을 배포하기 위해 서드 파티 라이선스에 대한 추가 비용이 발생하는 프리미엄 이미지를 사용하는 대신 커스텀 Windows BYOL 이미지를 만들고 사용할 수 있습니다. 그런 다음 Google Cloud에서 사용하는 VM 인프라에 대해서만 비용을 지불합니다. 이 전략은 서드 파티 라이선스에 대한 기존 투자의 가치를 지속적으로 실현하는 데 도움이 됩니다. 사용자 라이선스 사용 방식을 사용하기로 결정한 경우 다음 권장사항이 비용 절감에 도움이 될 수 있습니다.

커스텀 머신 유형을 사용하여 메모리와 독립적으로 필요한 컴퓨팅 CPU 코어 수를 프로비저닝합니다. 이렇게 하면 서드 파티 라이선스 비용이 필요한 CPU 코어 수로 제한됩니다.
동시 멀티스레딩(SMT)을 사용 중지하여 코어당 vCPU 수를 2개에서 1개로 줄입니다.

Compute Engine VM에 Microsoft SQL Server와 같은 서드 파티 데이터베이스를 배포하는 경우 서드 파티 소프트웨어의 라이선스 비용을 고려해야 합니다. Cloud SQL과 같은 관리형 데이터베이스 서비스를 사용하면 데이터베이스 라이선스 비용은 서비스 요금에 포함됩니다.

추가 비용 고려사항

워크로드의 아키텍처를 빌드할 때는 Google Cloud Well-Architected Framework: 비용 최적화에서 제공하는 일반 권장사항과 추천도 고려하세요.

운영 효율성

이 섹션에서는 이 참조 아키텍처를 사용하여 효율적으로 운영할 수 있는 멀티 리전 Google Cloud토폴로지를 설계하고 빌드할 때 고려해야 해야 요소를 설명합니다.

VM 구성 업데이트

MIG의 VM 구성(예: 머신 유형 또는 부팅 디스크 이미지)을 업데이트하려면 필수 구성으로 새 인스턴스 템플릿을 만든 후 새 템플릿을 MIG에 적용합니다. MIG는 자동 업데이트 또는 선택적 업데이트 방법을 통해 VM을 업데이트합니다. 가용성 및 운영 효율성 요구사항에 따라 적절한 방법을 선택합니다. 이러한 MIG 업데이트 방법에 대한 자세한 내용은 MIG에서 새 VM 구성 적용을 참조하세요.

VM 이미지

VM의 경우 Google에서 제공하는 공개 이미지를 사용하는 대신 애플리케이션에 필요한 구성과 소프트웨어가 포함된 커스텀 OS 이미지를 만들고 사용하는 것이 좋습니다. 커스텀 이미지를 커스텀 이미지 계열로 그룹화할 수 있습니다. 이미지 계열은 항상 계열 내에 있는 최신 이미지를 가리키므로 인스턴스 템플릿과 스크립트에서 특정 이미지 버전에 대한 참조를 업데이트하지 않아도 최신 이미지를 사용할 수 있습니다. OS 공급업체에서 제공하는 보안 업데이트 및 패치를 포함하도록 커스텀 이미지를 정기적으로 업데이트해야 합니다.

확정 인스턴스 템플릿

MIG에 사용하는 인스턴스 템플릿에 서드 파티 소프트웨어를 설치할 수 있는 시작 스크립트가 포함된 경우 스크립트에서 소프트웨어 버전과 같은 소프트웨어 설치 매개변수를 명시적으로 지정해야 합니다. 그렇지 않으면 MIG에서 VM을 만들 때 VM에 설치된 소프트웨어가 일관되지 않을 수 있습니다. 예를 들어 인스턴스 템플릿에 Apache HTTP 서버 2.0(apache2 패키지)을 설치할 수 있는 시작 스크립트가 포함된 경우 스크립트에서 설치해야 하는 apache2 버전(예: 2.4.53)을 정확하게 지정해야 합니다. 자세한 내용은 확정 인스턴스 템플릿을 참조하세요.

추가 운영 고려사항

워크로드의 아키텍처를 빌드할 때 Google Cloud Well-Architected Framework: 운영 우수성에 설명된 운영 효율성에 대한 일반적인 권장사항과 추천을 고려하세요.

성능 최적화

이 섹션에서는 이 참조 아키텍처를 사용하여Google Cloud 에서 워크로드 성능 요구사항을 충족하는 멀티 리전 토폴로지를 설계하고 빌드할 때 고려해야 하는 요소를 설명합니다.

컴퓨팅 성능

Compute Engine은 VM에서 실행하는 워크로드에 맞게 사전 정의되고 맞춤설정 가능한 다양한 머신 유형을 제공합니다. 성능 요구사항에 따라 적절한 머신 유형을 선택하세요. 자세한 내용은 머신 계열 리소스 및 비교 가이드를 참조하세요.

VM 멀티스레딩

Compute Engine VM에 할당하는 각 가상 CPU(vCPU)는 단일 하드웨어 멀티 스레드로 구현됩니다. 기본적으로 2개의 vCPU가 물리적 CPU 코어를 공유합니다. 고도로 병렬 연산을 수행하거나 부동 소수점 계산(예: 유전자 서열 분석 및 금융 위험 모델링 등)을 수행하는 애플리케이션의 경우 각 물리적 CPU 코어에서 실행되는 스레드 수를 줄여 성능을 향상시킬 수 있습니다. 자세한 내용은 코어당 스레드 수 설정을 참조하세요.

VM 멀티스레딩은 데이터베이스와 같은 일부 서드 파티 소프트웨어의 라이선스에 영향을 줄 수 있습니다. 자세한 내용은 서드 파티 소프트웨어의 라이선스 문서를 참조하세요.

네트워크 서비스 등급

네트워크 서비스 등급을 사용하면 워크로드의 네트워크 비용과 성능을 최적화할 수 있습니다. 프리미엄 등급 또는 표준 등급을 선택할 수 있습니다. 프리미엄 등급은 트래픽이 Google의 글로벌 백본을 통해 전달되어 최소한의 패킷 손실과 짧은 지연 시간을 달성합니다. 표준 등급은 Google Cloud 워크로드가 실행되는 리전에 가장 가까운 에지 접속 지점 (PoP)에서 피어링, 인터넷 서비스 제공업체 (ISP) 또는 중계 접속 네트워크를 사용하여 트래픽을 전송합니다. 성능을 최적화하려면 프리미엄 등급을 사용하는 것이 좋습니다. 비용을 최적화하려면 표준 등급을 사용하는 것이 좋습니다.

네트워크 성능

애플리케이션 및 웹 계층 내에서 VM 간 네트워크 지연 시간을 줄여야 하는 워크로드의 경우 압축 배치 정책을 만들고 해당 계층에 사용되는 MIG 템플릿에 적용할 수 있습니다. MIG에서 VM을 만들 때 서로 가까운 물리적 서버에 배치합니다. 압축 배치 정책은 VM 간 네트워크 성능을 개선하는 데 도움이 되지만, 분산 배치 정책은 앞서 설명한 대로 VM 가용성을 개선하는 데 도움이 됩니다. 네트워크 성능과 가용성 간에 최적의 균형을 이루려면 압축 배치 정책을 만들 때 VM을 배치해야 하는 거리를 지정하면 됩니다. 자세한 내용은 배치 정책 개요를 참조하세요.

Compute Engine에는 이그레스 네트워크 대역폭에 대한 VM별 제한이 있습니다. 이 한도는 VM의 머신 유형과 트래픽이 소스 VM과 동일한 VPC 네트워크를 통해 라우팅되는지에 따라 다릅니다. 특정 머신 유형의 VM의 경우 네트워크 성능을 개선하기 위해 Tier_1 네트워킹을 사용 설정하여 더 높은 최대 이그레스 대역폭을 얻을 수 있습니다.

캐싱

애플리케이션에서 정적 웹사이트 애셋을 제공하고 아키텍처에 전역 외부 애플리케이션 부하 분산기가 포함된 경우 Cloud CDN을 사용하여 사용자와 밀접한 정기적으로 액세스되는 정적 콘텐츠를 캐시할 수 있습니다. Cloud CDN은 사용자를 위해 성능을 향상시키고 백엔드에서 인프라 리소스 사용량을 줄이며 네트워크 전송 비용을 줄이는 데 도움이 됩니다. 자세한 내용은 부하 분산을 위한 웹 성능 및 웹 보호 개선을 참고하세요.

추가 성능 고려사항

워크로드의 아키텍처를 빌드할 때 Google Cloud Well-Architected Framework: 성능 최적화에서 제공하는 일반적인 권장사항과 추천을 고려하세요.

다음 단계

이 참조 아키텍처에 사용되는 Google Cloud 제품에 대해 자세히 알아보기
Google Cloud로의 워크로드 마이그레이션 시작하기
클라우드 워크로드의 아키텍처를 빌드하기 위해 선택할 수 있는 배포 원형을 살펴보고 평가합니다.
Google Cloud의 워크로드에 대한 안정적인 인프라 설계를 위한 아키텍처 옵션 살펴보기
더 많은 참조 아키텍처, 설계 가이드, 권장사항을 알아보려면 클라우드 아키텍처 센터를 살펴보세요.

참여자

저자:

저자: 쿠마르 다나고팔 | 크로스 프로덕트 솔루션 개발자
사만다 헤 | 테크니컬 라이터

기타 참여자:

벤 굿 | 솔루션 설계자
칼 프랭클린 | PSO Enterprise 아키텍처 부문 이사
다니엘 리 | 클라우드 보안 설계자
글렙 오토흐킨 | Cloud Advocate, 데이터베이스
마크 슐라겐하우프 | 네트워킹 테크니컬 라이터
파월 벤다 | 그룹 제품 관리자
션 데링턴 | 그룹 제품 관리자, 스토리지
세쿠 페이지 | 아웃바운드 제품 관리자
쇼비트 굽타 | 솔루션 설계자
시몬 베넷 | 그룹 제품 관리자
스티브 맥기 | 안정성 옹호자
빅터 모레노 | Cloud Networking 제품 관리자