Compute Engine 인스턴스 프로비저닝 모델


이 문서에서는 Compute Engine 인스턴스의 프로비저닝 모델을 설명합니다. 배포 옵션에 대해 자세히 알아보려면 워크로드에 맞는 Compute Engine 배포 전략 선택을 참고하세요.

프로비저닝 모델은 인스턴스의 가용성, 수명, 가격을 결정합니다. 이러한 모델을 이해하면 워크로드에 가장 적합한 옵션을 선택할 수 있습니다.

사용 가능한 프로비저닝 모델

컴퓨팅 인스턴스를 만들 때 다음 프로비저닝 모델 중 하나를 지정할 수 있습니다. 프로비저닝 모델을 지정하지 않으면 Compute Engine은 기본적으로 표준 프로비저닝 모델을 사용합니다.

다음 표에서는 각 프로비저닝 모델의 사용 사례와 가격을 비교할 수 있습니다.

표준 스팟 flex-start(미리보기) 예약에 따름
요약
  • 리소스 가용성에 따라 인스턴스를 즉시 만들 수 있습니다.
  • 인스턴스를 중지하거나 삭제할 시점을 관리할 수 있습니다.
  • 리소스 가용성에 따라 인스턴스를 즉시 만들 수 있습니다.
  • 인스턴스를 중지하거나 삭제할 시점을 관리할 수 있습니다. 하지만 Compute Engine에서 언제든지 인스턴스를 중지하거나 삭제하여 용량을 확보하도록 허용할 수도 있습니다.
  • 영역 관리형 인스턴스 그룹 (MIG)을 만든 후 Compute Engine에 GPU가 연결된 인스턴스를 MIG에 추가하도록 요청합니다. Compute Engine은 리소스 가용성을 기반으로 인스턴스 프로비저닝을 예약합니다.
  • 인스턴스를 삭제할 시점을 관리할 수 있습니다. 하지만 중지, 정지 또는 다시 만들 수는 없습니다. 인스턴스는 최대 7일 동안 실행됩니다. 그러면 Compute Engine에서 자동으로 삭제합니다.
  • GPU 또는 TPU가 연결된 인스턴스를 만들기 위해 향후 날짜에 용량을 예약하도록 요청할 수 있습니다. Google Cloud 에서 요청을 승인하면 지정된 날짜에 사용을 시작할 수 있는 예약이 생성됩니다.
  • 승인된 예약 기간 동안 인스턴스를 중지, 다시 시작, 삭제, 다시 만들 수 있으므로 필요에 따라 예약을 사용할 수 있습니다. 예약 기간이 종료되면 Compute Engine은 예약과 예약을 사용하는 모든 인스턴스를 자동으로 삭제합니다.
사용 사례 안정성과 연속 작동이 필요한 워크로드(예:
)에 적합합니다.
  • 웹 서버
  • 데이터베이스
  • 엔터프라이즈 애플리케이션
  • 개발 및 테스트
다음과 같은 중단을 허용할 수 있는 워크로드에 적합합니다.
  • 일괄 처리
  • 고성능 컴퓨팅(HPC)
  • 지속적 통합 및 지속적 배포(CI/CD)
  • 데이터 분석
  • 미디어 인코딩
  • 온라인 추론
안정성이 필요하고 7일 이내에 실행해야 하는 워크로드(예:
)
  • 소규모 모델 사전 학습
  • 모델 미세 조정
  • HPC 시뮬레이션
  • 일괄 추론
안정성과 특정 런타임이 필요한 워크로드에 적합합니다(예:
).
  • 최대 90일 동안 지속되는 워크로드:
    • 모델 사전 학습 작업
    • 모델 미세 조정 작업
    • HPC 시뮬레이션 워크로드
    • 단기적으로 예상되는 추론 워크로드 증가
  • 90일이 지난 워크로드:
    • 학습 워크로드
    • 추론 워크로드
가격 책정 인스턴스에 표준 가격이 적용됩니다. 자세한 내용은 VM 인스턴스 가격 책정을 참고하세요. 대부분의 vCPU, GPU, 로컬 SSD는 60~91% 할인된 가격으로 제공됩니다. 자세한 내용은 스팟 VM 가격 책정을 참고하세요. 인스턴스에서 사용하는 머신 계열 또는 TPU 버전에 따라 vCPU, GPU, TPU에 최대 53% 의 할인이 적용됩니다. 동적 워크로드 스케줄러 (DWS) 가격 책정을 참고하세요. 인스턴스에서 사용하는 머신 계열에 따라 vCPU 및 GPU에 최대 53% 의 할인이 적용됩니다. 자세한 내용은 가속기 최적화 VM 가격 책정을 참고하세요.
할당량 인스턴스를 만들면 표준 할당량이 사용됩니다. 인스턴스를 만들면 선점형 할당량 이 사용됩니다. 프로젝트에 선점형 할당량이 없으면 표준 할당량이 사용됩니다. Google Cloud 무료 등급 크레딧은 스팟 VM에는 적용되지 않습니다. MIG가 그룹에 인스턴스를 추가하면 선점형 할당량이 사용됩니다. 프로젝트에 선점형 할당량이 없으면 표준 할당량이 사용됩니다. 예약에 연결된 프로비저닝 모델에는 할당량이 적용되지 않습니다.

인스턴스 가용성 및 수명

다음 표에는 각 프로비저닝 모델의 컴퓨팅 인스턴스 가용성과 전체 기간이 나와 있습니다.

표준 스팟 flex-start(미리보기) 예약에 따름
생성 기본 요건 생성 기본 요건이 없습니다. 생성 기본 요건이 없습니다. 생성 기본 요건이 없습니다. 인스턴스를 만들려면 먼저 여러 블록의 미래용 예약 요청을 만들어 용량을 예약해야 합니다. 지정된 날짜 및 시간에 Compute Engine이 요청된 용량을 프로비저닝합니다. 그런 다음 인스턴스를 만들어 사용을 시작할 수 있습니다.
지원되는 머신 시리즈 A4 및 A3 Ultra를 제외한 모든 머신 계열을 사용할 수 있습니다. 다음을 제외한 모든 머신 계열을 사용할 수 있습니다.
  • M2 및 M3
  • 베어메탈 인스턴스
다음 머신 시리즈만 사용할 수 있습니다.
VM을 만들기 위해 용량을 예약하는 방법에 따라 다음 머신 시리즈만 사용할 수 있습니다.
인스턴스 가용성 요청한 리소스를 사용할 수 있는 한 언제든지 인스턴스를 만들 수 있습니다. 요청한 리소스를 사용할 수 있는 한 언제든지 인스턴스를 만들 수 있습니다. MIG에서 크기 조절 요청을 만들어야만 인스턴스를 만들 수 있습니다. Compute Engine은 DWS를 사용하여 리소스 가용성을 기반으로 요청된 용량 프로비저닝을 예약합니다. DWS를 사용하면 GPU와 같이 수요가 많은 리소스를 확보할 수 있습니다. 향후 날짜에 대한 용량을 예약한 후에만 인스턴스를 만들 수 있습니다. 요청한 날짜에 Compute Engine에서 요청된 용량을 제공하며, 이 용량을 사용하여 인스턴스를 만들 수 있습니다. TPU를 예약하면 Compute Engine에서 DWS를 사용하여 요청된 용량을 프로비저닝합니다. DWS를 사용하면 TPU와 같이 수요가 많은 리소스를 확보할 수 있습니다.
인스턴스 수명 다음과 같은 경우를 제외하고 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다.
  • 인스턴스가 사용하는 머신 유형이 라이브 마이그레이션을 지원하지 않으면 Compute Engine은 호스트 유지보수 이벤트 중에 인스턴스를 중지합니다.
  • 드물지만 호스트 오류로 인해 인스턴스가 중지될 수 있습니다.
다음과 같은 경우를 제외하고 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다.
  • Compute Engine은 언제든지 용량을 확보하기 위해 인스턴스를 중지하거나 삭제할 수 있습니다. 이 프로세스를 선점이라고 합니다.
  • 인스턴스가 사용하는 머신 유형이 라이브 마이그레이션을 지원하지 않는 경우 Compute Engine은 호스트 유지보수 이벤트 중에 인스턴스를 중지합니다.
  • 드물지만 호스트 오류로 인해 인스턴스가 중지될 수 있습니다.
프로비저닝된 인스턴스는 선택한 실행 기간 동안 실행되며 최대 7일 동안 실행될 수 있습니다. 인스턴스를 중지, 일시중지 또는 다시 만들 수 없습니다.

Compute Engine은 다음 중 하나가 발생하면 인스턴스를 삭제합니다.
  • 인스턴스 삭제를 요청합니다.
  • 인스턴스의 실행 시간이 종료됩니다.
다음과 같은 경우를 제외하고 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다.
  • Compute Engine은 호스트 유지보수 이벤트 중에 인스턴스를 중지합니다.
  • 요청된 용량을 프로비저닝하기 위해 자동으로 생성된 예약이 약속된 예약 기간의 종료 시점에 도달합니다. 이때 Compute Engine은 예약과 예약을 사용하는 모든 인스턴스를 자동으로 삭제합니다.
  • 드물지만 호스트 오류로 인해 인스턴스가 중지될 수 있습니다.

다음 단계