이 문서에서는 Compute Engine 인스턴스의 용량을 예약하는 데 사용할 수 있는 다양한 예약 유형을 설명합니다. 인스턴스를 만드는 데 사용할 수 있는 리소스에 대해 자세히 알아보려면 Compute Engine 인스턴스를 참고하세요.
예약을 사용하면 필요할 때마다 동일한 하드웨어 (메모리 및 vCPU)와 선택적 리소스(GPU, TPU 또는 로컬 SSD 디스크)를 사용하여 인스턴스를 만들 수 있는 리소스를 확보할 수 있습니다. 예약은 다음과 같은 이점을 제공합니다.
높은 용량 보장: 다음과 같은 향후 수요 증가에 대비해 리소스를 예약합니다.
성장
계획되었거나 계획되지 않은 사용량 급증
대규모 마이그레이션
백업 및 재해 복구
독점 액세스: 예약하면 다른 사용자가 예약된 리소스를 사용할 수 없습니다.
상속된 속성: 예약은 선택한 머신 계열과 동일한 속성을 상속합니다.
용량을 예약한 후에는 예약을 충족하는 인스턴스를 만드는 데 사용할 수 있습니다. 이러한 인스턴스를 만들 때는 추가 요금이 부과되지 않습니다. 디스크나 IP 주소와 같이 예약에 포함되지 않은 리소스에 대해서만 비용을 지불합니다.
제한사항
모든 예약 유형에는 다음과 같은 제한사항이 있습니다.
예약은 영역별 리소스입니다.
예약된 용량을 사용하여 다음 Compute Engine 리소스를 만들 수는 없습니다.
스팟 VM 또는 선점형 인스턴스
단독 테넌트 노드
예약 유형 선택
다음 다이어그램은 워크로드의 요구사항에 가장 적합한 Compute Engine 예약 유형을 선택하는 데 도움이 됩니다.
위 다이어그램의 질문은 다음과 같습니다.
지금 바로 용량이 필요한가요?
예: 다음 질문으로 이동합니다.
아니요: 질문 3으로 이동합니다.
용량을 유지하는 기간을 유연하게 조정해야 하나요?
예: 온디맨드 예약 사용을 참고하세요.
아니요: 다음 질문으로 이동합니다.
GPU와 같이 수요가 많은 리소스가 필요한가요?
예: 다음 질문으로 이동합니다.
아니요: 미래용 예약 사용하기를 참고하세요.
90일 이상 리소스가 필요하신가요?
예: AI 하이퍼컴퓨터에서 용량 예약하기를 참고하세요.
아니요: 캘린더 모드에서 미래용 예약 사용을 참고하세요.
온디맨드 예약 사용
주문형 예약을 사용하면 컴퓨팅 인스턴스의 용량을 예약하고 예약하는 즉시 사용할 수 있습니다. 온디맨드 예약을 만든 후 필요할 때마다 사용하거나 수정하거나 삭제할 수 있습니다.
자세한 내용은 예약 정보를 참고하세요.
미래용 예약 사용
일정 기간 동안 인스턴스를 예약하려면 미래용 예약을 사용하면 됩니다. 예약 요청을 만든 후 검토를 위해 Google Cloud 에 제출해야 합니다.Google Cloud 에서 요청을 검토하는 데 일반적으로 5일이 걸립니다. 요청이 승인되면 Compute Engine은 선택한 날짜와 시간에 요청한 용량으로 주문형 예약을 만듭니다. 이러한 예약을 사용하려면 예약을 사용하는 컴퓨팅 인스턴스를 만듭니다. 예약 기간이 종료된 후에는 예약을 수정하거나 삭제할 수 있습니다.
자세한 내용은 미래용 예약 요청 정보를 참고하세요.
캘린더 모드에서 미래용 예약 사용
최대 90일 동안 GPU 인스턴스 또는 TPU를 예약하려면 캘린더 모드에서 미래용 예약을 사용하면 됩니다. 이 유형의 예약을 만들려면 먼저 선택한 리소스 수와 유형이 리전에서 언제 사용 가능한지 확인하세요. 그런 다음 사용 가능한 것으로 확인된 속성으로 예약 요청을 만들어 제출합니다. 요청을 성공적으로 만들 수 있으면Google Cloud 가 1분 이내에 승인합니다. 요청이 승인되면 Compute Engine은 다음을 실행합니다.
Compute Engine이 온디맨드 예약을 만듭니다.
Compute Engine은 네트워크 지연 시간을 최소화하기 위해 요청된 리소스를 최대한 서로 가까운 위치에 예약합니다.
예약 기간이 시작되면 GPU 또는 TPU 인스턴스를 만들어 예약을 사용할 수 있습니다. 예약 기간이 끝나면 Compute Engine은 예약을 삭제하고 인스턴스에 지정된 종료 작업을 기반으로 예약을 사용하는 인스턴스를 중지하거나 삭제합니다.
자세한 내용은 캘린더 모드의 미래용 예약 요청 정보를 참고하세요.
AI Hypercomputer에서 용량 예약
계정팀에 문의하여 대규모 인공지능 (AI) 및 머신러닝 (ML) 워크로드용 GPU 인스턴스 예약을 요청합니다. Google에서 예약 요청 초안을 만든 후 모든 항목이 올바른지 확인하고 검토를 위해 제출합니다. Google Cloud 에서 요청을 즉시 승인하면 Compute Engine에서 다음 작업을 실행합니다.
Compute Engine이 주문형 예약을 만듭니다.
Compute Engine은 네트워크 지연 시간을 최소화하기 위해 요청된 리소스를 최대한 서로 가까운 위치에 예약합니다.
Compute Engine은 토폴로지 인식 예약과 향상된 모니터링 및 유지관리로 리소스를 예약합니다.
예약 기간이 시작되면 GPU 인스턴스를 만들어 예약을 사용할 수 있습니다. 예약 기간이 끝나면 Compute Engine은 예약을 삭제하고 인스턴스에 지정된 종료 작업을 기반으로 예약을 사용하는 인스턴스를 중지하거나 삭제합니다.
자세한 내용은 AI 하이퍼컴퓨터 문서의 용량 예약을 참고하세요.