배정 할당량


이 문서에서는 Compute Engine에 적용되는 배정 할당량을 다룹니다.

배정 할당량

배정 할당량(리소스 할당량이라고도 함)은 프로젝트에서 액세스할 수 있는 리소스 수를 정의합니다. Compute Engine은 다양한 이유로 리소스 사용량에 배정 할당량을 적용합니다. 예를 들어 할당량은 사용량이 예기치 않게 급증하는 것을 방지하여 Google Cloud 사용자 커뮤니티를 보호하는 데 도움이 됩니다. Google Cloud에서는 프로젝트를 제한적으로 이용할 수 있는 무료 체험판 할당량도 제공하므로 무료로 Google Cloud를 살펴볼 수 있습니다.

모든 프로젝트의 할당량이 동일하지는 않습니다. Google Cloud가 점차 늘어나면 할당량도 이에 따라 늘릴 수 있습니다. 앞으로 사용량이 현저하게 늘어날 것으로 예상되는 경우 Google Cloud 콘솔의 할당량 페이지에서 사전에 할당량 조정을 요청할 수 있습니다.

Compute Engine API의 비율 제한 할당량에 대한 자세한 내용은 API 할당량을 참조하세요.

할당량 및 리소스 가용성

배정 할당량이란 사용 가능한 리소스가 있을 때 해당 리소스 유형에 대하여 만들 수 있는 최대 리소스 수입니다. 할당량에서는 리소스를 항상 사용할 수 있다고 보장하지 않습니다. 사용 가능한 리소스가 없거나 선택한 리전에 리소스가 없다면 리전이나 프로젝트에 할당량이 남아 있더라도 해당 유형의 리소스를 새로 만들 수 없습니다. 예를 들어 us-central1에 새 외부 IP 주소를 만들 수 있는 할당량이 아직 남아 있지만 해당 리전에 사용 가능한 IP 주소가 없을 수도 있습니다.

마찬가지로 리전별 할당량이 있더라도 특정 영역에서 리소스를 사용하지 못할 수도 있습니다. 예를 들어 us-central1 리전에 VM 인스턴스를 만들 수 있는 할당량이 남아 있어도 us-central1-a 영역이 고갈되었다면 이 영역에서는 VM 인스턴스를 만들 수 없습니다. 이러한 경우 us-central1-f와 같은 다른 영역에서 동일한 리소스를 만들어 보세요. 영역 리소스가 고갈된 경우의 옵션에 대해 자세히 알아보려면 리소스 가용성 문제 해결 문서를 참조하세요.

배정 할당량

VM 인스턴스 요구사항을 계획할 경우 만들 수 있는 VM 인스턴스 수에 영향을 미치는 여러 할당량을 고려해야 합니다.

리전 및 전역 할당량

VM 할당량은 리전 수준에서 관리됩니다. VM 인스턴스, 인스턴스 그룹, 디스크 할당량, CPU는 영역에 관계없이 리전의 모든 VM에서 사용될 수 있습니다. 예를 들어 CPU 할당량은 리전 할당량이므로 리전마다 한도와 사용량 집계가 다릅니다. us-central1 리전에 있는 영역에서 n2-standard-16 인스턴스를 실행하려면 us-central1에 CPU 16개 이상의 할당량이 필요합니다.

네트워킹과 부하 분산 할당량은 방화벽, 부하 분산기, 네트워크, VPN을 만드는 데 필요하며, 이러한 할당량은 리전에 따라 달라지지 않는 글로벌 할당량입니다. 모든 리전에서 글로벌 할당량을 사용할 수 있습니다. 예를 들어 부하 분산기와 HTTP 또는 HTTPS 프록시에 할당되어 사용 중인 고정 외부 IP 주소는 전역 할당량을 사용합니다.

VM 인스턴스

VM 인스턴스 할당량은 리전 할당량이며 VM 실행 여부와 관계없이 특정 리전에 존재할 수 있는 VM 인스턴스 수를 제한합니다. 이 할당량은 Google Cloud Console의 할당량 페이지에 표시됩니다. Compute Engine에서 이 할당량을 자동으로 일반 CPU 할당량의 10배로 설정합니다. 따라서 이 할당량을 요청할 필요가 없습니다. VM 인스턴스 할당량이 더 필요하면 CPU를 더 많이 요청해야 합니다. CPU가 늘어나야 VM 인스턴스 할당량도 늘어나기 때문입니다. 이 할당량은 VM(실행 여부 무관), 일반 인스턴스, 선점형 인스턴스에 적용됩니다.

  1. Google Cloud Console에서 할당량 페이지로 이동합니다.

    할당량으로 이동

  2. 필터 목록에서 다음 옵션을 선택합니다.

    • 서비스에서 Compute Engine API를 선택합니다.
    • 유형에서 할당량을 선택합니다.
    • 이름에서 VM 인스턴스를 선택합니다.
    • 선택사항: 측정항목에서 필터링할 다른 CPU 또는 커밋된 CPU 할당량 이름을 선택합니다.
  3. 선택사항: 테이블을 리전별로 정렬하려면 측정기준(예: 위치) 열을 클릭합니다.

  4. 할당량을 변경하려는 리전을 선택합니다.

  5. 수정을 클릭합니다.

  6. 양식을 작성합니다.

  7. 요청 제출을 클릭합니다.

인스턴스 그룹

인스턴스 그룹을 사용하려면 그룹에서 사용하는 모든 리소스에 사용 가능한 할당량(예: CPU 할당량)과 그룹 리소스 자체에 사용 가능한 할당량을 확보해야 합니다. 생성하는 그룹 유형에 따라 다음과 같은 그룹 리소스 사용 할당량이 적용됩니다.

서비스 유형 서비스 할당량
리전(멀티 영역) 관리형 인스턴스 그룹 Regional instance group managers
영역(단일 영역) 관리형 인스턴스 그룹 공통:
  • Instance group managers
  • Instance groups
비관리(단일 영역) 인스턴스 그룹 Instance groups
리전(멀티 영역) 자동 확장 처리 Regional autoscalers
영역(단일 영역) 자동 확장 처리 Autoscalers

디스크 할당량

다음 Persistent Disk, Hyperdisk 및 로컬 SSD 할당량은 리전별로 적용됩니다.

  • Hyperdisk Balanced Capacity (GB). 이 할당량은 한 리전에서 만들 수 있는 Hyperdisk Balanced 디스크를 합친 총 크기입니다. gcloud CLI 및 API에서는 이 할당량을 HDB-TOTAL-GB라고 합니다.
  • Hyperdisk Balanced Throughput (MB/s). 이 할당량은 한 영역의 모든 Hyperdisk Balanced 디스크에 프로비저닝할 수 있는 총 처리량입니다. gcloud CLI 및 API에서는 이 할당량을 HDB-TOTAL-THROUGHPUT라고 합니다.
  • Hyperdisk Balanced IOPS. 이 할당량은 한 영역의 모든 Hyperdisk Balanced 디스크에 프로비저닝할 수 있는 총 IOPS 양입니다. gcloud CLI 및 API에서는 이 할당량을 HDB-TOTAL-IOPS라고 합니다.
  • Hyperdisk ML Capacity (GB). 이 할당량은 한 리전에서 만들 수 있는 Hyperdisk ML 디스크를 합친 총 크기입니다. gcloud CLI 및 API에서는 이 할당량을 HDML-TOTAL-GB라고 합니다.
  • Hyperdisk ML Throughput (MB/s). 이 할당량은 한 리전의 모든 Hyperdisk ML 디스크에 프로비저닝할 수 있는 총 처리량입니다. gcloud CLI 및 API에서는 이 할당량을 HDML-TOTAL-THROUGHPUT이라고 합니다.
  • Persistent disk standard (GB). 이 할당량은 한 리전에서 만들 수 있는 표준 영구 디스크의 총 크기입니다. gcloud CLI 및 API에서는 이 할당량을 DISKS_TOTAL_GB라고 합니다. 이 할당량은 다음에도 적용됩니다.
    • 리전 표준 영구 디스크에도 적용되지만 리전 영구 디스크는 한 리전 내 두 영역에서 복제가 수행되므로 1GiB당 할당량 2배를 사용합니다.
    • VM을 중지하거나 일시중지할 때 로컬 SSD 데이터를 보존하면 이에 상응하는 표준 영구 디스크 할당량이 사용됩니다.
  • Persistent disk SSD (GB). 이 할당량은 한 리전에서 만들 수 있는 SSD 지원 영구 디스크 볼륨을 합친 총 크기입니다. gcloud CLI 및 API에서는 이 할당량을 SSD_TOTAL_GB라고 합니다. 이 할당량은 로컬 SSD 디스크 할당량과 별개입니다. 이 할당량은 다음 디스크 유형에 적용됩니다.

    • 영역별 및 리전별 SSD 영구 디스크
    • 영역별 및 리전별 균형 있는 영구 디스크

    리전별 영구 디스크는 한 리전 내 두 영역에서 복제가 수행되므로 1GiB당 할당량 2배를 사용합니다.

  • Persistent Disk IOPS. 이 할당량은 한 리전에서 만들 수 있는 익스트림 영구 디스크 볼륨의 초당 I/O 작업 총개수입니다. gcloud CLI 및 API에서는 이 할당량을 PD-EXTREME-TOTAL-PROVISIONED-IOPS라고 합니다. 이 할당량은 Google Cloud Hyperdisk의 IOPS 할당량과는 별개입니다.

  • Local SSD per machine family (GB). 이 할당량은 각 VM의 머신 유형을 기준으로 리전의 VM에 연결할 수 있는 로컬 SSD 디스크를 합친 총 크기입니다. 로컬 SSD는 VM 인스턴스 재부팅 시 디스크가 유지되지 않으므로 내결함성이 높은 스크래치, 로컬 캐시 또는 처리 작업에 사용해야 하는 빠른 이페머럴 디스크입니다.

    로컬 SSD 디스크는 머신 유형에 따라 375GiB 또는 3TiB 단위로 판매됩니다. 또한 머신 유형에 따라 단일 VM에 연결할 수 있는 최대 로컬 SSD 디스크 수도 있습니다. 최대 로컬 SSD 디스크 수와 각 로컬 SSD 디스크 크기에 따라 VM에 할당할 수 있는 총 로컬 SSD 디스크 용량이 제한됩니다. gcloud CLI 및 API에서는 이 한도를 LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY 할당량이라고 합니다.

    A3 및 A2 울트라 VM의 경우 로컬 SSD가 VM에 자동으로 추가되므로 이 할당량을 요청할 필요가 없습니다. 하지만 다른 가속기 최적화 VM의 경우 LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY를 요청해야 합니다.

스토리지 풀 할당량

용량의 경우 고급 용량 프로비저닝이 적용된 Hyperdisk 스토리지 풀에는 GB(1,000MB) 단위의 다음과 같은 할당량이 있습니다.

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB): 고급 용량 프로비저닝이 적용된 Hyperdisk Balanced 스토리지 풀에서 리전별로 예약할 수 있는 총 디스크 공간입니다.

    • gcloud CLI 및 API: HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • 측정항목: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB): 고급 용량 프로비저닝이 적용된 Hyperdisk Throughput 스토리지 풀에서 리전별로 예약할 수 있는 총 디스크 공간입니다.

    • gcloud CLI 및 API: HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • 측정항목: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

성능의 경우 고급 성능 프로비저닝이 적용된 Hyperdisk Storage 풀에는 다음과 같은 할당량이 있습니다.

  • Hyperdisk Balanced Storage Pools Advanced IOPS: 리전의 고급 성능 프로비저닝을 적용하여 Hyperdisk Balanced 스토리지 풀에서 예약할 수 있는 총 IOPS입니다.

    • gcloud CLI 및 API: HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
    • 측정항목: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
  • Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s): 고급 성능 프로비저닝이 적용된 Hyperdisk Balanced 스토리지 풀에서 리전별로 예약할 수 있는 총 처리량입니다.

    • gcloud CLI 및 API: HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • 측정항목: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
  • Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s): 고급 성능 프로비저닝이 적용된 Hyperdisk Throughput 스토리지 풀에서 리전별로 예약할 수 있는 총 처리량입니다.

    • gcloud CLI 및 API: HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • 측정항목: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

CPU 할당량 한도

CPU 할당량은 리전의 모든 VM 인스턴스에 있는 총 가상 CPU 수를 나타냅니다. CPU 할당량은 실행 중인 VM과 VM 예약에 적용됩니다. 사전 정의 및 선점형 VM 둘 다 이 할당량을 사용합니다.

Compute Engine 시스템과 다른 사용자를 보호하기 위해 일부 새 계정 및 프로젝트에는 모든 리전에 적용되는 전역 CPUs (All Regions) 할당량도 있습니다. 이 할당량은 모든 리전에 있는 vCPU의 합계로 측정됩니다.

예를 들어 us-central1과 같은 리전 한 곳에 vCPU가 48개 남아 있지만 CPUs (All Regions) 할당량에 vCPU가 32개만 남아 있다면 us-central1 리전에 할당량이 남아 있더라도 vCPU 32개만 실행할 수 있습니다. 그 이유는 CPU (All Regions) 할당량에 도달하여 새 인스턴스를 실행하려면 기존 인스턴스를 삭제해야 하기 때문입니다.

E2 및 N1 머신 유형은 CPU 할당량 풀을 공유합니다. 달리 명시되지 않는 한 다른 모든 머신 유형에는 고유한 별도의 CPU 할당량 풀이 있습니다.

VM에 약정 사용 할인을 사용하는 경우 약정 사용 할인 계약을 구매하려면 약정 사용 할인 할당량이 있어야 합니다.

머신 유형 할당량 풀 CPU 할당량 이름 약정된 CPU 할당량 이름
N1 공유 풀 CPUS Committed_CPUS
E2 공유 풀 CPUS Committed_CPUS
N2 개별 풀 N2_CPUS Committed_N2_CPUS
N4 개별 풀 CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D 개별 풀 N2D_CPUS Committed_N2D_CPUS
T2D 개별 풀 T2D_CPUS Committed_T2D_CPUS
T2A 개별 풀 T2A_CPUS T2A에 사용할 수 없음(N/A)
Z3 개별 풀 CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 개별 풀 M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 개별 풀 M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 개별 풀 M3_CPUS Committed_M3_CPUS
X4 개별 풀 CPUS_PER_VM_FAMILY Committed_X4_CPUS
H3 개별 풀 CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 개별 풀 C2_CPUS Committed_C2_CPUS
C2D 개별 풀 C2D_CPUS Committed_C2D_CPUS
C3 개별 풀 C3_CPUS Committed_C3_CPUS
C3D 개별 풀 CPUS_PER_VM_FAMILY Committed_C3D_CPUS
C4 개별 풀 CPUS_PER_VM_FAMILY Committed_C4_CPUS
A2* 개별 풀 A2_CPUS Committed_A2_CPUS
A3 A3에는 해당 사항 없음 A3에는 해당 사항 없음 A3에는 해당 사항 없음
G2 G2에는 해당 사항 없음 G2에는 해당 사항 없음 G2에는 해당 사항 없음
선점형 VM 공유 풀 PREEMPTIBLE_CPUS 선점형 VM에 사용할 수 없음(N/A)

*A2 VM의 경우 CPU 할당량을 요청할 필요가 없습니다. 필요한 NVIDIA A100 GPU 할당량이 있으면 이러한 VM을 만드는 데 필요한 모든 것이 갖춰진 것입니다.

A3 및 G2 VM에는 CPU 할당량이 적용되지 않습니다. 필요한 NVIDIA H100 및 L4 GPU 할당량이 있으면 이러한 VM을 만드는 데 필요한 모든 것이 갖춰진 것입니다.

GPU 할당량

가상 CPU 할당량과 비슷하게 GPU 할당량은 리전의 모든 VM 인스턴스에 있는 총 가상 GPU 수를 나타냅니다. GPU 할당량은 실행 중인 VM 및 VM 예약에 적용됩니다. 사전 정의 및 선점형 VM 둘 다 이 할당량을 사용합니다.

프로젝트에 사용 가능한 GPU가 충분히 있는지 확인하고 할당량 상향 조정을 요청하려면 할당량 페이지를 확인하세요. 또한 새 계정과 프로젝트에는 모든 리전에 적용되는 글로벌 GPU 할당량이 포함됩니다.

GPU 할당량을 요청하는 경우 각 리전에 생성하려는 GPU 모델의 할당량 외에도 모든 리전에 있는 모든 유형의 총 GPU 수에 적용할 전역 할당량(GPUs (all regions))을 추가로 요청해야 합니다. 이러한 리소스를 사용하려면 선점형 GPU 할당량을 요청하세요.

머신 유형 GPU 유형 GPU 할당량 이름 GPU 제품군 약정 GPU 할당량 이름 가상 워크스테이션 선점형 GPU 선점형 GPU 가상 워크스테이션
A3 Mega H100 80GB Mega GPUS_PER_GPU_FAMILY NVIDIA_H100_MEGA COMMITTED_NVIDIA_H100_MEGA_GPUS 해당 사항 없음 PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS 해당 사항 없음
A3 High H100 80GB GPUS_PER_GPU_FAMILY NVIDIA_H100 COMMITTED_NVIDIA_H100_GPUS 해당 사항 없음 PREEMPTIBLE_NVIDIA_H100_GPUS 해당 사항 없음
A2 표준 A100 40GB NVIDIA_A100_GPUS 해당 사항 없음 COMMITTED_NVIDIA_A100_GPUS 해당 사항 없음 PREEMPTIBLE_NVIDIA_A100_GPUS 해당 사항 없음
A2 울트라 A100 80GB NVIDIA_A100_80GB_GPUS 해당 사항 없음 COMMITTED_NVIDIA_A100_80GB_GPUS 해당 사항 없음 PREEMPTIBLE_NVIDIA_A100_80GB_GPUS 해당 사항 없음
G2 L4 NVIDIA_L4_GPUS 해당 사항 없음 COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
N1 T4 NVIDIA_T4_GPUS 해당 사항 없음 COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS 해당 사항 없음 COMMITTED_NVIDIA_V100_GPUS 해당 사항 없음 PREEMPTIBLE_NVIDIA_V100_GPUS 해당 사항 없음
P100 NVIDIA_P100_GPUS 해당 사항 없음 COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS 해당 사항 없음 COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS

선점형 할당량

Preemptible CPUs, Preemptible GPUs, Preemptible Local SSDs (GB)용 선점형 할당량을 요청할 수 있습니다. 이러한 선점형 할당량은 다음 VM의 CPU, GPU, 로컬 SSD에 적용됩니다.

프로젝트에 선점형 할당량이 없고 선점형 할당량을 요청한 적이 없으면 이러한 리소스는 표준 할당량을 사용합니다. 하지만 프로젝트에서 선점형 할당량을 요청한 후에는 관련 리소스에서 선점형 할당량만 사용할 수 있으며 표준 할당량 사용으로 되돌릴 수 없습니다.

선점형 할당량을 요청하면 임시 리소스에 별도의 할당량을 제공하여 할당량 가용성을 향상시킬 수 있습니다. Compute Engine이 리전에 선점형 할당량을 부여하면 자동으로 모든 관련 리소스에서 선점형 할당량을 사용합니다. 이 할당량이 소진된 경우 해당 리소스에 대한 선점형 할당량을 요청해야 합니다.

외부 IP 주소

VM마다 공개 인터넷에서 직접 연결하는 데 필요한 외부 IP 주소가 충분히 있어야 합니다. 리전 IP 할당량은 해당 리전의 VM에 IPv4 주소를 할당하는 데 사용되며, 전역 IP 할당량은 부하 분산기와 같은 전역 네트워킹 리소스에 IPv4 주소를 할당하는 데 사용됩니다. Google Cloud에서는 용도에 따라 다양한 유형의 IP 주소를 제공합니다. 비용에 대한 자세한 내용은 외부 IP 주소 가격 책정을 참조하세요. 구체적인 할당량에 대한 자세한 내용은 할당량 및 한도를 참조하세요.

  • 사용 중인 외부 IP 주소. 리소스에서 사용하고 있는 임시 및 고정 IP 주소가 둘 다 포함됩니다.

  • 고정 외부 IP 주소: 머신 재시작을 거쳐도 유지되며 리소스용으로 예약하는 외부 IP 주소입니다. DNS 및 도메인 제공업체 서비스로 이러한 주소를 등록하여 사용자 친화적인 주소(예: www.example-site.com)를 제공할 수 있습니다.

  • 고정 내부 IP 주소: 고정 내부 IP 주소를 사용하면 서브넷에 구성된 내부 IP 범위에서 내부 IP 주소를 예약할 수 있습니다. 필요에 따라 예약한 내부 주소를 리소스에 할당할 수 있습니다.

할당량 적용

Google Cloud에서 리소스 및 API의 기본 할당량을 변경하는 경우가 가끔 있습니다. 이러한 변경사항은 점진적으로 적용됩니다. 새 기본 할당량이 출시되는 동안 Google Cloud 콘솔에 표시되는 최대 할당량은 사용 가능한 실제 최대 할당량을 반영하지 않을 수 있습니다.

예를 들어 Google Cloud가 방화벽 규칙의 기본 최대 할당량을 200에서 300으로 변경하고 Google Cloud 콘솔을 사용하여 할당량을 확인한다면 300의 새 할당량이 표시될 수 있습니다. 하지만 실제 할당량은 적용이 완료될 때까지 200입니다.

진행 중인 할당량 적용에 대한 자세한 내용은 알려진 문제를 참조하세요. 문제를 설명하지 않으면 할당량 적용이 진행되지 않습니다.

할당량 적용이 진행 중이고 사용 가능한 실제 최대 할당량을 확인하려면 Google Cloud CLI를 사용하여 할당량을 확인합니다. 액세스할 수 있는 것보다 많은 할당량이 필요하면 할당량 상향 요청을 제출하세요.

다음 단계