本文档列出了适用于 Compute Engine 的分配配额。
分配配额
分配配额(也称为资源配额)用于定义项目有权访问的资源数量。出于各种目的,Compute Engine 会对资源用量实施分配配额限制。例如,配额有助于保护 Google Cloud 用户群体,避免出现意外的用量激增。Google Cloud 还提供免费试用配额,可为项目提供一定用量,以便您免费试用 Google Cloud。
并非所有项目的配额都完全相同。随着您的 Google Cloud 使用量逐步增加,您的配额可能会相应地增加。如果您预计自己的用量即将显著增加,可以在 Google Cloud 控制台的配额页面中事先申请调整配额。
如需了解 Compute Engine API 速率限制配额的具体信息,请参阅 API 配额。
配额和资源可用性
分配配额是您可以创建的特定类型资源的最大数量(如果这些资源的可用数量足够)。配额不能保证资源始终可用。如果资源不可用,或您选择的区域已无富余资源,您就无法创建该类型的资源,即使您的区域或项目中有剩余配额也是如此。例如,您可能仍有用于在 us-central1
中创建外部 IP 地址的配额,但该区域中可能没有可用的 IP 地址。
类似地,即使您有区域级配额,在特定可用区内也可能无法使用某项资源。例如,您可能仍有在区域 us-central1
中创建虚拟机实例的配额,但如果可用区 us-central1-a
的资源已用尽,您可能无法在该可用区创建虚拟机实例。在这种情况下,请尝试在另一个可用区(例如 us-central1-f
)中创建该资源。如需详细了解在可用区级资源用尽时您可采用的方案,请参阅排查资源可用性问题的文档。
分配配额
在规划虚拟机实例需求时,您应该考虑多种配额,这些配额会影响您可以创建的虚拟机实例数量。
区域和全球配额
虚拟机配额是在区域级进行管理的。虚拟机实例、实例组、磁盘配额和 CPU 可以由该区域中的任何虚拟机使用,无论虚拟机在哪个可用区。例如,CPU 配额属于区域性配额,因此每个区域有不同的限制和用量。如需在 us-central1
区域中的任一可用区内启动一个 n2-standard-16
实例,您需要在 us-central1
中有足够的配额(至少 16 个 CPU)。
创建防火墙、负载均衡器、网络和 VPN 需要有网络和负载均衡配额。这些是不受具体区域影响的全球配额。所有区域都可以使用全球配额。例如,分配给负载均衡器和 HTTP 和 HTTPS 代理的使用中和静态外部 IP 地址会使用全球配额。
虚拟机实例
虚拟机实例配额是一种区域配额,会限制指定区域中可存在的虚拟机实例的数量(无论虚拟机是否在运行)。此配额会显示在 Google Cloud 控制台的配额页面上。Compute Engine 会自动将此配额设置为常规 CPU 配额的 10 倍。您无需申请此配额。如果您需要增加配额以容纳更多虚拟机实例,则应该申请更多 CPU,因为增加 CPU 可以增加虚拟机实例配额。此配额适用于正在运行和未运行的虚拟机,以及常规实例和抢占式实例。
在 Google Cloud 控制台中,转到配额页面。
在
Filter 列表中,选择以下选项:- 在服务中,选择 Compute Engine API。
- 在类型部分,选择配额。
- 对于名称,请选择虚拟机实例。
- 可选:对于指标,选择要过滤的任何其他CPU 或已承诺的 CPU 配额名称。
可选:要按区域对表格进行排序,请点击维度(例如位置)列。
选择要更改其配额的区域。
点击
修改。填写表单。
点击提交请求。
实例组
为了使用实例组,您必须具有实例组使用的所有资源的可用配额(例如 CPU 配额)以及实例组资源本身的可用配额。根据您创建的实例组类型,系统将相应地使用以下实例组资源用量配额:
服务类型 | 服务配额 |
---|---|
区域(多可用区)代管式实例组 | Regional instance group managers |
可用区(单可用区)代管式实例组 | 以下两者:
|
非代管式(单可用区)实例组 | Instance groups |
区域(多可用区)自动扩缩器 | Regional autoscalers |
可用区(单可用区)自动扩缩器 | Autoscalers |
磁盘配额
下述永久性磁盘、Hyperdisk 和本地 SSD 配额按区域实施:
Hyperdisk Balanced Capacity (GB)
。此配额是您可以在某个区域中创建的 Hyperdisk Balanced 磁盘的总大小。在 gcloud CLI 和 API 中,此配额称为HDB-TOTAL-GB
。Hyperdisk Balanced Throughput (MB/s)
。此配额是您可以为某个可用区中的所有 Hyperdisk Balanced 磁盘预配的总吞吐量。在 gcloud CLI 和 API 中,此配额称为HDB-TOTAL-THROUGHPUT
。Hyperdisk Balanced IOPS
。此配额是您可为可用区中的所有平衡 Hyperdisk 磁盘预配的 IOPS 总量。在 gcloud CLI 和 API 中,此配额称为HDB-TOTAL-IOPS
。Hyperdisk ML Capacity (GB)
。此配额是您可以在某个区域中创建的 Hyperdisk ML 磁盘的总大小。在 gcloud CLI 和 API 中,此配额称为HDML-TOTAL-GB
。Hyperdisk ML Throughput (MB/s)
。此配额是您可以为某个区域中的所有 Hyperdisk ML 磁盘预配的总吞吐量。在 gcloud CLI 和 API 中,此配额称为HDML-TOTAL-THROUGHPUT
。Persistent disk standard (GB)
。此配额是可在一个区域中创建的标准永久性磁盘的总大小。在 gcloud CLI 和 API 中,此配额称为DISKS_TOTAL_GB
。此配额还适用于:- 区域标准永久性磁盘,但由于区域级永久性磁盘会在一个区域内的两个可用区中复制,因此每 GiB 消耗的配额将翻倍。
- 如果您在停止或暂停虚拟机时选择保留本地 SSD 数据,系统会消耗等量的标准永久性磁盘配额。
Persistent disk SSD (GB)
。此配额是可在一个区域中创建的 SSD 永久性磁盘卷的总大小。在 gcloud CLI 和 API 中,此配额称为SSD_TOTAL_GB
。此配额与本地 SSD 磁盘的配额是分开计量的。此配额适用于以下磁盘类型:- 可用区级和区域级 SSD 永久性磁盘
- 可用区级和区域级平衡永久性磁盘
区域级永久性磁盘在同一区域的两个可用区中进行复制,因此每 GiB 消耗的配额翻倍。
Persistent Disk IOPS
。此配额是可在一个区域中创建的 Extreme 永久性磁盘卷每秒可执行的 I/O 操作总数。在 gcloud CLI 和 API 中,此配额称为PD-EXTREME-TOTAL-PROVISIONED-IOPS
。此配额与 Google Cloud Hyperdisk 的 IOPS 配额是分开计量的。Local SSD per machine family (GB)
。此配额是根据每个虚拟机的机器类型,可以挂接到某个区域中虚拟机的本地 SSD 磁盘的总大小。本地 SSD 是一种快速的临时磁盘,应该用于容错能力较高的暂存、本地缓存或处理作业,因为这类磁盘在虚拟机实例重启时可能会丢失数据。本地 SSD 磁盘以 375 GiB 或 3 TiB 为增量销售,具体取决于机器类型。此外,可挂接到单个虚拟机的本地 SSD 磁盘的数量也有上限,具体取决于机器类型。本地 SSD 磁盘的数量上限和每个本地 SSD 磁盘的大小会限制您可以为虚拟机分配的本地 SSD 磁盘总容量。在 gcloud CLI 和 API 中,此限制称为
LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY
配额。对于 A3 和 A2 Ultra 虚拟机,您无需申请此配额,因为系统会自动向这些虚拟机添加本地 SSD。不过,您需要为其他加速器优化型虚拟机请求
LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY
。
存储池配额
在容量方面,采用高级容量预配的 Hyperdisk 存储池具有以下配额(以 GB [或 1,000 MB] 为单位):
Hyperdisk Balanced Storage Pools Advanced Capacity (GB)
:在启用了高级容量预配的 Hyperdisk Balanced 存储池中,您可以在每个区域预留的磁盘空间总量。- gcloud CLI 和 API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- 指标:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
- gcloud CLI 和 API:
Hyperdisk Throughput Storage Pools Advanced Capacity (GB)
:您可以在启用了高级容量预配的 Hyperdisk Throughput 存储池中为每个区域预留的磁盘空间总量。- gcloud CLI 和 API:
HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- 指标:
compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity
- gcloud CLI 和 API:
在性能方面,采用高级性能预配的 Hyperdisk 存储池具有以下配额:
Hyperdisk Balanced Storage Pools Advanced IOPS
:您可以在某个区域的 Hyperdisk Balanced 存储池中使用高级性能预配功能预留的总 IOPS。- gcloud CLI 和 API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
- 指标:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
- gcloud CLI 和 API:
Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s)
:您可以在启用了高级性能预配的 Hyperdisk Balanced 存储池中为某个区域预留的总吞吐量。- gcloud CLI 和 API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- 指标:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
- gcloud CLI 和 API:
Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s)
:您可以在某个区域的 Hyperdisk Throughput 存储池中预留的总吞吐量(使用高级性能预配)。- gcloud CLI 和 API:
HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- 指标:
compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput
- gcloud CLI 和 API:
CPU 配额限制
CPU 配额是您在某个区域内的所有虚拟机实例中的虚拟 CPU 总数。CPU 配额适用于正在运行的虚拟机和预留的虚拟机资源。预定义虚拟机和抢占式虚拟机都会消耗此配额。
为了帮助保护 Compute Engine 系统和其他用户的安全,一些新账号和项目还具有 CPUs (All Regions)
全球配额,这种配额适用于所有区域,并按您在所有区域中的所有 vCPU 的总数来计量。
例如,如果在单个区域(如 us-central1
)中剩余 48 个 vCPU,但 CPUs (All Regions)
配额只剩余 32 个 vCPU,那么您只能在 us-central1
区域中启动 32 个 vCPU,即使该区域还有剩余配额也是如此。这是因为您达到 CPU (All Regions)
配额的限制,需要删除现有的实例才能启动新实例。
E2 和 N1 机器类型共用一个 CPU 配额池。除非另有说明,否则所有其他机器类型都具有唯一的独立 CPU 配额池。
如果您的虚拟机使用的是承诺使用折扣,您必须先购买承诺使用折扣配额,然后才能购买承诺使用折扣合约。
机器类型 | 配额池 | CPU 配额名称 | 承诺 CPU 配额名称 |
---|---|---|---|
N1 | 共享池 | CPUS |
Committed_CPUS |
E2 | 共享池 | CPUS |
Committed_CPUS |
N2 | 独立池 | N2_CPUS |
Committed_N2_CPUS |
N4 | 独立池 | CPUS_PER_VM_FAMILY |
Committed_N4_CPUS |
N2D | 独立池 | N2D_CPUS |
Committed_N2D_CPUS |
T2D | 独立池 | T2D_CPUS |
Committed_T2D_CPUS |
T2A | 独立池 | T2A_CPUS |
不适用于 T2A |
Z3 | 独立池 | CPUS_PER_VM_FAMILY |
Committed_Z3_CPUS |
M1 | 独立池 | M1_CPUS |
Committed_MEMORY-OPTIMIZED_CPUS |
M2 | 独立池 | M2_CPUS |
Committed_MEMORY-OPTIMIZED_CPUS |
M3 | 独立池 | M3_CPUS |
Committed_M3_CPUS |
X4 | 独立池 | CPUS_PER_VM_FAMILY |
Committed_X4_CPUS |
H3 | 独立池 | CPUS_PER_VM_FAMILY |
Committed_H3_CPUS |
C2 | 独立池 | C2_CPUS |
Committed_C2_CPUS |
C2D | 独立池 | C2D_CPUS |
Committed_C2D_CPUS |
C3 | 独立池 | C3_CPUS |
Committed_C3_CPUS |
C3D | 独立池 | CPUS_PER_VM_FAMILY |
Committed_C3D_CPUS |
C4 | 独立池 | CPUS_PER_VM_FAMILY |
Committed_C4_CPUS |
C4A | 独立池 | CPUS_PER_VM_FAMILY |
Committed_C4A_CPUS |
A2* | 独立池 | A2_CPUS |
Committed_A2_CPUS |
A3† | 不适用于 A3 | 不适用于 A3 | 不适用于 A3 |
G2† | 不适用于 G2 | 不适用于 G2 | 不适用于 G2 |
抢占式虚拟机 | 共享池 | PREEMPTIBLE_CPUS |
不适用于抢占式虚拟机 |
*对于 A2 虚拟机,您无需申请 CPU 配额。如果您拥有所需的 NVIDIA A100 GPU 配额,则无需其他操作即可创建这些虚拟机。
†对于 A3 和 G2 虚拟机,CPU 配额不适用。如果您分别拥有所需的 NVIDIA H100 和 L4 GPU 配额,则无需其他操作即可创建这些虚拟机。
GPU 配额
与虚拟 CPU 配额类似,GPU 配额是指您在一个区域内的所有虚拟机实例中的虚拟 GPU 总数。GPU 配额适用于正在运行的虚拟机和预留的虚拟机资源。预定义虚拟机和抢占式虚拟机都会消耗此配额。
若要确保您的项目中有足够的 GPU 可用,或者需要申请增加配额,请查看配额页面。此外,新账号和项目还具有一个 GPU 全球配额,该配额适用于所有区域。
申请 GPU 配额时,您必须为要在每个区域中创建的 GPU 型号申请一个配额,并根据所有区域中所有类型的 GPU 总数另外申请一个全球配额 (GPUs (all regions)
)。申请抢占式 GPU 配额可使用这些资源。
机器类型 | GPU 类型 | GPU 配额名称 | GPU 系列 | 承诺 GPU 配额名称 | 虚拟工作站 | 抢占式 GPU | 抢占式 GPU 虚拟工作站 |
---|---|---|---|---|---|---|---|
A3 Mega | H100 80GB | GPUS_PER_GPU_FAMILY |
NVIDIA_H100_MEGA |
COMMITTED_NVIDIA_H100_MEGA_GPUS |
不适用 | PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS |
不适用 |
A3 Edge 和 A3 High | H100 80GB | GPUS_PER_GPU_FAMILY |
NVIDIA_H100 |
COMMITTED_NVIDIA_H100_GPUS |
不适用 | PREEMPTIBLE_NVIDIA_H100_GPUS |
不适用 |
A2 Ultra | A100 80GB | NVIDIA_A100_80GB_GPUS |
不适用 | COMMITTED_NVIDIA_A100_80GB_GPUS |
不适用 | PREEMPTIBLE_NVIDIA_A100_80GB_GPUS |
不适用 |
A2 标准 | A100 40GB | NVIDIA_A100_GPUS |
不适用 | COMMITTED_NVIDIA_A100_GPUS |
不适用 | PREEMPTIBLE_NVIDIA_A100_GPUS |
不适用 |
G2 | L4 | NVIDIA_L4_GPUS |
不适用 | COMMITTED_NVIDIA_L4_GPUS |
NVIDIA_L4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_L4_GPUS |
PREEMPTIBLE_NVIDIA_L4_VWS_GPUS |
N1 | T4 | NVIDIA_T4_GPUS |
不适用 | COMMITTED_NVIDIA_T4_GPUS |
NVIDIA_T4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_T4_GPUS |
PREEMPTIBLE_NVIDIA_T4_VWS_GPUS |
V100 | NVIDIA_V100_GPUS |
不适用 | COMMITTED_NVIDIA_V100_GPUS |
不适用 | PREEMPTIBLE_NVIDIA_V100_GPUS |
不适用 | |
P100 | NVIDIA_P100_GPUS |
不适用 | COMMITTED_NVIDIA_P100_GPUS |
NVIDIA_P100_VWS_GPUS |
PREEMPTIBLE_NVIDIA_P100_GPUS |
PREEMPTIBLE_NVIDIA_P100_VWS_GPUS |
|
P4 | NVIDIA_P4_GPUS |
不适用 | COMMITTED_NVIDIA_P4_GPUS |
NVIDIA_P4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_P4_GPUS |
PREEMPTIBLE_NVIDIA_P4_VWS_GPUS |
抢占式配额
您可以为 Preemptible CPUs
、Preemptible GPUs
和 Preemptible Local SSDs (GB)
资源申请抢占式配额。以下虚拟机的 CPU、GPU 和本地 SSD 适用这些抢占式配额:
如果您的项目没有抢占式配额,并且您从未申请过抢占式配额,则这些资源将使用标准配额。不过,在您为项目申请抢占式配额后,适用的资源只能使用抢占式配额,而无法恢复使用标准配额。
通过为临时资源提供单独的配额,申请抢占式配额有助于提高配额的可获取性。在 Compute Engine 授予您某个区域的抢占式配额后,所有适用资源都将自动消耗抢占式配额。如果此配额用尽,则您必须为这些资源申请抢占式配额。
外部 IP 地址
对于需要通过公共互联网直接访问的虚拟机,您必须拥有足够的外部 IP 地址分配给每一个虚拟机。区域 IP 配额用于为该区域中的虚拟机分配 IPv4 地址。全球 IP 配额用于为全球网络资源(例如负载均衡器)分配 IPv4 地址。Google Cloud 会根据您的需求提供不同类型的 IP 地址。如需了解费用,请参阅外部 IP 地址价格。如需了解配额详情,请参阅配额和限制。
使用中的外部 IP 地址。包括正在由某项资源使用的临时和静态 IP 地址。
静态外部 IP 地址:为您的资源预留的外部 IP 地址,机器重启后保持不变。您可以在 DNS 和域名服务商处注册这些地址,以提供方便用户使用的地址,例如 www.example-site.com。
静态内部 IP 地址:利用静态内部 IP 地址,您可以预留子网中配置的 IP 范围内的内部 IP 地址,然后根据需要将这些预留的内部地址分配给资源。
配额发布
有时,Google Cloud 会更改资源和 API 的默认配额。这些更改逐步进行。在新的默认配额发布期间,Google Cloud 控制台中显示的最大配额可能并不反映您可以使用的实际最大配额。
例如,假设 Google Cloud 将防火墙规则的默认最大配额从 200
更改为 300
,并且您可以使用 Google Cloud 控制台查看配额,那么您可能会看到新的配额为 300
,即使您的实际配额为 200
(直到发布完成)。
如需了解持续配额发布,请参阅已知问题。如果未说明任何问题,则不会进行任何配额发布。
如果配额发布正在进行,并且您希望确认可用的实际最大配额,请使用 Google Cloud CLI 检查配额。 如果您需要的配额超出您有权使用的配额,请提交增加配额请求。
后续步骤
- 参阅按资源计价方案。
- 参阅虚拟机实例定价方案。
- 了解如何查看和管理配额。
- 了解如何设置配额提醒。
- 了解如何根据 Compute Engine 资源的使用情况自动增加配额。