Cuotas de asignación


Este documento enumera las cuotas de asignación que se aplican a Compute Engine.

Cuotas de asignación

Las cuotas de asignación, también conocidas como cuotas de recursos, definen la cantidad de recursos a los que tiene acceso su proyecto. Compute Engine impone cuotas de asignación sobre el uso de recursos por varios motivos. Por ejemplo, las cuotas ayudan a proteger a la comunidad de Google Cloud usuarios evitando picos imprevistos en el uso. Google Cloud también ofrece cuotas de prueba gratuitas que brindan acceso limitado a proyectos para ayudarlo a explorar Google Clouda modo de prueba gratuita.

No todos los proyectos tienen las mismas cuotas. A medida que usas cada vez másGoogle Cloud Con el tiempo, sus cuotas podrían aumentar en consecuencia. Si espera un aumento notable en el uso, puede solicitar de forma proactiva ajustes de cuota desde la página Cuotas en la consola de Google Cloud.

Para obtener información específica sobre las cuotas de límites de velocidad para la API de Compute Engine, consulte Cuota de API .

Cuotas y disponibilidad de recursos

Las cuotas de asignación son la cantidad máxima de recursos que puede crear de ese tipo de recurso, si esos recursos están disponibles. Las cuotas no garantizan que los recursos estén siempre disponibles. Si un recurso no está disponible, o si la región que elige está fuera del recurso, no puede crear nuevos recursos de ese tipo, incluso si le queda cuota restante en su región o proyecto. Por ejemplo, es posible que aún tenga cuota para crear direcciones IP externas en us-central1 , pero es posible que no haya direcciones IP disponibles en esa región.

De manera similar, incluso si tiene una cuota regional, es posible que un recurso no esté disponible en una zona específica. Por ejemplo, es posible que tenga cuota para crear instancias de VM en la región us-central1 , pero es posible que no pueda crear instancias de VM en la zona us-central1-a si la zona está agotada. En tales casos, intente crear el mismo recurso en otra zona, como us-central1-f . Para obtener más información sobre sus opciones si los recursos zonales se agotan, consulte la documentación para solucionar problemas de disponibilidad de recursos .

Cuotas de asignación

Al planificar las necesidades de su instancia de VM, debe considerar varias cuotas que afectan la cantidad de instancias de VM que puede crear.

Cuotas regionales y globales

Las cuotas de VM se gestionan a nivel regional. Cualquier VM de la región, independientemente de la zona, puede consumir la instancia de VM, el grupo de instancias, las cuotas de disco y la CPU. Por ejemplo, la cuota de CPU es una cuota regional, por lo que hay un límite y un recuento de uso diferentes para cada región. Para lanzar una instancia n2-standard-16 en cualquier zona de la región us-central1 , necesita una cuota suficiente para al menos 16 CPU en us-central1 .

Se requieren cuotas de red y equilibrio de carga para crear firewalls, equilibradores de carga, redes y VPN. Estas cuotas son cuotas globales que no dependen de una región. Cualquier región puede utilizar una cuota global. Por ejemplo, las direcciones IP externas estáticas y en uso asignadas a balanceadores de carga y proxies HTTP y HTTPS consumen cuotas globales.

Instancias de máquinas virtuales

La cuota de instancias de VM es una cuota regional y limita la cantidad de instancias de VM que pueden existir en una región determinada, independientemente de si la VM se está ejecutando. Esta cuota es visible en la consola de Google Cloud en la página Cuotas . Compute Engine establece automáticamente esta cuota en 10 veces su cuota de CPU habitual. No es necesario solicitar esta cuota. Si necesita una cuota para más instancias de VM, solicite más CPU porque tener más CPU aumenta la cuota de instancias de VM. La cuota se aplica tanto a máquinas virtuales en ejecución como a no en ejecución, y a instancias normales e interrumpibles.

  1. En la consola de Google Cloud, vaya a la página Cuotas .

    Ir a Cuotas

  2. En la lista de filtros , seleccione las siguientes opciones:

    • Para Servicio , seleccione API de Compute Engine .
    • Para Tipo , seleccione Cuota .
    • En Nombre , seleccione Instancias de VM .
    • Opcional: en Métrica , seleccione cualquier otra CPU o nombre de cuota de CPU comprometida que desee filtrar.
  3. Opcional: para ordenar la tabla por región, haga clic en la columna Dimensiones (por ejemplo, ubicación) .

  4. Seleccione las regiones cuya cuota desea cambiar.

  5. Haga clic en Editar .

  6. Complete el formulario.

  7. Haga clic en Enviar solicitud .

Grupos de instancias

Para usar grupos de instancias, debe tener una cuota disponible para todos los recursos que usa el grupo (por ejemplo, cuota de CPU) y una cuota disponible para el recurso del grupo en sí. Según el tipo de grupo que cree, se aplican las siguientes cuotas de uso de recursos del grupo:

Tipo de servicio Cuota de servicio
Grupo de instancias administrado regional (multizona) Regional instance group managers
Grupo de instancias administrado zonal (zona única) Ambos de:
  • Instance group managers
  • Instance groups
Grupo de instancias no administrado (de zona única) Instance groups
Escalador automático regional (multizona) Regional autoscalers
Escalador automático zonal (de una sola zona) Autoscalers

Cuotas de disco

Las siguientes cuotas de disco persistente, hiperdisco y SSD local se aplican por región:

  • Hyperdisk Balanced Capacity (GB) . Esta cuota es el tamaño total combinado de discos Hyperdisk Balanced que puede crear en una región. En la CLI y la API de gcloud, esta cuota se denomina HDB-TOTAL-GB .
  • Hyperdisk Balanced Throughput (MB/s) . Esta cuota es la cantidad total de rendimiento que puede aprovisionar para todos los discos Hyperdisk Balanced en una zona. En la CLI y la API de gcloud, esta cuota se denomina HDB-TOTAL-THROUGHPUT .
  • Hyperdisk Balanced IOPS . Esta cuota es la cantidad total de IOPS que puede aprovisionar para todos los discos Hyperdisk Balanced en una zona. En la CLI y la API de gcloud, esta cuota se conoce como HDB-TOTAL-IOPS .
  • Hyperdisk ML Capacity (GB) . Esta cuota es el tamaño total combinado de los discos Hyperdisk ML que puede crear en una región. En la CLI y la API de gcloud, esta cuota se denomina HDML-TOTAL-GB .
  • Hyperdisk ML Throughput (MB/s) . Esta cuota es la cantidad total de rendimiento que puede aprovisionar para todos los discos Hyperdisk ML en una región. En la CLI y la API de gcloud, esta cuota se denomina HDML-TOTAL-THROUGHPUT .
  • Persistent disk standard (GB) . Esta cuota es el tamaño total del disco persistente estándar que se puede crear en una región. En la CLI y la API de gcloud, esta cuota se denomina DISKS_TOTAL_GB . Esta cuota también se aplica a:
    • Disco persistente estándar regional , pero el disco persistente regional consume el doble de cuota por GiB debido a la replicación en dos zonas dentro de una región.
    • Cuando elige conservar los datos del SSD local al detener o suspender una máquina virtual, se consume una cantidad equivalente de cuota de disco persistente estándar.
  • Persistent disk SSD (GB) . Esta cuota es el tamaño total combinado de volúmenes de discos persistentes respaldados por SSD que se pueden crear en una región. En la CLI y la API de gcloud, esta cuota se denomina SSD_TOTAL_GB . Esta cuota es independiente de la cuota de discos SSD locales. Esta cuota se aplica a los siguientes tipos de discos:

    • Disco persistente SSD zonal y regional
    • Disco persistente equilibrado zonal y regional

    Los volúmenes de discos persistentes regionales consumen el doble de cuota por GiB debido a la replicación en dos zonas dentro de una región.

  • Persistent Disk IOPS . Esta cuota es el número total de operaciones de E/S por segundo para volúmenes de Extreme Persistent Disk que se pueden crear en una región. En la CLI y la API de gcloud, esta cuota se conoce como PD-EXTREME-TOTAL-PROVISIONED-IOPS . Esta cuota es independiente de la cuota de IOPS de Google Cloud Hyperdisk.

  • Local SSD per machine family (GB) . Esta cuota es el tamaño total combinado de discos SSD locales que puede conectar a máquinas virtuales en una región según el tipo de máquina de cada máquina virtual. El SSD local es un disco rápido y efímero que debe usarse para tareas temporales, caché local o trabajos de procesamiento con alta tolerancia a fallas porque el disco no está diseñado para sobrevivir a los reinicios de la instancia de VM.

    Los discos SSD locales se venden en incrementos de 375 GiB o 3 TiB, según el tipo de máquina. También hay una cantidad máxima de discos SSD locales que se pueden conectar a una sola máquina virtual , según el tipo de máquina. La cantidad máxima de discos SSD locales y el tamaño de cada disco SSD local crean un límite en la cantidad total de capacidad del disco SSD local que puede asignar para una máquina virtual. En la CLI y la API de gcloud, este límite se conoce como cuota LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY .

    Para las máquinas virtuales A3 y A2 ultra, no es necesario solicitar esta cuota, ya que los SSD locales se agregan automáticamente a estas máquinas virtuales. Sin embargo, deberá solicitar LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY para las otras máquinas virtuales optimizadas para acelerador .

Cuotas de grupos de almacenamiento

En cuanto a la capacidad, los grupos de almacenamiento de hiperdisco con aprovisionamiento de capacidad avanzado tienen las siguientes cuotas, medidas en GB (o 1000 MB):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB) : la cantidad total de espacio en disco que puede reservar por región en un grupo de almacenamiento equilibrado de Hyperdisk con aprovisionamiento de capacidad avanzado.

    • CLI de gcloud y API: HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB) : la cantidad total de espacio en disco que puede reservar por región en un grupo de almacenamiento de rendimiento de hiperdisco con aprovisionamiento de capacidad avanzado.

    • CLI de gcloud y API: HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

En cuanto al rendimiento, los grupos de almacenamiento de hiperdisco con aprovisionamiento de rendimiento avanzado tienen las siguientes cuotas:

  • Hyperdisk Balanced Storage Pools Advanced IOPS : las IOPS totales que puede reservar en un grupo de almacenamiento equilibrado de Hyperdisk con aprovisionamiento de rendimiento avanzado para una región.

    • CLI de gcloud y API: HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
  • Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s) : el rendimiento total que puede reservar en un grupo de almacenamiento equilibrado de Hyperdisk con aprovisionamiento de rendimiento avanzado para una región.

    • CLI de gcloud y API: HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
  • Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s) : el rendimiento total que puede reservar en un grupo de almacenamiento de rendimiento de hiperdisco con aprovisionamiento de rendimiento avanzado para una región.

    • CLI de gcloud y API: HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

Límites de cuota de CPU

La cuota de CPU es la cantidad total de CPU virtuales en todas sus instancias de VM en una región. Las cuotas de CPU se aplican a las máquinas virtuales en ejecución y a las reservas de máquinas virtuales. Tanto las máquinas virtuales predefinidas como las interrumpibles consumen esta cuota.

Para ayudar a proteger los sistemas Compute Engine y a otros usuarios, algunas cuentas y proyectos nuevos también tienen una cuota global CPUs (All Regions) . Esa cuota se aplica a todas las regiones y se mide como la suma de todas sus vCPU en todas las regiones.

Por ejemplo, si le quedan 48 vCPU en una sola región, como us-central1 pero solo quedan 32 vCPU para la cuota CPUs (All Regions) , puede iniciar solo 32 vCPU en la región us-central1 , aunque quede una cuota restante en la región. Esto se debe a que alcanza la cuota CPU (All Regions) y necesita eliminar las instancias existentes antes de poder lanzar nuevas instancias.

Los tipos de máquinas E2 y N1 comparten un grupo de cuotas de CPU. A menos que se indique lo contrario, todos los demás tipos de máquinas tienen grupos de cuotas de CPU únicos y separados.

Si utiliza descuentos por uso comprometido para sus máquinas virtuales, debe tener una cuota de descuento por uso comprometido antes de comprar un contrato de descuento por uso comprometido.

Tipo de máquina grupo de cuotas Nombre de cuota de CPU Nombre de cuota de CPU comprometida
N1 piscina compartida CPUS Committed_CPUS
E2 piscina compartida CPUS Committed_CPUS
N2 piscina separada N2_CPUS Committed_N2_CPUS
N4 piscina separada CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D piscina separada N2D_CPUS Committed_N2D_CPUS
diabetes tipo 2 piscina separada T2D_CPUS Committed_T2D_CPUS
T2A piscina separada T2A_CPUS No disponible (N/A) para T2A
Z3 piscina separada CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 piscina separada M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 piscina separada M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 piscina separada M3_CPUS Committed_M3_CPUS
M4 piscina separada CPUS_PER_VM_FAMILY Committed_M4_CPUS
X4 piscina separada CPUS_PER_VM_FAMILY Committed_X4_CPUS
H3 piscina separada CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 piscina separada C2_CPUS Committed_C2_CPUS
C2D piscina separada C2D_CPUS Committed_C2D_CPUS
C3 piscina separada C3_CPUS Committed_C3_CPUS
C3D piscina separada CPUS_PER_VM_FAMILY Committed_C3D_CPUS
C4 piscina separada CPUS_PER_VM_FAMILY Committed_C4_CPUS
C4A piscina separada CPUS_PER_VM_FAMILY Committed_C4A_CPUS
A2 * piscina separada A2_CPUS Committed_A2_CPUS
A4 No aplicable (N/A) para A4 No aplicable (N/A) para A4 No aplicable (N/A) para A4
A3 No aplicable (N/A) para A3 No aplicable (N/A) para A3 No aplicable (N/A) para A3
G2 No aplicable (N/A) para G2 No aplicable (N/A) para G2 No aplicable (N/A) para G2
VM interrumpibles piscina compartida PREEMPTIBLE_CPUS No disponible (N/A) para máquinas virtuales interrumpibles

* Para máquinas virtuales A2, no es necesario solicitar cuotas de CPU. Si tiene las cuotas de GPU NVIDIA A100 requeridas, eso es todo lo que necesita para crear estas máquinas virtuales.

Para máquinas virtuales A4, A3 y G2, las cuotas de CPU no se aplican. Si tiene las cuotas de GPU NVIDIA B200, H200, H100 y L4 respectivamente, eso es todo lo que necesita para crear estas máquinas virtuales.

Cuota de GPU

De manera similar a la cuota de CPU virtual, la cuota de GPU se refiere a la cantidad total de GPU virtuales en todas las instancias de VM en una región. Las cuotas de GPU se aplican a las máquinas virtuales en ejecución y a las reservas de máquinas virtuales. Tanto las máquinas virtuales predefinidas como las interrumpibles consumen esta cuota.

Consulte la página Cuotas para asegurarse de tener suficientes GPU disponibles en su proyecto y para solicitar un aumento de cuota. Además, las nuevas cuentas y proyectos tienen una cuota global de GPU que se aplica a todas las regiones.

Cuando solicita una cuota de GPU, debe solicitar una cuota para los modelos de GPU que desea crear en cada región y una cuota global adicional ( GPUs (all regions) ) para la cantidad total de GPU de todos los tipos en todas las regiones. Solicite una cuota de GPU interrumpible para utilizar esos recursos.

Tipo de máquina tipo de GPU Nombre de cuota de GPU familia de GPU Nombre de cuota de GPU comprometida Estación de trabajo virtual GPU interrumpibles Estación de trabajo virtual con GPU interrumpible
A4 B200 N / A N / A COMMITTED_NVIDIA_B200_GPUS N / A PREEMPTIBLE_NVIDIA_B200_GPUS N / A
A3 Ultra H200 141GB N / A N / A COMMITTED_NVIDIA_H200_GPUS N / A PREEMPTIBLE_NVIDIA_H200_GPUS N / A
A3 Mega H100 80GB GPUS_PER_GPU_FAMILY NVIDIA_H100_MEGA COMMITTED_NVIDIA_H100_MEGA_GPUS N / A PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS N / A
A3 borde y A3 alto H100 80GB GPUS_PER_GPU_FAMILY NVIDIA_H100 COMMITTED_NVIDIA_H100_GPUS N / A PREEMPTIBLE_NVIDIA_H100_GPUS N / A
A2 Ultra A100 80GB NVIDIA_A100_80GB_GPUS N / A COMMITTED_NVIDIA_A100_80GB_GPUS N / A PREEMPTIBLE_NVIDIA_A100_80GB_GPUS N / A
Estándar A2 A100 40GB NVIDIA_A100_GPUS N / A COMMITTED_NVIDIA_A100_GPUS N / A PREEMPTIBLE_NVIDIA_A100_GPUS N / A
G2 L4 NVIDIA_L4_GPUS N / A COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
N1 T4 NVIDIA_T4_GPUS N / A COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS N / A COMMITTED_NVIDIA_V100_GPUS N / A PREEMPTIBLE_NVIDIA_V100_GPUS N / A
P100 NVIDIA_P100_GPUS N / A COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS N / A COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS

Cuotas preferentes

Puede solicitar cuotas interrumpibles para Preemptible CPUs , Preemptible GPUs y Preemptible Local SSDs (GB) . Estas cuotas preferentes se aplican a las CPU, GPU y SSD locales de las siguientes máquinas virtuales:

Si su proyecto no tiene una cuota preferente y nunca la ha solicitado, estos recursos consumen la cuota estándar. Sin embargo, después de solicitar una cuota interrumpible en su proyecto, los recursos aplicables solo pueden consumir una cuota interrumpible y no pueden volver a consumir cuotas estándar.

Solicitar cuotas interrumpibles puede ayudarle a mejorar la obtención de cuotas al proporcionar cuotas separadas para recursos temporales. Después de que Compute Engine te otorga una cuota preferente en una región, todos los recursos aplicables consumen automáticamente la cuota preferente. Si esta cuota se agota, debe solicitar una cuota preferente para esos recursos.

Direcciones IP externas

Debe tener suficientes direcciones IP externas para cada máquina virtual a la que se deba poder acceder directamente desde la Internet pública. La cuota de IP regional sirve para asignar direcciones IPv4 a máquinas virtuales en esa región. La cuota de IP global sirve para asignar direcciones IPv4 a recursos de red globales, como balanceadores de carga.Google Cloud ofrece diferentes tipos de direcciones IP, dependiendo de sus necesidades. Para obtener información sobre los costos, consulte Precios de direcciones IP externas . Para obtener información sobre los detalles de las cuotas, consulte Cuotas y límites .

  • Direcciones IP externas en uso . Incluye direcciones IP estáticas y efímeras que utiliza un recurso.

  • Direcciones IP externas estáticas : direcciones IP externas reservadas para sus recursos que persisten durante los reinicios de la máquina. Puede registrar estas direcciones con DNS y servicios de proveedor de dominio para proporcionar una dirección fácil de usar. Por ejemplo, www.sitio-ejemplo.com.

  • Direcciones IP internas estáticas: las direcciones IP internas estáticas le permiten reservar direcciones IP internas del rango de IP interno configurado en la subred. Puede asignar esas direcciones internas reservadas a los recursos según sea necesario.

Implementaciones de cuotas

Ocasionalmente, Google Cloud cambia la cuota predeterminada para recursos y API. Estos cambios se producen gradualmente. Durante la implementación de una nueva cuota predeterminada, es posible que la cuota máxima que aparece en la consola de Google Cloud no refleje la cuota máxima real que está disponible para usted.

Por ejemplo, supongamos que Google Cloud cambia la cuota máxima predeterminada para las reglas de firewall de 200 a 300 y usa la consola de Google Cloud para ver su cuota, es posible que vea la nueva cuota de 300 , aunque su cuota real sea 200 hasta que se complete la implementación.

Para obtener información sobre los lanzamientos de cuotas en curso, consulte problemas conocidos . Si no se describen problemas, no se están implementando cuotas en curso.

Si se está implementando una cuota y desea confirmar la cuota máxima real que está disponible para usted, use la CLI de Google Cloud para verificar su cuota . Si necesita más cuota de la que tiene acceso, envíe una solicitud de aumento de cuota .

¿Qué sigue?