Cuotas de asignación


En este documento se indican las cuotas de asignación que se aplican a Compute Engine.

Cuotas de asignación

Las cuotas de asignación, también conocidas como cuotas de recursos, definen el número de recursos a los que puede acceder tu proyecto. En Compute Engine, el uso de recursos está sujeto a cuotas de asignación por diversos motivos. Por ejemplo, las cuotas ayudan a proteger a la comunidad de usuarios de Google Cloud al evitar que se produzcan picos de uso imprevistos.

Google Cloud también ofrece cuotas de prueba gratuita que proporcionan acceso limitado a proyectos para que explores Google Cloud de forma gratuita.

Estas cuotas varían en función del proyecto Conforme aumente tu uso deGoogle Cloud , tus cuotas también podrían aumentar. Si crees que tu uso va a aumentar de manera considerable, puedes solicitar de forma proactiva un ajuste de la cuota en la página Cuotas de laGoogle Cloud console.

Para obtener información específica sobre las cuotas de los límites de frecuencia de la API Compute Engine, consulta Cuota de API.

Disponibilidad de recursos y cuotas

Las cuotas de asignación son el número máximo de recursos que puedes crear de un tipo en concreto, siempre que estén disponibles (lo cual no se garantiza). Si un recurso no está disponible o se ha agotado en la región seleccionada, no puedes crear más recursos de ese tipo, ni aunque quede cuota en tu proyecto o tu región. Por ejemplo, quizá tengas cuota suficiente como para crear direcciones IP externas en us-central1, pero es posible que no haya direcciones IP disponibles en esa región.

Del mismo modo, aunque te quede cuota regional, cabe la posibilidad de que un recurso no esté disponible en una zona en concreto. Por ejemplo, puede que tengas cuota para crear instancias de máquina virtual en la región us-central1, pero si se ha agotado en la zona us-central1-a, no podrás crear más instancias de máquina virtual en ella. En tales casos, prueba a crear el mismo recurso en otra zona, como us-central1-f. Para obtener más información sobre las opciones que tienes si se agotan los recursos de zona, consulta la documentación sobre la solución de problemas de disponibilidad de recursos.

Cuotas de asignación

Cuando vayas a decidir qué necesita tu instancia de VM, debes tener en cuenta una serie de cuotas, ya que pueden afectar al número de instancias que puedes crear.

Cuotas regionales y globales

Las cuotas de VM se gestionan a nivel regional. Las cuotas de instancias de máquina virtual, grupos de instancias, discos y CPU las puede consumir cualquier máquina virtual de la región, independientemente de la zona en que se encuentre. Por ejemplo, la cuota de CPUs es regional, y cada región tiene diferentes límites y formas de calcular el uso. Para lanzar una instancia n2-standard-16 en cualquier zona de la región us-central1, debes tener suficiente cuota como para implementar al menos 16 CPU en us-central1.

Las cuotas de redes y de balanceo de carga son necesarias para crear cortafuegos, balanceadores de carga, redes y VPNs. Estas cuotas son globales y no dependen de ninguna región en concreto. Por otra parte, cualquier región puede usar las cuotas globales. Por ejemplo, las direcciones IP externas, estáticas y en uso que estén asignadas a balanceadores de carga y proxies HTTP y HTTPS consumen cuotas globales.

Instancias de VM

La cuota de instancias de máquina virtual es regional y limita el número de este tipo de instancias que puede haber en una región determinada (independientemente de si la máquina virtual se está ejecutando). Esta cuota se puede consultar en la Google Cloud consola, en la página Cuotas. Compute Engine establece automáticamente que sea 10 veces tu cuota de CPUs habitual. No tienes que solicitarla; Si necesitas cuota para más instancias de máquina virtual, solicita más CPUs y la cuota aumentará a su vez. Se aplica tanto a las máquinas virtuales en ejecución como a las que no se están ejecutando, y tanto a las instancias normales como a las interrumpibles.

  1. En la Google Cloud consola, ve a la página Cuotas.

    Ir a Cuotas

  2. En la lista Filtrar, selecciona las siguientes opciones:

    • En Servicio, selecciona API de Compute Engine.
    • En Type (Tipo), selecciona Quota (Cuota).
    • En Nombre, selecciona Instancias de VM.
    • Opcional: En Métrica, selecciona cualquier otro nombre de cuota de CPU o de CPU por compromiso que quieras filtrar.
  3. Opcional: Para ordenar la tabla por región, haga clic en la columna Dimensiones (por ejemplo, ubicación).

  4. Selecciona las regiones cuya cuota quieras modificar.

  5. Haz clic en Editar.

  6. Rellena el formulario.

  7. Haz clic en Enviar solicitud.

Grupos de instancias

Para usar grupos de instancias, debes tener cuota suficiente para todos los recursos que utilizará el grupo (por ejemplo, cuota de CPUs), además de para el propio grupo. Se aplicarán las siguientes cuotas de uso de recursos de grupo en función del tipo de grupo que crees:

Tipo de servicio Cuota de servicio
Grupo de instancias gestionado por regiones (multizona) Regional instance group managers
Grupo de instancias gestionado por zonas (zona única) Ambos tipos:
  • Instance group managers
  • Instance groups
Grupo de instancias sin gestionar (zona única) Instance groups
Herramienta de adaptación dinámica por regiones (multizona) Regional autoscalers
Herramienta de adaptación dinámica por zonas (zona única) Autoscalers

Cuotas de disco

Las siguientes cuotas de Persistent Disk, Hyperdisk y SSD local se aplican a cada región por separado:

  • Hyperdisk Balanced Capacity (GB): esta cuota es el tamaño total combinado de los discos Hyperdisk Balanced que puedes crear en una región. En la CLI de gcloud y en la API, esta cuota se denomina HDB-TOTAL-GB.
  • Hyperdisk Balanced Throughput (MB/s): esta cuota es la cantidad total de capacidad de procesamiento que puedes aprovisionar para todos los discos Hyperdisk Balanced de una zona. En la CLI de gcloud y en la API, esta cuota se denomina HDB-TOTAL-THROUGHPUT.
  • Hyperdisk Balanced IOPS: esta cuota es la cantidad total de IOPS que puedes aprovisionar para todos los discos Hyperdisk Balanced de una zona. En la CLI de gcloud y en la API, esta cuota se conoce como HDB-TOTAL-IOPS.
  • Hyperdisk ML Capacity (GB): esta cuota es el tamaño total combinado de los discos Hyperdisk ML que puedes crear en una región. En la CLI de gcloud y en la API, esta cuota se denomina HDML-TOTAL-GB.
  • Hyperdisk ML Throughput (MB/s): esta cuota es la cantidad total de capacidad de procesamiento que puedes aprovisionar para todos los discos Hyperdisk ML de una región. En la CLI de gcloud y en la API, esta cuota se denomina HDML-TOTAL-THROUGHPUT.
  • Persistent disk standard (GB): esta cuota es el tamaño total de los discos persistentes estándar que se pueden crear en una región. En la CLI de gcloud y en la API, esta cuota se denomina DISKS_TOTAL_GB. Esta cuota también se aplica a lo siguiente:
    • Disco persistente estándar regional, aunque los discos persistentes regionales consumen el doble de cuota por GiB debido a la replicación en dos zonas de una región.
    • Si decides conservar los datos de SSD local al detener o suspender una VM, se consumirá una cantidad equivalente de cuota de disco persistente estándar.
  • Persistent disk SSD (GB): esta cuota es el tamaño total combinado de los volúmenes de Persistent Disk con SSD que se pueden crear en una región. En la CLI de gcloud y en la API, esta cuota se conoce como SSD_TOTAL_GB. Esta cuota es distinta de la de los discos SSD locales. Esta cuota se aplica a los siguientes tipos de discos:

    • Disco persistente SSD regional y de zona
    • Disco persistente balanceado regional y de zona

    Los volúmenes de disco persistente regional consumen el doble de cuota por GiB debido a la replicación en dos zonas de una región.

  • Persistent Disk IOPS: esta cuota es el número total de operaciones de E/S por segundo de los volúmenes de disco persistente extremo que se pueden crear en una región. En la CLI de gcloud y en la API, esta cuota se conoce como PD-EXTREME-TOTAL-PROVISIONED-IOPS. Esta cuota es independiente de la cuota de IOPS de Google Cloud Hyperdisk.

  • Local SSD per machine family (GB): esta cuota es el tamaño total combinado de los discos SSD locales que puedes adjuntar a las VMs de una región en función del tipo de máquina de cada VM. Una unidad SSD local es un disco efímero y rápido, ideal para tareas temporales, de la caché local o de procesamiento con una alta tolerancia a fallos, ya que no es necesario que siga activa tras reiniciarse la instancia de máquina virtual.

    Los discos SSD locales se venden en incrementos de 375 GiB o 3 TiB, según el tipo de máquina. También hay un número máximo de discos SSD locales que se pueden conectar a una sola máquina virtual, según el tipo de máquina. El número máximo de discos SSD locales y el tamaño de cada disco SSD local limitan la cantidad total de capacidad de disco SSD local que puedes asignar a una VM. En la CLI de gcloud y en la API, este límite se conoce como cuota LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

    En el caso de los tipos de máquinas A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 Ultra y G4, no es necesario solicitar esta cuota, ya que los SSD locales se añaden automáticamente a las VMs creadas con estos tipos de máquinas. Sin embargo, debes solicitar LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY para las otras máquinas virtuales optimizadas para aceleradores.

Cuotas de grupos de almacenamiento

En cuanto a la capacidad, los grupos de almacenamiento de Hyperdisk con aprovisionamiento de capacidad avanzada tienen las siguientes cuotas, medidas en GB (o 1000 MB):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB): cantidad total de espacio en disco que puedes reservar por región en un grupo de almacenamiento Hyperdisk equilibrado con aprovisionamiento de capacidad avanzada.

    • CLI de gcloud y la API: HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB): la cantidad total de espacio en disco que puedes reservar por región en un grupo de almacenamiento de Hyperdisk con rendimiento y aprovisionamiento de capacidad avanzada.

    • CLI de gcloud y la API: HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

En cuanto al rendimiento, los grupos de almacenamiento de Hyperdisk con aprovisionamiento de rendimiento avanzado tienen las siguientes cuotas:

  • Hyperdisk Balanced Storage Pools Advanced IOPS: el total de IOPS que puedes reservar en un grupo de almacenamiento Hyperdisk Balanced con aprovisionamiento de rendimiento avanzado para una región.

    • CLI de gcloud y la API: HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
  • Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s): el rendimiento total que puedes reservar en un grupo de almacenamiento Hyperdisk Balanced con aprovisionamiento de rendimiento avanzado para una región.

    • CLI de gcloud y la API: HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
  • Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s): es el rendimiento total que puedes reservar en un grupo de almacenamiento de Hyperdisk con rendimiento aprovisionado avanzado en una región.

    • CLI de gcloud y la API: HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

Límites de cuota de CPU

La cuota de CPUs es el número total de CPU virtuales en todas tus instancias de máquina virtual de una región. Las cuotas de CPUs se aplican a las VMs en ejecución y a las reservas de VMs. y las consumen tanto las máquinas virtuales predefinidas como las interrumpibles.

Para proteger los sistemas de Compute Engine y a otros usuarios, algunas cuentas y proyectos nuevos también tienen una cuota de CPUs (All Regions) global. Esta cuota se aplica a todas las regiones y se mide como la suma de todas tus vCPUs en todas las regiones.

Por ejemplo, si te quedan 48 vCPU en una región como us-central1, pero en la cuota CPUs (All Regions) únicamente tienes 32, solo puedes lanzar 32 vCPU en la región us-central1, aunque sobre cuota regional. Esto se debe a que habrás alcanzado la cuota CPU (All Regions) y, para lanzar nuevas instancias, debes eliminar alguna de las ya creadas.

Los tipos de máquina E2 y N1 pertenecen al mismo grupo de cuotas de CPUs. A menos que se indique lo contrario, el resto de los tipos de máquina tienen grupos de cuotas de CPUs únicos e independientes.

.

Si utilizas descuentos por compromiso de uso en tus máquinas virtuales, debes tener una cuota de descuento por compromiso de uso para poder adquirir un contrato de descuento por compromiso de uso.

En la siguiente tabla se indican los nombres de las cuotas de los tipos de máquinas de Compute Engine. Si la cuota no se aplica al tipo de máquina, se muestra el valor "No aplicable".

Tipo de máquina Grupo de cuotas Nombre de cuota de CPUs Nombre de cuota de CPUs por compromiso
N1 grupo compartido CPUS Committed_CPUS
E2 grupo compartido CPUS Committed_CPUS
N2 grupo independiente N2_CPUS Committed_N2_CPUS
N4 grupo independiente CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D grupo independiente N2D_CPUS Committed_N2D_CPUS
T2D grupo independiente T2D_CPUS Committed_T2D_CPUS
T2A grupo independiente T2A_CPUS No disponible para T2A
Z3 grupo independiente CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 grupo independiente M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 grupo independiente M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 grupo independiente M3_CPUS Committed_M3_CPUS
M4 grupo independiente CPUS_PER_VM_FAMILY Committed_M4_CPUS
X4 grupo independiente CPUS_PER_VM_FAMILY Committed_X4_CPUS
H3 grupo independiente CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 grupo independiente C2_CPUS Committed_C2_CPUS
C2D grupo independiente C2D_CPUS Committed_C2D_CPUS
C3 grupo independiente C3_CPUS Committed_C3_CPUS
C3D grupo independiente CPUS_PER_VM_FAMILY Committed_C3D_CPUS
C4 grupo independiente CPUS_PER_VM_FAMILY Committed_C4_CPUS
C4A grupo independiente CPUS_PER_VM_FAMILY Committed_C4A_CPUS
A2* grupo independiente A2_CPUS Committed_A2_CPUS
A4X No disponible para A4X No disponible para A4X No disponible para A4X
A4 No disponible para A4 No disponible para A4 No disponible para A4
A3 N/A para A3 N/A para A3 N/A para A3
G4 No disponible en G4 No disponible en G4 No disponible en G4
G2 No disponible para G2 No disponible para G2 No disponible para G2
Máquinas virtuales interrumpibles grupo compartido PREEMPTIBLE_CPUS No disponible para máquinas virtuales interrumpibles

*Para crear máquinas virtuales A2, solo necesitas tener las cuotas de GPU NVIDIA A100 necesarias. No es necesario que solicites cuotas de CPU.

Para crear máquinas virtuales A4X, A4, A3, G4 y G2, solo necesitas tener las cuotas de GPU NVIDIA B200, H200, H100, RTX PRO 6000 y L4, respectivamente. No es necesario que solicites cuotas de CPU.

Cuota de GPUs

Para asegurarte de que tienes suficientes GPUs disponibles en tu proyecto, consulta la página Cuotas de la Google Cloud consola. Solicita un aumento de cuota si lo necesitas. Las cuentas y los proyectos nuevos tienen una cuota de GPU global que se aplica a todas las regiones.

Al igual que ocurre con la cuota de CPUs virtuales, la cuota de GPUs es el número total de GPUs virtuales de todas las instancias de máquina virtual de una región. Las instancias en ejecución y las reservas consumen cuotas de GPU. Tienes diferentes cuotas para crear instancias estándar, máquinas virtuales Spot (por ejemplo, instancias interrumpibles), estaciones de trabajo virtuales o instancias que usen el uso confirmado.

Cuando solicites una cuota de GPU, pide una cuota para los modelos de GPU que quieras crear en cada región. También debes solicitar una cuota global adicional (GPUs (all regions)) para el número total de GPUs de todos los tipos en todas las regiones.

En la tabla siguiente se indican las cuotas de GPU disponibles para cada tipo de máquina.

Tipo de máquina Tipo de GPU Cuota estándar Cuota comprometida Cuota de estaciones de trabajo virtuales Cuota de recursos interrumpibles Cuota de estaciones de trabajo virtuales interrumpibles
A4X GB200 No disponible COMMITTED_NVIDIA_GB200_GPUS No disponible PREEMPTIBLE_NVIDIA_GB200_GPUS No disponible
A4 B200 No disponible COMMITTED_NVIDIA_B200_GPUS No disponible PREEMPTIBLE_NVIDIA_B200_GPUS No disponible
A3 Ultra H200 No disponible COMMITTED_NVIDIA_H200_GPUS No disponible PREEMPTIBLE_NVIDIA_H200_GPUS No disponible
A3 Mega H100 GPU_FAMILY:NVIDIA_H100_MEGA COMMITTED_NVIDIA_H100_MEGA_GPUS No disponible PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS No disponible
A3 Edge y A3 High H100 GPU_FAMILY:NVIDIA_H100 COMMITTED_NVIDIA_H100_GPUS No disponible PREEMPTIBLE_NVIDIA_H100_GPUS No disponible
A2 Ultra A100 80 GB NVIDIA_A100_80GB_GPUS COMMITTED_NVIDIA_A100_80GB_GPUS No disponible PREEMPTIBLE_NVIDIA_A100_80GB_GPUS No disponible
A2 Standard A100 40 GB NVIDIA_A100_GPUS COMMITTED_NVIDIA_A100_GPUS No disponible PREEMPTIBLE_NVIDIA_A100_GPUS No disponible
G4 Vista previa RTX PRO 6000 GPU_FAMILY:NVIDIA_RTX_PRO_6000 No disponible No disponible No disponible No disponible
G2 L4 GPU_FAMILY:NVIDIA_L4 COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
N1 T4 NVIDIA_T4_GPUS COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
N1 V100 NVIDIA_V100_GPUS COMMITTED_NVIDIA_V100_GPUS No disponible PREEMPTIBLE_NVIDIA_V100_GPUS No disponible
N1 P100 NVIDIA_P100_GPUS COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
N1 P4 NVIDIA_P4_GPUS COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS

Cuotas de recursos interrumpibles

Puedes solicitar cuotas de recursos interrumpibles para Preemptible CPUs, Preemptible GPUs y Preemptible Local SSDs (GB). Estas cuotas de recursos interrumpibles se aplican a las CPUs, las GPUs y los SSD locales de las siguientes VMs:

Si tu proyecto no tiene cuota interrumpible y nunca la has solicitado, estos recursos consumen cuota estándar. Sin embargo, después de solicitar una cuota interrumpible en tu proyecto, los recursos aplicables solo pueden consumir cuotas interrumpibles y no pueden volver a consumir cuotas estándar.

Solicitar cuotas de recursos interrumpibles puede ayudarte a mejorar la disponibilidad de las cuotas, ya que se proporcionan cuotas independientes para los recursos temporales. Cuando Compute Engine te conceda la cuota de recursos interrumpibles en una región, todos los recursos aplicables consumirán automáticamente la cuota de recursos interrumpibles. Si se agota esta cuota, debes solicitar una cuota de recursos preemptivos para esos recursos.

Direcciones IP externas

Tienes que disponer de suficientes direcciones IP externas para cada máquina virtual a la que se deba acceder directamente a través de la Internet pública. La cuota de IP regionales se aplica a la asignación de direcciones IPv4 o IPv6 a las máquinas virtuales de una región concreta. Las direcciones IP IPv6 usan los mismos tipos de cuota que las direcciones IP IPv4, excepto las direcciones estáticas IPv6 externas e internas, que tienen sus propios tipos de cuota.

mientras que la global limita la asignación de direcciones IPv4 a los recursos de red globales, como es el caso de los balanceadores de carga.

Google Cloud ofrece diversos tipos de direcciones IP para distintas necesidades. Para obtener información sobre los costes, consulta los precios de las direcciones IP externas. Para obtener más información sobre las cuotas, consulta Cuotas y límites.

  • Direcciones IP estáticas. La cantidad de direcciones IPv4 externas regionales estáticas que puedes reservar en cada región de tu proyecto.
  • Intervalos de direcciones IPv6 externas estáticas regionales: el número de intervalos de direcciones IPv6 externas estáticas regionales que puedes reservar en cada región de tu proyecto.
  • Direcciones IP globales estáticas: son direcciones IP externas reservadas para los recursos que persisten al reiniciar las máquinas. Puedes registrarlas a través de un proveedor de dominios y de DNS, de modo que tengan un formato más intuitivo Por ejemplo, www.example-site.com.
  • Direcciones IP en uso. El número de direcciones IP externas regionales estáticas y efímeras que puedes usar simultáneamente en tu proyecto.
  • Direcciones IP globales en uso. El número de direcciones IP externas globales estáticas y efímeras que puedes usar simultáneamente en tu proyecto.

Lanzamientos de cuotas

De vez en cuando, Google Cloud cambia la cuota predeterminada de recursos y APIs. Estos cambios se aplican gradualmente. Durante el lanzamiento de una nueva cuota predeterminada, es posible que la cuota máxima que aparece en la consola Google Cloud no refleje la cuota máxima real que tienes disponible.

Por ejemplo, supongamos que Google Cloud cambia la cuota máxima predeterminada de reglas de firewall de 200 a 300 y que usas la Google Cloud consola para ver tu cuota. En ese caso, puede que veas la nueva cuota de 300, aunque tu cuota real sea 200 hasta que se complete el lanzamiento.

Para obtener información sobre los lanzamientos de cuotas en curso, consulta los problemas conocidos. Si no se describe ningún problema, no hay ningún lanzamiento de cuota en curso.

Si se está implementando una cuota y quieres confirmar la cuota máxima real que tienes disponible, usa la CLI de Google Cloud para consultar tu cuota. Si necesitas más cuota de la que tienes, envía una solicitud de ajuste de cuota.

Siguientes pasos