Ajustador de cuotas

En este documento se describe cómo ajustar las cuotas mediante el sistema de ajuste de cuotas.

El ajustador de cuotas observa el consumo de recursos y envía de forma proactiva solicitudes de ajuste de cuotas en tu nombre. Si monitorizas el uso de tus recursos y envías solicitudes de ajuste de cuota de forma proactiva, puedes evitar interrupciones causadas por alcanzar el valor de tu cuota. Al usar el ajustador de cuota, no tendrás que estar pendiente de los aumentos imprevistos en el uso de tus recursos y podrás enviar menos solicitudes manuales de ajustes de cuota.

Cómo funciona el ajustador de cuotas

Cuando habilita el ajustador de cuotas, este monitoriza todas las cuotas aplicables y aplica la siguiente lógica:

  • El ajustador de cuota comprueba si el uso máximo se ha acercado al valor de la cuota durante un periodo específico.
  • Si es así, el ajustador de cuotas intentará aumentar el valor de la cuota (normalmente, entre un 10 y un 20%).

Si es posible aumentar el valor de la cuota, se aprueba el aumento y se ajusta el valor. Puede solicitar manualmente aumentos de los valores de cuota en cualquier momento, independientemente de si el ajustador de cuota está habilitado o no.

El ajustador de cuotas solo envía solicitudes de ajuste de cuotas para aumentar el valor de una cuota. No intenta reducir el valor. En el caso de las cuotas que tienen un límite manual, el ajustador de cuotas no envía solicitudes de ajuste.

Puedes ver las solicitudes que ha hecho el ajustador de cuotas en la página Cuotas y límites del sistema de la consola deGoogle Cloud . También puedes configurar alertas para monitorizar los cambios iniciados por el ajustador de cuotas.

Limitaciones

El ajustador de cuotas tiene las siguientes limitaciones:

  • Los ajustes de cuota solo están disponibles por proyecto.
  • Solo se puede acceder a los ajustes del ajustador de cuota desde la consolaGoogle Cloud .
  • El ajustador de cuotas no está disponible para todas las cuotas. Para obtener más información, consulta la sección Disponibilidad de este documento.

Disponibilidad

La disponibilidad del ajustador de cuotas depende de tu Google Cloud proyecto y solo está disponible para algunas Google Cloud cuotas.

Requisitos basados en el historial de uso

El ajustador de cuotas requiere un volumen suficiente de datos de uso históricos para determinar con precisión cuándo solicitar cuotas adicionales. Por este motivo, la opción para habilitar el ajustador de cuota solo está disponible en proyectos con suficiente actividad histórica para admitir predicciones precisas.

Cuotas admitidas

El ajustador de cuotas no está disponible para todas las cuotas deGoogle Cloud . Un servicio puede admitir el ajustador de cuotas para todas, algunas o ninguna de sus cuotas. Google Cloud Si habilitas el ajustador de cuotas en tu proyecto, se aplicará a todas las cuotas admitidas.

Cuando un servicio añade o amplía la compatibilidad con el ajustador de cuotas para sus cuotas, el ajustador de cuotas monitoriza y ajusta automáticamente estas cuotas recién admitidas de tu proyecto. Google Cloud Esto ocurre aunque estas cuotas específicas no se admitieran cuando habilitaste el ajustador de cuotas por primera vez.

En la siguiente tabla se indican las cuotas que admite el ajustador de cuotas.

Servicio Cuotas
API de Artifact Registry Solicitudes por proyecto en la multirregión de Asia por minuto
API de Artifact Registry Solicitudes por proyecto en la multirregión de Europa por minuto
API de Artifact Registry Solicitudes por proyecto en la multirregión de EE. UU. por minuto
API de Artifact Registry Solicitudes por proyecto, región y minuto por región
API de Cloud Build Solicitudes de compilación y de obtención de operaciones por minuto
API de Cloud Build Solicitudes de compilación y de obtención de operaciones por minuto y usuario
API de Cloud Build CPUs de compilación simultáneas (grupo predeterminado regional)
API de Cloud Build Compilaciones simultáneas (grupo predeterminado no regional)
API Cloud Key Management Service Solicitudes criptográficas por minuto
API Cloud Key Management Service Solicitudes de lectura por minuto
API Cloud Key Management Service Solicitudes de escritura por minuto
API de registro en la nube Bytes de escritura de registros por minuto y región
API Cloud Resource Manager Solicitudes de lectura por minuto
API Admin de Cloud Run Solicitudes de ejecución de trabajos por minuto y región
API Admin de Cloud Run Solicitudes de lectura por minuto y región
API Admin de Cloud Run Asignación total de CPU, en milivCPUs, por proyecto y región
API Admin de Cloud Run Solicitudes de escritura por minuto y región
API Cloud Trace Solicitudes de escritura (gratuitas) por minuto
API de Compute Engine Grupos de afinidades
API de Compute Engine Segmentos de backend
API de Compute Engine CPUs C2
API de Compute Engine CPUs C2D
API de Compute Engine CPUs C3
API de Compute Engine Confirmaciones
API de Compute Engine CPUs A2 por compromiso
API de Compute Engine CPUs por compromiso
API de Compute Engine Licencias contratadas
API de Compute Engine Disco SSD local confirmado reservado (GB)
API de Compute Engine CPUs M3 por compromiso
API de Compute Engine CPUs con memoria optimizada por compromiso
API de Compute Engine CPUs N2 por compromiso
API de Compute Engine CPUs N2D por compromiso
API de Compute Engine CPUs T2D por compromiso
API de Compute Engine CPUs
API de Compute Engine CPUs por familia de VMs
API de Compute Engine Proyectos de servicio de redes entre proyectos
API de Compute Engine Rutas estáticas personalizadas por red de VPC
API de Compute Engine Servicios de backend de balanceadores de carga de red de paso a través externos
API de Compute Engine Reglas de reenvío de balanceadores de carga de red de paso a través externos
API de Compute Engine Reglas de reenvío de protocolos externos
API de Compute Engine Reglas de cortafuegos
API de Compute Engine Reglas de reenvío
API de Compute Engine Servicios de backend gestionados externos globales
API de Compute Engine Reglas de reenvío externas globales gestionadas
API de Compute Engine Servicios backend de balanceadores de carga con proxy externo global
API de Compute Engine Servicios de backend de Traffic Director internos globales
API de Compute Engine Número de GPUs por familia de GPUs
API de Compute Engine GPUs (todas las regiones)
API de Compute Engine Comprobaciones del estado
API de Compute Engine Imágenes
API de Compute Engine Direcciones IP en uso
API de Compute Engine Direcciones IPv4 externas regionales en uso
API de Compute Engine Programaciones de capturas en uso
API de Compute Engine Grupos de instancias
API de Compute Engine Plantillas de instancia
API de Compute Engine Instancias por grupo de emparejamiento
API de Compute Engine Instancias por red de VPC
API de Compute Engine Direcciones IP internas
API de Compute Engine Servicios de backend de balanceadores de carga de red de paso a través internos
API de Compute Engine Reglas de reenvío de balanceadores de carga de red de paso a través internos por grupo de emparejamiento
API de Compute Engine Reglas de reenvío de balanceadores de carga de red de paso a través internos por red de VPC
API de Compute Engine Alias de IP por grupo de emparejamiento
API de Compute Engine Alias de IP por red de VPC
API de Compute Engine Disco SSD local por familia de VMs (GB)
API de Compute Engine CPUs M1
API de Compute Engine CPUs M2
API de Compute Engine CPUs M3
API de Compute Engine Grupos de instancias administradas
API de Compute Engine CPUs N2
API de Compute Engine CPUs N2D
API de Compute Engine Grupos de puntos finales de red
API de Compute Engine Políticas de cortafuegos de red
API de Compute Engine Atributos de reglas de políticas de seguridad de balanceo de carga de red
API de Compute Engine Políticas de seguridad de balanceo de carga de red
API de Compute Engine Redes
API de Compute Engine CPUs NVIDIA A2
API de Compute Engine Emparejamientos por red de VPC
API de Compute Engine IOPS de Persistent Disk
API de Compute Engine Disco persistente SSD (GB)
API de Compute Engine Disco persistente estándar (GB)
API de Compute Engine CPU prioritarias
API de Compute Engine SSD local de instancia de VM preemptible (GB)
API de Compute Engine GPUs NVIDIA A100 de 80 GB interrumpibles
API de Compute Engine GPUs NVIDIA A100 interrumpibles
API de Compute Engine GPUs NVIDIA H100 interrumpibles
API de Compute Engine GPUs NVIDIA H100 MEGA interrumpibles
API de Compute Engine GPUs NVIDIA K80 interrumpibles
API de Compute Engine GPUs NVIDIA L4 interrumpibles
API de Compute Engine GPUs de estaciones de trabajo virtuales NVIDIA L4 interrumpibles
API de Compute Engine GPUs NVIDIA P100 interrumpibles
API de Compute Engine GPUs de estaciones de trabajo virtuales NVIDIA P100 interrumpibles
API de Compute Engine GPUs NVIDIA P4 interrumpibles
API de Compute Engine GPUs de estaciones de trabajo virtuales NVIDIA P4 interrumpibles
API de Compute Engine GPUs NVIDIA T4 interrumpibles
API de Compute Engine GPUs NVIDIA T4 de estaciones de trabajo virtuales interrumpibles
API de Compute Engine GPUs NVIDIA V100 interrumpibles
API de Compute Engine Prefijos públicos anunciados
API de Compute Engine Servicios backend gestionados externos regionales
API de Compute Engine Reglas de reenvío externas gestionadas regionales por región y por red de VPC
API de Compute Engine Plantillas de instancia regionales
API de Compute Engine Servicios backend internos gestionados regionales
API de Compute Engine Servicios backend de Traffic Director internos regionales
API de Compute Engine Grupos de instancias gestionados regionales
API de Compute Engine Políticas de seguridad regionales
API de Compute Engine Reglas de políticas de seguridad regionales con una condición de coincidencia avanzada
API de Compute Engine Proxies TCP de destino regionales
API de Compute Engine Routers
API de Compute Engine Rutas
API de Compute Engine Políticas de seguridad
API de Compute Engine Reglas de la política de seguridad
API de Compute Engine Reglas del lenguaje de las reglas de política de seguridad
API de Compute Engine Capturas
API de Compute Engine Certificados SSL
API de Compute Engine Direcciones IP estáticas de BYOIP
API de Compute Engine Direcciones IP estáticas
API de Compute Engine Intervalos de subred por grupo de emparejamiento
API de Compute Engine Intervalos de subred por red de VPC
API de Compute Engine CPUs T2A
API de Compute Engine CPUs T2D
API de Compute Engine Proxies HTTP de destino
API de Compute Engine Proxies HTTPS de destino
API de Compute Engine Proxies SSL de destino
API de Compute Engine Proxies TCP de destino
API de Compute Engine Pasarelas de VPN de destino
API de Compute Engine Disco SSD total local reservado (GB)
API de Compute Engine Mapas de URL
API de Compute Engine Instancias de VM
API de Compute Engine Pasarelas de VPN
API de Compute Engine Túneles VPN
API Connect Gateway Solicitudes de conexión de la pasarela por minuto
API de Dialogflow Todas las demás solicitudes por minuto
API de Filestore Copias de seguridad por región
API de Filestore Capacidad de HDD básico (estándar) (GB) por región
API de Filestore Capacidad de SSD básico (Premium) (GB) por región
API de Filestore Capacidad zonal y regional de 1 a 10 TiB (Enterprise) (GB) por región
API de Filestore Capacidad zonal y regional de 10 a 100 TiB (alta escala) (GB) por región
Google Cloud API Memorystore para Redis Capacidad total de Redis (GB) por región
Google Cloud API Memorystore para Redis Unidades totales de Redis Cluster por proyecto y región
API de Memorystore Unidades totales de Memorystore por proyecto y región
API de Vertex AI CPUs de servicio de modelos personalizados por región
API de Vertex AI Servicio de modelos personalizados con GPUs Nvidia T4 por región
API de Vertex AI Entrenamiento de modelos personalizados con GPUs Nvidia T4 por región
API de Vertex AI Solicitudes de generación de contenido por minuto, proyecto y modelo base
API de Vertex AI

Solicitudes de predicción online regionales por minuto, proyecto y modelo base

Nota: Para ver la lista completa de dimensiones disponibles, despliega esta entrada en la Google Cloud consola.

API de Vertex AI Solicitudes de gestión de recursos (CRUD) por minuto y región
API de Vertex AI Núcleos de los pods de TPU V3 para el entrenamiento de imágenes restringidas por región

Habilitar el ajustador de cuota

Para habilitar el ajustador de cuotas, debes tener los siguientes permisos de gestión de identidades y accesos:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Para habilitar el ajustador de cuotas en tu proyecto de la consola, Google Cloud selecciona la pestaña correspondiente y sigue las instrucciones:

Consola

Para habilitar el ajustador de cuota en tu Google Cloud proyecto desde la Google Cloud consola, sigue estos pasos:

  1. En la Google Cloud consola, ve a la página IAM y administración > Cuotas y límites del sistema:

    Ir a Cuotas y límites del sistema

  2. Haz clic en la pestaña Configuraciones.
  3. Haz clic en el interruptor Habilitar.

Cuando en la columna Estado se indica Habilitado, el ajustador de cuotas monitoriza tu uso y envía solicitudes de ajuste de cuotas cuando el uso de recursos se acerca al valor de la cuota.

REST

  1. Para habilitar el ajustador de cuota en tu Google Cloud proyecto con la API REST (versión preliminar), haz una solicitud HTTP para actualizar los ajustes del ajustador de cuota:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. En el cuerpo de la solicitud, especifica el recurso de configuración del ajustador de cuota y asigna el valor ENABLED al campo enablement. También puedes especificar un ETag, pero no es obligatorio:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    Haz los cambios siguientes:

    • PROJECT_ID_OR_NUMBER: el ID o el número del proyecto para el que quieres habilitar el ajustador de cuota.
    • OPTIONAL_ETAG: cadena ETag opcional para los ajustes del ajustador de cuota.

    De esta forma, el estado de habilitación pasa a ser enabled.

gcloud

Para habilitar el ajustador de cuotas en tu Google Cloud proyecto con la CLI de gcloud (vista previa), sigue estos pasos:

  1. Autentícate con la CLI de gcloud:

    gcloud auth login
    
  2. Habilita los ajustes del ajustador de cuotas:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    Sustituye PROJECT_ID_OR_NUMBER por el ID o el número del proyecto en el que quieras habilitar el ajustador de cuota.

  3. Verifica el estado de habilitación:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Siempre que tengas los permisos necesarios, se devolverá el estado enabled.

Ver solicitudes de ajuste de cuota

Para ver las solicitudes de ajuste de cuota, debes tener los siguientes permisos de IAM:

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

Para ver las solicitudes de ajuste de cuota emitidas por el ajustador de cuota, sigue estos pasos:

  1. En la Google Cloud consola, ve a la página IAM y administración > Cuotas y límites del sistema:

    Ir a Cuotas y límites del sistema

  2. Haz clic en la pestaña Aumentar solicitudes. La vista Aumentar solicitudes muestra las solicitudes de aumento de tu proyecto, tanto las que se han solicitado manualmente como las que ha emitido el ajustador de cuotas.
  3. Haz clic en el campo de filtro .
  4. Selecciona Tipo en el menú e introduce Auto. De esta forma, se filtran las solicitudes realizadas por el ajustador de cuotas.

Configurar alertas de ajuste de cuota

Para recibir alertas del ajustador de cuotas, sigue estos pasos:

  1. En la Google Cloud consola, ve a la página IAM y administración > Cuotas y límites del sistema:

    Ir a Cuotas y límites del sistema

  2. Haz clic en la pestaña Configuraciones.
  3. Haz clic en Crear alerta.
  4. Elige una o ambas plantillas de alerta:
    1. Todos los ajustes de Quota Adjuster: envía una alerta cada vez que Quota Adjuster emite una solicitud de ajuste de cuota para el proyecto.
    2. Errores y fallos del ajustador de cuotas: envía alertas solo cuando el ajustador de cuotas intenta aumentar el valor de una cuota y no puede hacerlo.
  5. Opcional: Ajusta los valores predeterminados de la cantidad mínima de tiempo entre alertas y la duración del cierre automático de incidentes haciendo clic en Mostrar opciones.
  6. Selecciona el canal de notificaciones para recibir alertas. Para ajustar la configuración de un canal de notificaciones o crear uno nuevo, haz clic en Gestionar canales de notificaciones.
  7. Haz clic en Crear.

Editar o eliminar alertas de ajuste de cuota

Puedes editar o eliminar alertas de ajuste de cuota en la Google Cloud consola:

  1. Ve a la página Políticas de la consola de Cloud Monitoring.

    Ir a Políticas

  2. Busca tu política de alertas de ajuste de cuota. Las políticas de alertas de ajuste de cuota tienen los siguientes nombres:

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. En la fila que muestra la política de alertas del ajuste de cuota, haz clic en Ver más.

  4. Haz clic en Editar o en Eliminar.

Inhabilitar el ajustador de cuota

Para inhabilitar el ajustador de cuotas, debes tener los siguientes permisos de gestión de identidades y accesos:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Para inhabilitar el ajustador de cuota en tu Google Cloud proyecto de consola, selecciona la pestaña correspondiente y sigue las instrucciones:

Consola

  1. En la Google Cloud consola, ve a la página IAM y administración > Cuotas y límites del sistema:

    Ir a Cuotas y límites del sistema

  2. Haz clic en la pestaña Configuraciones.
  3. Haz clic en el interruptor Habilitar. El interruptor se vuelve gris.

Cuando el interruptor está en gris y en la columna de estado se indica No habilitado, el ajustador de cuotas deja de monitorizar tu uso o de enviar solicitudes de ajuste de cuotas.

REST

  1. Para inhabilitar el ajustador de cuota en tu Google Cloud proyecto con la API REST (versión preliminar), haz una solicitud HTTP para actualizar la configuración del ajustador de cuota:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. En el cuerpo de la solicitud, especifica el recurso de configuración del ajustador de cuota y asigna el valor DISABLED al campo enablement. También puedes especificar un ETag, pero no es obligatorio:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    Haz los cambios siguientes:

    • PROJECT_ID_OR_NUMBER: el ID o el número del proyecto para el que quieres inhabilitar el ajustador de cuota.
    • OPTIONAL_ETAG: cadena ETag opcional para los ajustes del ajustador de cuota.

    De esta forma, el estado de habilitación pasa a ser disabled.

gcloud

Para inhabilitar el ajustador de cuota en tu Google Cloud proyecto con la CLI de gcloud (vista previa), sigue estos pasos:

  1. Autentícate en gcloud CLI:

    gcloud auth login
    
  2. Inhabilita los ajustes del ajustador de cuotas:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    Sustituye PROJECT_ID_OR_NUMBER por el ID o el número del proyecto en el que quieras inhabilitar el ajustador de cuota.

  3. Verifica el estado de habilitación:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Siempre que tengas los permisos necesarios, se devolverá el estado disabled.

Solucionar problemas de denegación de aumento de cuota

Es posible que se deniegue un aumento de cuota iniciado por el ajustador de cuota. Esto ocurre a veces cuando Google Cloud no puede aumentar la cuota de un proyecto, un recurso o una región concretos más allá de un valor determinado. En estos casos, puede solicitar un aumento de cuota manual.

Para recibir notificaciones cuando se deniegue una solicitud de ajuste de cuota realizada por el ajustador de cuota, configura alertas de ajustador de cuota.