En este documento se describe cómo ajustar las cuotas mediante el sistema de ajuste de cuotas.
El ajustador de cuotas observa el consumo de recursos y envía de forma proactiva solicitudes de ajuste de cuotas en tu nombre. Si monitorizas el uso de tus recursos y envías solicitudes de ajuste de cuota de forma proactiva, puedes evitar interrupciones causadas por alcanzar el valor de tu cuota. Al usar el ajustador de cuota, no tendrás que estar pendiente de los aumentos imprevistos en el uso de tus recursos y podrás enviar menos solicitudes manuales de ajustes de cuota.
Cómo funciona el ajustador de cuotas
Cuando habilita el ajustador de cuotas, este monitoriza todas las cuotas aplicables y aplica la siguiente lógica:
- El ajustador de cuota comprueba si el uso máximo se ha acercado al valor de la cuota durante un periodo específico.
- Si es así, el ajustador de cuotas intentará aumentar el valor de la cuota (normalmente, entre un 10 y un 20%).
Si es posible aumentar el valor de la cuota, se aprueba el aumento y se ajusta el valor. Puede solicitar manualmente aumentos de los valores de cuota en cualquier momento, independientemente de si el ajustador de cuota está habilitado o no.
El ajustador de cuotas solo envía solicitudes de ajuste de cuotas para aumentar el valor de una cuota. No intenta reducir el valor. En el caso de las cuotas que tienen un límite manual, el ajustador de cuotas no envía solicitudes de ajuste.
Puedes ver las solicitudes que ha hecho el ajustador de cuotas en la página Cuotas y límites del sistema de la consola deGoogle Cloud . También puedes configurar alertas para monitorizar los cambios iniciados por el ajustador de cuotas.
Limitaciones
El ajustador de cuotas tiene las siguientes limitaciones:
- Los ajustes de cuota solo están disponibles por proyecto.
- Solo se puede acceder a los ajustes del ajustador de cuota desde la consolaGoogle Cloud .
- El ajustador de cuotas no está disponible para todas las cuotas. Para obtener más información, consulta la sección Disponibilidad de este documento.
Disponibilidad
La disponibilidad del ajustador de cuotas depende de tu Google Cloud proyecto y solo está disponible para algunas Google Cloud cuotas.
Requisitos basados en el historial de uso
El ajustador de cuotas requiere un volumen suficiente de datos de uso históricos para determinar con precisión cuándo solicitar cuotas adicionales. Por este motivo, la opción para habilitar el ajustador de cuota solo está disponible en proyectos con suficiente actividad histórica para admitir predicciones precisas.
Cuotas admitidas
El ajustador de cuotas no está disponible para todas las cuotas deGoogle Cloud . Un servicio puede admitir el ajustador de cuotas para todas, algunas o ninguna de sus cuotas. Google Cloud Si habilitas el ajustador de cuotas en tu proyecto, se aplicará a todas las cuotas admitidas.
Cuando un servicio añade o amplía la compatibilidad con el ajustador de cuotas para sus cuotas, el ajustador de cuotas monitoriza y ajusta automáticamente estas cuotas recién admitidas de tu proyecto. Google Cloud Esto ocurre aunque estas cuotas específicas no se admitieran cuando habilitaste el ajustador de cuotas por primera vez.
En la siguiente tabla se indican las cuotas que admite el ajustador de cuotas.
Servicio | Cuotas |
---|---|
API de Artifact Registry | Solicitudes por proyecto en la multirregión de Asia por minuto |
API de Artifact Registry | Solicitudes por proyecto en la multirregión de Europa por minuto |
API de Artifact Registry | Solicitudes por proyecto en la multirregión de EE. UU. por minuto |
API de Artifact Registry | Solicitudes por proyecto, región y minuto por región |
API de Cloud Build | Solicitudes de compilación y de obtención de operaciones por minuto |
API de Cloud Build | Solicitudes de compilación y de obtención de operaciones por minuto y usuario |
API de Cloud Build | CPUs de compilación simultáneas (grupo predeterminado regional) |
API de Cloud Build | Compilaciones simultáneas (grupo predeterminado no regional) |
API Cloud Key Management Service | Solicitudes criptográficas por minuto |
API Cloud Key Management Service | Solicitudes de lectura por minuto |
API Cloud Key Management Service | Solicitudes de escritura por minuto |
API de registro en la nube | Bytes de escritura de registros por minuto y región |
API Cloud Resource Manager | Solicitudes de lectura por minuto |
API Admin de Cloud Run | Solicitudes de ejecución de trabajos por minuto y región |
API Admin de Cloud Run | Solicitudes de lectura por minuto y región |
API Admin de Cloud Run | Asignación total de CPU, en milivCPUs, por proyecto y región |
API Admin de Cloud Run | Solicitudes de escritura por minuto y región |
API Cloud Trace | Solicitudes de escritura (gratuitas) por minuto |
API de Compute Engine | Grupos de afinidades |
API de Compute Engine | Segmentos de backend |
API de Compute Engine | CPUs C2 |
API de Compute Engine | CPUs C2D |
API de Compute Engine | CPUs C3 |
API de Compute Engine | Confirmaciones |
API de Compute Engine | CPUs A2 por compromiso |
API de Compute Engine | CPUs por compromiso |
API de Compute Engine | Licencias contratadas |
API de Compute Engine | Disco SSD local confirmado reservado (GB) |
API de Compute Engine | CPUs M3 por compromiso |
API de Compute Engine | CPUs con memoria optimizada por compromiso |
API de Compute Engine | CPUs N2 por compromiso |
API de Compute Engine | CPUs N2D por compromiso |
API de Compute Engine | CPUs T2D por compromiso |
API de Compute Engine | CPUs |
API de Compute Engine | CPUs por familia de VMs |
API de Compute Engine | Proyectos de servicio de redes entre proyectos |
API de Compute Engine | Rutas estáticas personalizadas por red de VPC |
API de Compute Engine | Servicios de backend de balanceadores de carga de red de paso a través externos |
API de Compute Engine | Reglas de reenvío de balanceadores de carga de red de paso a través externos |
API de Compute Engine | Reglas de reenvío de protocolos externos |
API de Compute Engine | Reglas de cortafuegos |
API de Compute Engine | Reglas de reenvío |
API de Compute Engine | Servicios de backend gestionados externos globales |
API de Compute Engine | Reglas de reenvío externas globales gestionadas |
API de Compute Engine | Servicios backend de balanceadores de carga con proxy externo global |
API de Compute Engine | Servicios de backend de Traffic Director internos globales |
API de Compute Engine | Número de GPUs por familia de GPUs |
API de Compute Engine | GPUs (todas las regiones) |
API de Compute Engine | Comprobaciones del estado |
API de Compute Engine | Imágenes |
API de Compute Engine | Direcciones IP en uso |
API de Compute Engine | Direcciones IPv4 externas regionales en uso |
API de Compute Engine | Programaciones de capturas en uso |
API de Compute Engine | Grupos de instancias |
API de Compute Engine | Plantillas de instancia |
API de Compute Engine | Instancias por grupo de emparejamiento |
API de Compute Engine | Instancias por red de VPC |
API de Compute Engine | Direcciones IP internas |
API de Compute Engine | Servicios de backend de balanceadores de carga de red de paso a través internos |
API de Compute Engine | Reglas de reenvío de balanceadores de carga de red de paso a través internos por grupo de emparejamiento |
API de Compute Engine | Reglas de reenvío de balanceadores de carga de red de paso a través internos por red de VPC |
API de Compute Engine | Alias de IP por grupo de emparejamiento |
API de Compute Engine | Alias de IP por red de VPC |
API de Compute Engine | Disco SSD local por familia de VMs (GB) |
API de Compute Engine | CPUs M1 |
API de Compute Engine | CPUs M2 |
API de Compute Engine | CPUs M3 |
API de Compute Engine | Grupos de instancias administradas |
API de Compute Engine | CPUs N2 |
API de Compute Engine | CPUs N2D |
API de Compute Engine | Grupos de puntos finales de red |
API de Compute Engine | Políticas de cortafuegos de red |
API de Compute Engine | Atributos de reglas de políticas de seguridad de balanceo de carga de red |
API de Compute Engine | Políticas de seguridad de balanceo de carga de red |
API de Compute Engine | Redes |
API de Compute Engine | CPUs NVIDIA A2 |
API de Compute Engine | Emparejamientos por red de VPC |
API de Compute Engine | IOPS de Persistent Disk |
API de Compute Engine | Disco persistente SSD (GB) |
API de Compute Engine | Disco persistente estándar (GB) |
API de Compute Engine | CPU prioritarias |
API de Compute Engine | SSD local de instancia de VM preemptible (GB) |
API de Compute Engine | GPUs NVIDIA A100 de 80 GB interrumpibles |
API de Compute Engine | GPUs NVIDIA A100 interrumpibles |
API de Compute Engine | GPUs NVIDIA H100 interrumpibles |
API de Compute Engine | GPUs NVIDIA H100 MEGA interrumpibles |
API de Compute Engine | GPUs NVIDIA K80 interrumpibles |
API de Compute Engine | GPUs NVIDIA L4 interrumpibles |
API de Compute Engine | GPUs de estaciones de trabajo virtuales NVIDIA L4 interrumpibles |
API de Compute Engine | GPUs NVIDIA P100 interrumpibles |
API de Compute Engine | GPUs de estaciones de trabajo virtuales NVIDIA P100 interrumpibles |
API de Compute Engine | GPUs NVIDIA P4 interrumpibles |
API de Compute Engine | GPUs de estaciones de trabajo virtuales NVIDIA P4 interrumpibles |
API de Compute Engine | GPUs NVIDIA T4 interrumpibles |
API de Compute Engine | GPUs NVIDIA T4 de estaciones de trabajo virtuales interrumpibles |
API de Compute Engine | GPUs NVIDIA V100 interrumpibles |
API de Compute Engine | Prefijos públicos anunciados |
API de Compute Engine | Servicios backend gestionados externos regionales |
API de Compute Engine | Reglas de reenvío externas gestionadas regionales por región y por red de VPC |
API de Compute Engine | Plantillas de instancia regionales |
API de Compute Engine | Servicios backend internos gestionados regionales |
API de Compute Engine | Servicios backend de Traffic Director internos regionales |
API de Compute Engine | Grupos de instancias gestionados regionales |
API de Compute Engine | Políticas de seguridad regionales |
API de Compute Engine | Reglas de políticas de seguridad regionales con una condición de coincidencia avanzada |
API de Compute Engine | Proxies TCP de destino regionales |
API de Compute Engine | Routers |
API de Compute Engine | Rutas |
API de Compute Engine | Políticas de seguridad |
API de Compute Engine | Reglas de la política de seguridad |
API de Compute Engine | Reglas del lenguaje de las reglas de política de seguridad |
API de Compute Engine | Capturas |
API de Compute Engine | Certificados SSL |
API de Compute Engine | Direcciones IP estáticas de BYOIP |
API de Compute Engine | Direcciones IP estáticas |
API de Compute Engine | Intervalos de subred por grupo de emparejamiento |
API de Compute Engine | Intervalos de subred por red de VPC |
API de Compute Engine | CPUs T2A |
API de Compute Engine | CPUs T2D |
API de Compute Engine | Proxies HTTP de destino |
API de Compute Engine | Proxies HTTPS de destino |
API de Compute Engine | Proxies SSL de destino |
API de Compute Engine | Proxies TCP de destino |
API de Compute Engine | Pasarelas de VPN de destino |
API de Compute Engine | Disco SSD total local reservado (GB) |
API de Compute Engine | Mapas de URL |
API de Compute Engine | Instancias de VM |
API de Compute Engine | Pasarelas de VPN |
API de Compute Engine | Túneles VPN |
API Connect Gateway | Solicitudes de conexión de la pasarela por minuto |
API de Dialogflow | Todas las demás solicitudes por minuto |
API de Filestore | Copias de seguridad por región |
API de Filestore | Capacidad de HDD básico (estándar) (GB) por región |
API de Filestore | Capacidad de SSD básico (Premium) (GB) por región |
API de Filestore | Capacidad zonal y regional de 1 a 10 TiB (Enterprise) (GB) por región |
API de Filestore | Capacidad zonal y regional de 10 a 100 TiB (alta escala) (GB) por región |
Google Cloud API Memorystore para Redis | Capacidad total de Redis (GB) por región |
Google Cloud API Memorystore para Redis | Unidades totales de Redis Cluster por proyecto y región |
API de Memorystore | Unidades totales de Memorystore por proyecto y región |
API de Vertex AI | CPUs de servicio de modelos personalizados por región |
API de Vertex AI | Servicio de modelos personalizados con GPUs Nvidia T4 por región |
API de Vertex AI | Entrenamiento de modelos personalizados con GPUs Nvidia T4 por región |
API de Vertex AI | Solicitudes de generación de contenido por minuto, proyecto y modelo base |
API de Vertex AI | Solicitudes de predicción online regionales por minuto, proyecto y modelo base Nota: Para ver la lista completa de dimensiones disponibles, despliega esta entrada en la Google Cloud consola. |
API de Vertex AI | Solicitudes de gestión de recursos (CRUD) por minuto y región |
API de Vertex AI | Núcleos de los pods de TPU V3 para el entrenamiento de imágenes restringidas por región |
Habilitar el ajustador de cuota
Para habilitar el ajustador de cuotas, debes tener los siguientes permisos de gestión de identidades y accesos:
cloudquotas.quotas.update
cloudquotas.quotas.get
Para habilitar el ajustador de cuotas en tu proyecto de la consola, Google Cloud selecciona la pestaña correspondiente y sigue las instrucciones:
Consola
Para habilitar el ajustador de cuota en tu Google Cloud proyecto desde la Google Cloud consola, sigue estos pasos:
- En la Google Cloud consola, ve a la página IAM y administración > Cuotas y límites del sistema:
- Haz clic en la pestaña Configuraciones.
- Haz clic en el interruptor Habilitar.
Cuando en la columna Estado se indica Habilitado, el ajustador de cuotas monitoriza tu uso y envía solicitudes de ajuste de cuotas cuando el uso de recursos se acerca al valor de la cuota.
REST
Para habilitar el ajustador de cuota en tu Google Cloud proyecto con la API REST (versión preliminar), haz una solicitud HTTP para actualizar los ajustes del ajustador de cuota:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
En el cuerpo de la solicitud, especifica el recurso de configuración del ajustador de cuota y asigna el valor
ENABLED
al campoenablement
. También puedes especificar un ETag, pero no es obligatorio:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: ENABLED etag: OPTIONAL_ETAG }
Haz los cambios siguientes:
PROJECT_ID_OR_NUMBER
: el ID o el número del proyecto para el que quieres habilitar el ajustador de cuota.OPTIONAL_ETAG
: cadena ETag opcional para los ajustes del ajustador de cuota.
De esta forma, el estado de habilitación pasa a ser
enabled
.
gcloud
Para habilitar el ajustador de cuotas en tu Google Cloud proyecto con la CLI de gcloud (vista previa), sigue estos pasos:
Autentícate con la CLI de gcloud:
gcloud auth login
Habilita los ajustes del ajustador de cuotas:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
Sustituye
PROJECT_ID_OR_NUMBER
por el ID o el número del proyecto en el que quieras habilitar el ajustador de cuota.Verifica el estado de habilitación:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Siempre que tengas los permisos necesarios, se devolverá el estado
enabled
.
Ver solicitudes de ajuste de cuota
Para ver las solicitudes de ajuste de cuota, debes tener los siguientes permisos de IAM:
resourcemanager.projects.get
serviceusage.services.list
serviceusage.quotas.get
Para ver las solicitudes de ajuste de cuota emitidas por el ajustador de cuota, sigue estos pasos:
- En la Google Cloud consola, ve a la página IAM y administración > Cuotas y límites del sistema:
- Haz clic en la pestaña Aumentar solicitudes. La vista Aumentar solicitudes muestra las solicitudes de aumento de tu proyecto, tanto las que se han solicitado manualmente como las que ha emitido el ajustador de cuotas.
- Haz clic en el campo de filtro .
- Selecciona Tipo en el menú e introduce
Auto
. De esta forma, se filtran las solicitudes realizadas por el ajustador de cuotas.
Configurar alertas de ajuste de cuota
Para recibir alertas del ajustador de cuotas, sigue estos pasos:
- En la Google Cloud consola, ve a la página IAM y administración > Cuotas y límites del sistema:
- Haz clic en la pestaña Configuraciones.
- Haz clic en Crear alerta.
- Elige una o ambas plantillas de alerta:
- Todos los ajustes de Quota Adjuster: envía una alerta cada vez que Quota Adjuster emite una solicitud de ajuste de cuota para el proyecto.
- Errores y fallos del ajustador de cuotas: envía alertas solo cuando el ajustador de cuotas intenta aumentar el valor de una cuota y no puede hacerlo.
- Opcional: Ajusta los valores predeterminados de la cantidad mínima de tiempo entre alertas y la duración del cierre automático de incidentes haciendo clic en Mostrar opciones.
- Selecciona el canal de notificaciones para recibir alertas. Para ajustar la configuración de un canal de notificaciones o crear uno nuevo, haz clic en Gestionar canales de notificaciones.
- Haz clic en Crear.
Editar o eliminar alertas de ajuste de cuota
Puedes editar o eliminar alertas de ajuste de cuota en la Google Cloud consola:
Ve a la página Políticas de la consola de Cloud Monitoring.
Busca tu política de alertas de ajuste de cuota. Las políticas de alertas de ajuste de cuota tienen los siguientes nombres:
Quota adjuster errors and failures
All adjustments by quota adjuster
En la fila que muestra la política de alertas del ajuste de cuota, haz clic en
Ver más.Haz clic en Editar o en Eliminar.
Inhabilitar el ajustador de cuota
Para inhabilitar el ajustador de cuotas, debes tener los siguientes permisos de gestión de identidades y accesos:
cloudquotas.quotas.update
cloudquotas.quotas.get
Para inhabilitar el ajustador de cuota en tu Google Cloud proyecto de consola, selecciona la pestaña correspondiente y sigue las instrucciones:
Consola
- En la Google Cloud consola, ve a la página IAM y administración > Cuotas y límites del sistema:
- Haz clic en la pestaña Configuraciones.
- Haz clic en el interruptor Habilitar. El interruptor se vuelve gris.
Cuando el interruptor está en gris y en la columna de estado se indica No habilitado, el ajustador de cuotas deja de monitorizar tu uso o de enviar solicitudes de ajuste de cuotas.
REST
Para inhabilitar el ajustador de cuota en tu Google Cloud proyecto con la API REST (versión preliminar), haz una solicitud HTTP para actualizar la configuración del ajustador de cuota:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
En el cuerpo de la solicitud, especifica el recurso de configuración del ajustador de cuota y asigna el valor
DISABLED
al campoenablement
. También puedes especificar un ETag, pero no es obligatorio:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: DISABLED etag: OPTIONAL_ETAG }
Haz los cambios siguientes:
PROJECT_ID_OR_NUMBER
: el ID o el número del proyecto para el que quieres inhabilitar el ajustador de cuota.OPTIONAL_ETAG
: cadena ETag opcional para los ajustes del ajustador de cuota.
De esta forma, el estado de habilitación pasa a ser
disabled
.
gcloud
Para inhabilitar el ajustador de cuota en tu Google Cloud proyecto con la CLI de gcloud (vista previa), sigue estos pasos:
Autentícate en gcloud CLI:
gcloud auth login
Inhabilita los ajustes del ajustador de cuotas:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
Sustituye
PROJECT_ID_OR_NUMBER
por el ID o el número del proyecto en el que quieras inhabilitar el ajustador de cuota.Verifica el estado de habilitación:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Siempre que tengas los permisos necesarios, se devolverá el estado
disabled
.
Solucionar problemas de denegación de aumento de cuota
Es posible que se deniegue un aumento de cuota iniciado por el ajustador de cuota. Esto ocurre a veces cuando Google Cloud no puede aumentar la cuota de un proyecto, un recurso o una región concretos más allá de un valor determinado. En estos casos, puede solicitar un aumento de cuota manual.
Para recibir notificaciones cuando se deniegue una solicitud de ajuste de cuota realizada por el ajustador de cuota, configura alertas de ajustador de cuota.