Informazioni sulle decisioni del gestore della scalabilità automatica


La scalabilità automatica aggiunge automaticamente VM (scalabilità orizzontale) o rimuove VM (scalabilità verticale) dal gruppo di istanze gestite (MIG). Questo documento spiega in che modo un gestore della scalabilità automatica determina quando scalare i gruppi di istanze gestite.

Quando configuri un gestore della scalabilità automatica per un gruppo di istanze gestite, questo monitora costantemente il gruppo e imposta le dimensioni consigliate del gruppo in base al numero di istanze di macchine virtuali (VM) necessarie per gestire il carico di picco durante il periodo di stabilizzazione.

La dimensione consigliata è limitata dal numero minimo e massimo di istanze impostato nel criterio di scalabilità automatica.

Se il criterio di scalabilità automatica include controlli di scalabilità verso il basso, la dimensione consigliata è ulteriormente limitata dai controlli di scalabilità verso il basso.

Se attivi la scalabilità automatica predittiva, il gestore della scalabilità automatica utilizza i pattern di utilizzo della CPU storici per prevedere il carico futuro e imposta le dimensioni consigliate del gruppo in base alla previsione.

La risposta del gruppo di istanze gestite alle dimensioni consigliate del gestore della scalabilità automatica dipende da come viene configurato mode del gestore della scalabilità automatica:

  • ON. Il gruppo di istanze gestite imposta la dimensione target su quella consigliata, quindi Compute Engine esegue la scalabilità automatica del gruppo di istanze gestite per raggiungere la dimensione target.
  • ONLY_SCALE_OUT. Le dimensioni target del MIG possono essere aumentate solo in risposta a un aumento delle dimensioni consigliate.
  • OFF. Le dimensioni target non sono interessate dalle dimensioni consigliate. Tuttavia, la dimensione consigliata viene comunque calcolata.

Se la configurazione del gestore della scalabilità automatica viene eliminata, non viene calcolata alcuna dimensione consigliata.

Differenze tra le metriche di utilizzo target e quelle effettive

Quando utilizzi un criterio di scalabilità automatica con indicatori basati su metriche, potresti notare che, per i gruppi di istanze più piccoli, l'utilizzo effettivo del gruppo di istanze e l'utilizzo target potrebbero sembrare molto distanti. Questo accade perché un gestore della scalabilità automatica agisce sempre in modo conservativo arrotondando per eccesso o per difetto quando interpreta i dati sull'utilizzo e determina quante istanze aggiungere o rimuovere. In questo modo, l'autoscalabilità non aggiunge un numero insufficiente di risorse o ne rimuove troppe.

Ad esempio, se imposti un target di utilizzo pari a 0,7 e la tua applicazione supera il target di utilizzo, il gestore della scalabilità automatica potrebbe stabilire che l'aggiunta di 1,5 istanze di macchine virtuali (VM) ridurrebbe l'utilizzo a un valore vicino a 0,7. Poiché non puoi aggiungere 1,5 istanze VM, il gestore della scalabilità automatica arrotonda per eccesso e aggiunge due istanze. In questo modo, l'utilizzo medio della CPU potrebbe diminuire a un valore inferiore a 0,7, ma la tua app avrà risorse sufficienti per supportarlo.

Analogamente, se il gestore della scalabilità automatica determina che la rimozione di 1,5 istanze VM aumenterebbe l'utilizzo troppo vicino a 0,7, rimuoverà solo un'istanza.

Per i gruppi più grandi con più istanze VM, l'utilizzo viene suddiviso su un numero maggiore di istanze e l'aggiunta o la rimozione di istanze VM comporta un minore divario tra l'utilizzo effettivo e l'utilizzo target.

Se utilizzi la scalabilità automatica basata su pianificazione con un altro indicatore di scalabilità automatica, una pianificazione attiva potrebbe richiedere più VM del necessario per l'utilizzo. In queste situazioni, l'utilizzo effettivo è inferiore all'utilizzo target perché la pianificazione della scalabilità automatica determina la dimensione consigliata del gruppo di istanze.

Ritardi nello scale out

Quando configuri la scalabilità automatica, specifichi un periodo di inizializzazione che riflette il tempo necessario per l'inizializzazione delle VM. Lo strumento di scalabilità automatica consiglia di eseguire l'espansione solo se l'utilizzo medio delle istanze che non vengono inizializzate è superiore all'utilizzo target.

Se imposti un valore del periodo di inizializzazione molto più lungo del tempo necessario per l'inizializzazione di un'istanza, il gestore della scalabilità automatica potrebbe ignorare i dati di utilizzo legittimi e sottostimare le dimensioni richieste del gruppo.

Ritardi nell'aumento della scala

Ai fini dello scale in, lo strumento di scalabilità automatica calcola la dimensione target consigliata del gruppo in base al carico di picco negli ultimi 10 minuti o nel periodo di inizializzazione impostato, a seconda del periodo più lungo. Questa durata è indicata come periodo di stabilizzazione.

L'osservazione dell'utilizzo durante il periodo di stabilizzazione aiuta il gestore della scalabilità automatica a:

  • Assicurati che le informazioni sull'utilizzo raccolte dal gruppo di istanze siano stabili.
  • Impedire il comportamento in cui un regolatore della scalabilità aggiunge o rimuove continuamente istanze a un ritmo eccessivo.
  • Rimuovi le istanze in sicurezza determinando che il numero inferiore di istanze è sufficiente per supportare il picco di carico del periodo di stabilizzazione.
  • Se l'inizializzazione dell'applicazione su una nuova VM richiede più di 10 minuti, il gruppo utilizza il periodo di inizializzazione come periodo di stabilizzazione. In questo modo, la decisione di eliminare la VM da parte dell'autoscalabilità tiene conto del tempo necessario per recuperare la capacità di pubblicazione.

Il periodo di stabilizzazione potrebbe sembrare un ritardo nel ridimensionamento, ma in realtà è una funzionalità integrata della scalabilità automatica. Il periodo di stabilizzazione garantisce inoltre che, se viene aggiunta una nuova istanza al gruppo di istanze gestite, l'istanza completi il periodo di inizializzazione o venga eseguita per almeno 10 minuti prima di poter essere eliminata.

I periodi di inizializzazione per le nuove istanze vengono ignorati quando si decide se eseguire lo fare lo scale in un gruppo.

Lo svuotamento della connessione causa ritardi

Se il gruppo fa parte di un servizio di backend che ha attivato lo svuotamento della connessione, possono essere necessari fino a 60 secondi in più dopo la durata dello svuotamento della connessione prima che l'istanza VM venga rimossa o eliminata.

Controlli di scale in

Quando configuri i controlli di scalabilità verso il basso del gestore della scalabilità automatica, controlla la velocità della scalabilità verso il basso. Lo strumento di scalabilità automatica non esegue mai lo scale up più rapidamente della frequenza configurata:

Gestore della scalabilità automatica con e senza controlli di scale in.

  1. Quando il carico diminuisce, il gestore della scalabilità automatica mantiene le dimensioni del gruppo a un livello necessario per soddisfare il picco di carico osservato nel (periodo di stabilizzazione). Funziona allo stesso modo con e senza controlli di scalabilità.
  2. Un gestore della scalabilità automatica senza controlli di riduzione mantiene solo le istanze necessarie per gestire il carico osservato di recente. Al termine del periodo di stabilizzazione, il lo strumento di scalabilità automatica rimuove tutte le istanze non necessarie in un solo passaggio. Un improvviso calo del carico può comportare una drastica riduzione delle dimensioni del gruppo di istanze.
  3. Un gestore della scalabilità automatica con controlli di riduzione della scalabilità limita il numero di istanze VM che possono essere rimuovere in un periodo di tempo configurato (in questo caso 10 VM in 20 minuti). Ciò rallenta il tasso di riduzione delle istanze.
  4. Con un nuovo picco di carico, lo strumento di scalabilità automatica aggiunge nuove istanze per gestire il carico. Tuttavia, a causa di un lungo tempo di inizializzazione, le nuove VM non sono pronte per gestire il carico. Con i controlli di ridimensionamento verso l'interno, la capacità precedente è stata mantenuta, consentendo alle VM esistenti di gestire il picco.

Puoi controllare la frequenza di riduzione configurando la riduzione massima consentita del gestore della scalabilità automatica in un periodo di tempo successivo, nello specifico:

  • Riduzione massima consentita (maxScaledInReplicas: numero o percentuale di istanze VM). Il numero di istanze che il tuo carico di lavoro può permettersi di perdere (dalle dimensioni massime del gruppo) nell'intervallo di tempo successivo specificato. Utilizza questo parametro per limitare la scalabilità del gruppo in modo da poter gestire un probabile picco di carico finché non vengono avviate altre istanze. Quanto più ridotta è la riduzione massima consentita, più lento sarà il tasso di aumento.
  • Finestra temporale finale (timeWindowSec: secondi). Periodo di tempo durante il quale è probabile che un picco di carico segua un calo temporaneo e durante il quale non vuoi che le dimensioni del gruppo vengano ridotte oltre la riduzione massima consentita. Utilizza questo parametro per definire la finestra temporale in cui il ridimensionamento automatico cercherà le dimensioni di picco sufficienti per gestire il carico storico. Il ridimensionamento automatico non verrà eseguito al di sotto della riduzione massima consentita meno la dimensione massima osservata nell'intervallo di tempo successivo. Con un periodo di tempo più lungo, il gestore della scalabilità automatica prende in considerazione un carico di picco storico più elevato, il che rende la scalabilità più conservativa e stabile.

Quando imposti i controlli di scalabilità verso il basso, il gestore della scalabilità automatica limita le operazioni di scalabilità verso il basso alla riduzione massima consentita rispetto alle dimensioni di picco osservate nella finestra temporale precedente. Il gestore della scalabilità automatica utilizza i seguenti passaggi:

  1. Monitora costantemente la dimensione del picco storico osservato nella finestra temporale precedente.
  2. Utilizza la riduzione massima consentita per calcolare le dimensioni della scalabilità vincolata (dimensioni di picco: maxScaledInReplicas)
  3. Imposta la dimensione consigliata del gruppo sulle dimensioni di scalabilità in basso limitate. Ad esempio, se un gestore della scalabilità automatica ridimensiona un gruppo di istanze in modo da avere 20 VM, ma i vincoli di scalabilità in consentono solo di fare lo scale in a 40 VM, la dimensione consigliata è impostata su 40 VM.

Con i controlli di scalabilità verso il basso, il gestore della scalabilità automatica monitora continuamente le dimensioni di picco di un gruppo di istanze all'interno della finestra temporale finale configurata per identificare le dimensioni sufficienti per soddisfare il carico storico. Il gestore della scalabilità automatica non esegue fare lo scale in oltre la riduzione massima consentita misurata in base alle dimensioni del picco osservate:

Gestore della scalabilità automatica con controlli di scale in.

Ad esempio, nel diagramma sopra, i controlli di scalabilità in diminuzione sono configurati per una riduzione massima consentita di 20 VM in un intervallo di tempo successivo di 30 minuti:

  1. Quando il carico diminuisce, il gestore della scalabilità automatica rimuove 20 VM, ovvero la riduzione massima consentita configurata nei controlli di scale-in.
  2. Man mano che il carico aumenta e diminuisce, lo strumento di scalabilità automatica monitora costantemente l'intervallo di tempo degli ultimi 30 minuti per rilevare le dimensioni del picco sufficienti per gestire il carico storico. Questa dimensione di picco viene utilizzata come base per i controlli di scalabilità in calo per limitare la frequenza di scalabilità in calo. Se negli ultimi 30 minuti la dimensione di picco era di 70 VM e la riduzione massima consentita è impostata su 20 VM, il gestore della scalabilità automatica può fare lo scale in il basso fino a 50 VM. Se la dimensione attuale è di 65 VM, il lo strumento di scalabilità automatica può rimuovere solo 15 VM.
  3. Quando il carico diminuisce, il gestore della scalabilità automatica continua a rimuovere le istanze VM, ma limita la frequenza a un massimo di 20 VM rispetto alla dimensione massima del gruppo di istanze misurata negli ultimi 30 minuti.

La riduzione massima consentita del gruppo potrebbe avvenire contemporaneamente, quindi devi configurare la riduzione massima consentita in modo che la tua applicazione possa permettersi di perdere così tante istanze contemporaneamente. Utilizza il parametro di riduzione massima consentita per indicare la quantità di riduzione della capacità di pubblicazione che la tua applicazione può tollerare.

Se limiti il numero di istanze VM che la scalabilità automatica può rimuovere e aumenti la finestra temporale finale osservata, la disponibilità delle applicazioni con picchi di carico e tempi di inizializzazione lunghi dovrebbe migliorare. In particolare, la dimensione del gruppo di istanze non cala bruscamente in risposta a un calo significativo del carico, ma diminuisce gradualmente nel tempo. Se i picchi di carico si verificano subito dopo una fare lo scale in, il numero rimanente di VM dovrebbe essere ancora in grado di assorbire il picco entro i limiti di tolleranza. Inoltre, è necessario avviare meno VM per gestire adeguatamente il picco.

Puoi configurare i controlli di riduzione della scala per la scalabilità automatica sia dei MIG zonali sia di quelli regionali. La configurazione è la stessa per entrambi i casi. I controlli di scalata rientrano per qualsiasi dimensione del gruppo.

Controlli di scale in rispetto alla stabilizzazione del gestore della scalabilità automatica

La configurazione dei controlli di riduzione non comporta la disattivazione del meccanismo di stabilizzazione integrato dell'autoscalabilità. Il gestore della scalabilità automatica mantiene sempre le dimensioni del gruppo di istanze a un livello necessario per gestire il carico di picco, osservato durante il periodo di stabilizzazione. I controlli di scalabilità verso il basso ti offrono un ulteriore meccanismo per controllare la frequenza con cui viene ridimensionato un gruppo di istanze.

Autoscaler integrato:
Periodo di stabilizzazione
Controlli di scala in:
Finestra temporale finale
È configurabile? No, non configurabile Sì, configurabile
Che cosa viene monitorato? Monitora il carico di picco negli ultimi 10 minuti o nel periodo di inizializzazione, a seconda del periodo più lungo. Monitora la dimensione massima del gruppo di istanze nel periodo precedente impostato in base alla finestra temporale finale
In che modo può essere utile? Garantisce che le dimensioni del gruppo di istanze rimangano sufficienti per gestire il picco di carica osservato negli ultimi 10 minuti o nel periodo di inizializzazione, a seconda del periodo più lungo. Garantisce che le dimensioni del gruppo di istanze non vengano ridotte di più istanze VM di quante il tuo carico di lavoro possa tollerare durante la gestione dei picchi di carico in un determinato periodo di tempo.

Controlli di scale in con la modalità di scalabilità automatica

Esistono due scenari simili, ma leggermente diversi, quando il MIG non è sottoposto a ridimensionamento automatico e vuoi attivare questa funzionalità. Dipendono dal fatto che configuri la scalabilità automatica per la prima volta o che la scalabilità automatica sia configurata, ma temporaneamente limitata o disattivata.

Configurare l'autoscaler per la prima volta

Quando hai un gruppo di istanze gestite non sottoposto a scalabilità automatica e configuri la scalabilità automatica da zero, il gestore della scalabilità automatica utilizza le dimensioni correnti del gruppo di istanze gestite come punto di partenza. Prima di eseguire lo scale in, il gestore della scalabilità automatica utilizza il periodo di stabilizzazione e poi i controlli di scalabilità automatica per limitare la frequenza di scalabilità automatica:

Configurazione dell'autoscaler per la prima volta.

Modificare la modalità del gestore della scalabilità automatica

Con la modalità di scalabilità automatica, puoi disattivare o limitare temporaneamente le attività di scalabilità automatica. La configurazione del gestore della scalabilità automatica persiste e il gestore continua a eseguire calcoli in background quando è disattivato o limitato. Il modulo di scalabilità automatica prende in considerazione i controlli di riduzione della scalabilità nei calcoli in background in modalità off o con restrizioni. Tutte le attività di scalabilità automatica riprendono utilizzando i calcoli più recenti quando riattivi la scalabilità automatica o quando sollevi la limitazione:

Riavviare il gestore della scalabilità automatica, inclusi i controlli di scale in.

  1. Se il gestore della scalabilità automatica è attivo, si comporta come al solito (in questo caso con i controlli di scale in).
  2. Quando disattivi il ridimensionamento automatico, questo calcola comunque la dimensione consigliata del gruppo di istanze in base al carico. I calcoli del gestore della scalabilità automatica prendono comunque in considerazione i controlli di scalabilità automatica. Tuttavia, il gestore della scalabilità automatica non applica i calcoli delle dimensioni quando è OFF. Le dimensioni del gruppo di istanze rimangono costanti finché il gestore della scalabilità automatica non viene riattivato.
  3. Quando riattivi lo scalare automatico, vengono applicate immediatamente le dimensioni calcolate in precedenza. In questo modo, puoi scalare più rapidamente alle dimensioni corrette. La riattivazione del gestore della scalabilità automatica può causare uno fare lo scale in improvviso (in questo caso da 80 a 40 istanze VM). Questo è sicuro perché i calcoli in background prendono già in considerazione i controlli di scalabilità.

Scalabilità automatica predittiva

Per scoprire di più sulla scalabilità automatica predittiva, incluso come funziona, consulta Scalabilità basata sulle previsioni.

Preparazione all'arresto delle istanze

Quando il gestore della scalabilità automatica riduce le dimensioni, determina il numero di istanze VM da eliminare. Lo strumento di ridimensionamento dà la priorità alle istanze VM da eliminare in base a diversi fattori, tra cui:

  • VM non in esecuzione per qualsiasi motivo.
  • VM in cui sono in corso o sono pianificate modifiche che causano interruzioni, ad esempio aggiornamenti, riavvii o sostituzioni.
  • VM non ancora aggiornate alla versione prevista del modello di istanza.
  • VM con l'indicatore di scalabilità automatica più basso. Ad esempio, se configuri il gruppo di istanze gestite (MIG) in modo che la scalabilità sia basata sull'utilizzo della CPU e il gruppo deve eseguire lo scale down, il gestore della scalabilità automatica tenta di rimuovere le VM con l'utilizzo della CPU più basso.

Prima di interrompere un'istanza, ti consigliamo di assicurarti che queste esekuiscano determinate attività, ad esempio la chiusura di eventuali connessioni esistenti, l'arresto graduale di app o server app, il caricamento dei log e così via. Puoi instruire l'istanza a eseguire queste attività utilizzando un script di arresto. Uno script di arresto viene eseguito su base best effort nel breve periodo di tempo tra la richiesta di arresto e l'arresto effettivo dell'istanza. Durante questo periodo, Compute Engine tenta di eseguire lo script di arresto per svolgere eventuali attività specificate nello script.

Questa opzione è particolarmente utile se utilizzi il bilanciamento del carico con il gruppo di istanze gestite. Se l'istanza non è più in stato di integrità, potrebbe essere necessario del tempo prima che il bilanciatore del carico lo riconosca e continui a inviare nuove richieste all'istanza. Con uno script di arresto, l'istanza può segnalare che non è in stato di salute durante l'arresto in modo che il bilanciatore del carico possa interrompere l'invio di traffico all'istanza. Per ulteriori informazioni sui controlli di integrità del bilanciamento del carico, consulta la panoramica dei controlli di integrità.

Per ulteriori informazioni sugli script di arresto, consulta Script di arresto.

Per saperne di più sull'arresto delle istanze, consulta la documentazione sull'arresto o sull'eliminazione di un'istanza.

Monitoraggio di grafici e log della scalabilità automatica

Compute Engine fornisce diversi grafici e log che ti consentono di monitorare il comportamento del gruppo di istanze gestite in qualsiasi momento.

Puoi accedere ai grafici e ai log nella console Google Cloud.

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome del gruppo di istanze gestite che vuoi visualizzare.
  3. Nella pagina del gruppo di istanze gestite, seleziona la scheda Monitoraggio.

I grafici di monitoraggio mostrano l'evoluzione delle seguenti metriche:

  • Dimensione gruppo
  • Utilizzo della scalabilità automatica
  • Utilizzo CPU
  • I/O disco (byte)
  • I/O disco (operazioni)
  • Byte di rete
  • Pacchetti di rete

Una descrizione comando accanto al titolo di ogni grafico fornisce dettagli aggiuntivi contestuali sulla metrica visualizzata.

Nella parte inferiore della pagina è disponibile un riquadro Log, in cui puoi trovare un elenco di log eventi per il gruppo di istanze gestite. Per visualizzare i log, fai clic sulla freccia di espansione.

Tutti i grafici e i log sono associati a un unico periodo di tempo che puoi personalizzare con il selettore dell'intervallo di tempo. Facendo clic e trascinando su un grafico, puoi aumentare lo zoom su un determinato evento e analizzare i grafici e i log nell'intervallo di tempo selezionato.

Monitoraggio della scalabilità automatica predittiva

Compute Engine fornisce un grafico per monitorare le previsioni dell'autoscalabilità. Per visualizzare questo grafico, fai clic sul titolo Dimensione gruppo nel primo grafico e seleziona Scalabilità automatica predittiva.

Se la scalabilità automatica è attivata, puoi visualizzare in che modo le previsioni del gestore della scalabilità automatica determinano le dimensioni del gruppo di istanze. Se la scalabilità automatica non è attivata, puoi comunque visualizzare le previsioni del gestore della scalabilità automatica e usarle per prendere decisioni in merito alle dimensioni del gruppo.

Utilizza le seguenti informazioni per comprendere questo grafico.

  • La linea blu indica il numero di istanze nel gruppo di istanze gestite.
  • La linea verde mostra il numero di istanze previste dal gestore della scalabilità automatica.
    • Se la linea verde è sotto la linea blu, è disponibile una grande quantità di capacità e le tue istanze VM sono probabilmente sottoutilizzate.
    • Se la linea verde è sopra la linea blu, la capacità rimanente è scarsa o inesistente e devi aggiungere altre istanze al gruppo di istanze.
  • Le linee rosse orizzontali tratteggiate indicano il numero minimo e massimo di istanze consentite nel gruppo di istanze.

Visualizzazione dei messaggi di stato

Quando lo scalatore automatico riscontra un problema di scalabilità, restituisce un messaggio di avviso o di errore. Puoi esaminare questi messaggi di stato in due modi.

Visualizzare i messaggi di stato nella pagina Gruppi di istanze

Puoi visualizzare i messaggi di stato direttamente nella pagina Gruppi di istanze della console Google Cloud.

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Cerca eventuali gruppi di istanze con l'icona di avviso che precede i relativi nomi.

    Ad esempio:

    Messaggi di stato nella pagina Gruppi di istanze.

  3. Tieni premuto il cursore sopra un'icona di stato per visualizzare i dettagli del messaggio di stato.

Visualizzare i messaggi di stato nella pagina Panoramica del gruppo di istanze

Puoi andare direttamente alla pagina di riepilogo di un gruppo di istanze specifico per visualizzare i messaggi di stato pertinenti.

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul gruppo di istanze per cui vuoi visualizzare i messaggi di stato.
  3. Nella pagina del gruppo di istanze, visualizza il messaggio di stato sotto il nome del gruppo di istanze.

Messaggi di stato restituiti di frequente

Quando lo scalatore automatico riscontra un problema di scalabilità, restituisce un messaggio di avviso o di errore. Di seguito sono riportati alcuni messaggi restituiti di frequente e il loro significato.

All instances in the instance group are unhealthy (not in RUNNING state). If this is an error, check the instances.
Tutte le istanze del gruppo di istanze hanno uno stato diverso da RUNNING. Se si tratta di un'azione intenzionale, puoi ignorare questo messaggio. Se questa è una scelta non intenzionale, risolvi il problema del gruppo di istanze.
The number of instances has reached the maxNumReplicas. The autoscaler cannot add more instances.
Quando hai creato il gestore della scalabilità automatica, hai indicato il numero massimo di istanze che il gruppo di istanze può avere. Al momento il gestore della scalabilità automatica sta tentando di eseguire il ridimensionamento orizzontale del gruppo di istanze per soddisfare la domanda, ma ha raggiunto il valore maxNumReplicas. Per informazioni su come aggiornare maxNumReplicas a un numero maggiore, consulta Aggiornare un gestore della scalabilità automatica.
The monitoring metric that was specified does not exist or does not have the required labels. Check the metric.

Stai utilizzando la scalabilità automatica con una metrica di Cloud Monitoring, ma la metrica che hai fornito non esiste, non dispone delle etichette necessarie o non è accessibile all'agente di servizio Compute Engine.

Quota for some resources is exceeded. Increase the quota or delete resources to free up more quota.

Puoi ottenere informazioni sulla quota disponibile nella pagina Quota in Google Cloud Console.

Autoscaling does not work with an HTTP/S load balancer configured for maxRate.

Il gruppo di istanze viene bilanciato in base al carico utilizzando la configurazione maxRate, ma il gestore della scalabilità automatica non supporta questa modalità. Modifica la configurazione o disattiva la scalabilità automatica. Per scoprire di più su maxRate, leggi la sezione Limitazioni e linee guida della documentazione sul bilanciamento del carico.

The autoscaler is configured to scale based on a load balancing signal but the instance group has not received any queries from the load balancer. Check that the load balancing configuration is working.

Il gruppo di istanze è sottoposto a bilanciamento del carico, ma non riceve query. Il servizio potrebbe essere inattivo, ma non c'è da preoccuparsi. Tuttavia, questo messaggio può essere causato anche da una configurazione errata. Ad esempio, un gruppo di istanze con scalabilità automatica potrebbe essere il target di più bilanciatori del carico, il che non è supportato. Per un elenco completo delle linee guida, consulta Limitazioni e linee guida nella documentazione sul bilanciamento del carico.