Questa pagina è stata tradotta dall'API Cloud Translation.

Informazioni sulle decisioni del gestore della scalabilità automatica

La scalabilità automatica aggiunge automaticamente VM al (scale out) o rimuove VM (scale in) dal gruppo di istanze gestite (MIG). Questo documento spiega in che modo un gestore della scalabilità automatica determina quando scalare i MIG.

In che modo i gestori della scalabilità automatica calcolano le dimensioni consigliate e influiscono sulle dimensioni target

Quando configuri un gestore della scalabilità automatica per un MIG, questo monitora costantemente il gruppo e imposta le dimensioni consigliate del gruppo in base al numero di istanze di macchine virtuali (VM) necessarie per gestire il carico di picco durante il periodo di stabilizzazione.

La dimensione consigliata è limitata dal numero minimo e massimo di istanze impostato nella policy di scalabilità automatica.

Se la policy di scalabilità automatica include controlli di scale in, la dimensione consigliata è ulteriormente limitata dai controlli di scale in.

Se attivi la scalabilità automatica predittiva, il gestore della scalabilità automatica utilizza i pattern di utilizzo della CPU storici per prevedere il carico futuro e imposta le dimensioni consigliate del gruppo in base alla previsione.

La risposta del MIG alle dimensioni consigliate del gestore della scalabilità automatica dipende da come configuri mode del gestore della scalabilità automatica:

ON. Il MIG imposta la dimensione target su quella consigliata, quindi Compute Engine esegue la scalabilità automatica del MIG per raggiungere la dimensione target.
ONLY_SCALE_OUT. Le dimensioni target del MIG possono essere aumentate solo in risposta a un aumento delle dimensioni consigliate.
OFF. Le dimensioni target non sono interessate dalle dimensioni consigliate. Tuttavia, la dimensione consigliata viene comunque calcolata.

Se la configurazione del gestore della scalabilità automatica viene eliminata, non viene calcolata alcuna dimensione consigliata.

Differenze tra le metriche di utilizzo target e quelle effettive

Quando utilizzi una policy di scalabilità automatica con indicatori basati su metriche, potresti notare che, per i gruppi di istanze più piccoli, l'utilizzo effettivo del gruppo di istanze e l'utilizzo target potrebbero sembrare molto distanti. Questo accade perché un gestore della scalabilità automatica agisce sempre in modo conservativo arrotondando per eccesso o per difetto quando interpreta i dati sull'utilizzo e determina quante istanze aggiungere o rimuovere. In questo modo, il gestore della scalabilità automatica non aggiunge un numero insufficiente di risorse o ne rimuove troppe.

Ad esempio, se imposti un target di utilizzo pari a 0,7 e la tua applicazione supera il target di utilizzo, il gestore della scalabilità automatica potrebbe stabilire che l'aggiunta di 1,5 istanze di macchine virtuali (VM) ridurrebbe l'utilizzo a un valore vicino a 0,7. Poiché non puoi aggiungere 1,5 istanze VM, il gestore della scalabilità automatica arrotonda per eccesso e aggiunge due istanze. In questo modo, l'utilizzo medio della CPU potrebbe diminuire a un valore inferiore a 0,7, ma l'app avrà risorse sufficienti per supportarlo.

Analogamente, se il gestore della scalabilità automatica determina che la rimozione di 1,5 istanze VM aumenterebbe l'utilizzo troppo vicino a 0,7, rimuoverà solo un'istanza.

Per i gruppi più grandi con più istanze VM, l'utilizzo viene suddiviso su un numero maggiore di istanze e l'aggiunta o la rimozione di istanze VM comporta un minore divario tra l'utilizzo effettivo e l'utilizzo target.

Se utilizzi la scalabilità automatica basata su pianificazione con un altro indicatore di scalabilità automatica, una pianificazione attiva potrebbe richiedere più VM del necessario per l'utilizzo. In queste situazioni, l'utilizzo effettivo è inferiore all'utilizzo target perché la pianificazione della scalabilità automatica determina la dimensione consigliata del gruppo di istanze.

Ritardi nello scale out

Quando configuri la scalabilità automatica, specifichi un periodo di inizializzazione che riflette il tempo necessario per l'inizializzazione delle VM. Il gestore della scalabilità automatica consiglia di eseguire l'espansione solo se l'utilizzo medio delle istanze che non vengono inizializzate è superiore all'utilizzo target.

Se imposti un valore del periodo di inizializzazione molto più lungo del tempo necessario per l'inizializzazione di un'istanza, il gestore della scalabilità automatica potrebbe ignorare i dati di utilizzo legittimi e sottostimare le dimensioni richieste del gruppo.

Ritardi nello scale in

Ai fini dello scale in, il gestore della scalabilità automatica calcola la dimensione target consigliata del gruppo in base al carico di picco negli ultimi 10 minuti o nel periodo di inizializzazione impostato, a seconda del periodo più lungo. Questa durata è indicata come periodo di stabilizzazione.

L'osservazione dell'utilizzo durante il periodo di stabilizzazione aiuta il gestore della scalabilità automatica a:

Assicurarsi che le informazioni sull'utilizzo raccolte dal gruppo di istanze siano stabili.
Impedire il comportamento in cui un gestore della scalabilità automatica aggiunge o rimuove continuamente istanze a un ritmo eccessivo.
Rimuovere le istanze in sicurezza determinando che il numero inferiore di istanze è sufficiente per supportare il picco di carico del periodo di stabilizzazione.
Se l'inizializzazione dell'applicazione su una nuova VM richiede più di 10 minuti, il gruppo utilizza il periodo di inizializzazione come periodo di stabilizzazione. In questo modo, la decisione di eliminare la VM da parte del gestore della scalabilità automatica tiene conto del tempo necessario per recuperare la capacità di pubblicazione.

Il periodo di stabilizzazione potrebbe sembrare un ritardo nello scale in, ma in realtà è una funzionalità integrata della scalabilità automatica. Il periodo di stabilizzazione garantisce inoltre che, se viene aggiunta una nuova istanza al gruppo di istanze gestite, l'istanza completi il periodo di inizializzazione o venga eseguita per almeno 10 minuti prima di poter essere eliminata.

I periodi di inizializzazione per le nuove istanze vengono ignorati quando si decide se fare lo scale in di un gruppo.

Lo svuotamento della connessione causa ritardi

Se il gruppo fa parte di un servizio di backend che ha attivato lo svuotamento della connessione, possono essere necessari fino a 60 secondi in più dal termine dello svuotamento della connessione prima che l'istanza VM venga rimossa o eliminata.

Controlli di scale in

Quando configuri i controlli di scale in del gestore della scalabilità automatica, controlla la velocità dello scale in. Il gestore della scalabilità automatica non fa mai lo scale in a una velocità maggiore rispetto a quella configurata:

Gestore della scalabilità automatica con e senza controlli di scale in.

Quando il carico diminuisce, il gestore della scalabilità automatica mantiene le dimensioni del gruppo a un livello necessario per soddisfare il picco di carico osservato nel (periodo di stabilizzazione). Funziona allo stesso modo con e senza controlli di scale in.
Un gestore della scalabilità automatica senza controlli di scale in mantiene solo le istanze necessarie per gestire il carico osservato di recente. Al termine del periodo di stabilizzazione, il gestore della scalabilità automatica rimuove tutte le istanze non necessarie in un solo passaggio. Un improvviso calo del carico può comportare una drastica riduzione delle dimensioni del gruppo di istanze.
Un gestore della scalabilità automatica con controlli di scale in limita il numero di istanze VM che possono essere rimosse in un periodo di tempo configurato (in questo caso 10 VM in 20 minuti). Ciò rallenta il tasso di riduzione delle istanze.
Con un nuovo picco di carico, il gestore della scalabilità automatica aggiunge nuove istanze per gestire il carico. Tuttavia, a causa di un lungo tempo di inizializzazione, le nuove VM non sono pronte a gestire il carico. Con i controlli di scale in, la capacità precedente è stata mantenuta, consentendo alle VM esistenti di gestire il picco.

Puoi controllare la frequenza di scale in configurando la riduzione massima consentita del gestore della scalabilità automatica in un periodo di tempo successivo, nello specifico:

Riduzione massima consentita (maxScaledInReplicas: numero o percentuale di istanze VM). Il numero di istanze che il tuo workload può permettersi di perdere (dalle dimensioni massime del gruppo) nell'intervallo di tempo successivo specificato. Utilizza questo parametro per limitare lo scale in del gruppo in modo da poter gestire un probabile picco di carico finché non vengono avviate altre istanze. Quanto più ridotta è la riduzione massima consentita, più lento sarà lo scale in.
Finestra temporale finale (timeWindowSec: secondi). Periodo di tempo durante il quale è probabile che un picco di carico segua un calo temporaneo e durante il quale non vuoi che venga fatto uno scale in delle dimensioni del gruppo oltre la riduzione massima consentita. Utilizza questo parametro per definire la finestra temporale in cui il gestore della scalabilità automatica cercherà le dimensioni di picco sufficienti per gestire il carico storico. Il gestore della scalabilità automatica non verrà ridimensionato al di sotto della riduzione massima consentita meno la dimensione massima osservata nell'intervallo di tempo successivo. Con un periodo di tempo più lungo, il gestore della scalabilità automatica prende in considerazione un carico di picco storico più elevato, il che rende lo scale in più conservativo e stabile.

Quando imposti i controlli di scale in, il gestore della scalabilità automatica limita le operazioni di scalabilità verso il basso alla riduzione massima consentita rispetto alle dimensioni di picco osservate nella finestra temporale precedente. Il gestore della scalabilità automatica utilizza i seguenti passaggi:

Monitora costantemente la dimensione del picco storico osservata nella finestra temporale precedente.
Utilizza la riduzione massima consentita per calcolare le dimensioni dello scale in vincolate (dimensioni di picco: maxScaledInReplicas)
Imposta la dimensione consigliata del gruppo sulle dimensioni di scale in vincolate. Ad esempio, se un gestore della scalabilità automatica ridimensiona un gruppo di istanze in modo da avere 20 VM, ma i vincoli di scale in consentono solo di scalare fino a 40 VM, la dimensione consigliata è impostata su 40 VM.

Con i controlli di scale in, il gestore della scalabilità automatica monitora continuamente le dimensioni di picco di un gruppo di istanze all'interno della finestra temporale finale configurata per identificare le dimensioni sufficienti per soddisfare il carico storico. Il gestore della scalabilità automatica non fa lo scale in oltre la riduzione massima consentita misurata in base alle dimensioni del picco osservato:

Gestore della scalabilità automatica con controlli di scale in.

Ad esempio, nel diagramma sopra, i controlli di scale in sono configurati per una riduzione massima consentita di 20 VM in un intervallo di tempo successivo di 30 minuti:

Quando il carico diminuisce, il gestore della scalabilità automatica rimuove 20 VM, ovvero la riduzione massima consentita configurata nei controlli di scale in.
Quando il carico aumenta e diminuisce, il gestore della scalabilità automatica monitora costantemente l'intervallo di tempo degli ultimi 30 minuti per rilevare le dimensioni del picco sufficienti per gestire il carico storico. Questa dimensione di picco viene utilizzata come base per i controlli di scalabilità in calo per limitare la frequenza di scale in. Se negli ultimi 30 minuti la dimensione di picco era di 70 VM e la riduzione massima consentita è impostata su 20 VM, il gestore della scalabilità automatica può fare lo scale in fino a 50 VM. Se la dimensione attuale è di 65 VM, il gestore della scalabilità automatica può rimuovere solo 15 VM.
Quando il carico diminuisce, il gestore della scalabilità automatica continua a rimuovere le istanze VM, ma limita la frequenza a un massimo di 20 VM rispetto alla dimensione massima del gruppo di istanze misurata negli ultimi 30 minuti.

La riduzione massima consentita del gruppo potrebbe avvenire contemporaneamente, quindi devi configurare la riduzione massima consentita in modo che la tua applicazione possa permettersi di perdere così tante istanze contemporaneamente. Utilizza il parametro di riduzione massima consentita per indicare la quantità di riduzione della capacità di pubblicazione che la tua applicazione può tollerare.

Se limiti il numero di istanze VM che la scalabilità automatica può rimuovere e aumenti la finestra temporale finale osservata, la disponibilità delle applicazioni con picchi di carico e tempi di inizializzazione lunghi dovrebbe migliorare. In particolare, la dimensione del gruppo di istanze non cala bruscamente in risposta a un calo significativo del carico, ma diminuisce gradualmente nel tempo. Se i picchi di carico si verificano subito dopo lo scale in, il numero rimanente di VM dovrebbe essere ancora in grado di assorbire il picco entro i limiti di tolleranza. Inoltre, è necessario avviare meno VM per gestire adeguatamente il picco.

Puoi configurare i controlli di scale in per la scalabilità automatica sia dei MIG a livello di zona sia di quelli a livello di regione. La configurazione è la stessa per entrambi i casi. I controlli di scale in funzionano per qualsiasi dimensione gruppo.

Controlli di scale in rispetto alla stabilizzazione del gestore della scalabilità automatica

La configurazione dei controlli di scale in non comporta la disattivazione del meccanismo di stabilizzazione integrato del gestore della scalabilità automatica. Il gestore della scalabilità automatica mantiene sempre le dimensioni del gruppo di istanze a un livello necessario per gestire il carico di picco osservato durante il periodo di stabilizzazione. I controlli di scale in ti offrono un ulteriore meccanismo per controllare la frequenza con cui viene ridimensionato un gruppo di istanze.

	Gestore della scalabilità automatica integrato: Periodo di stabilizzazione	Controlli di scale in: Finestra temporale finale
Configurabile?	No, non configurabile	Sì, configurabile
Che cosa viene monitorato?	Monitora il carico di picco negli ultimi 10 minuti o nel periodo di inizializzazione, a seconda del periodo più lungo.	Monitora la dimensione di picco del gruppo di istanze nel periodo precedente impostato in base alla finestra temporale finale
In che modo ciò può essere utile?	Garantisce che le dimensioni del gruppo di istanze rimangano sufficienti per gestire il picco di carico osservato negli ultimi 10 minuti o nel periodo di inizializzazione, a seconda del periodo più lungo.	Garantisce che le dimensioni del gruppo di istanze non vengano ridotte di più istanze VM di quante il workload possa tollerare durante la gestione dei picchi di carico in un determinato periodo di tempo.

Controlli di scale in con la modalità gestore della scalabilità automatica

Esistono due scenari simili, ma leggermente diversi, quando il MIG non è sottoposto a scalabilità automatica e vuoi attivare questa funzionalità. Questi dipendono dal fatto che tu stia configurando la scalabilità automatica per la prima volta o che la scalabilità automatica sia configurata ma temporaneamente disattivata o con restrizioni.

Configura il gestore della scalabilità automatica per la prima volta

Quando hai un MIG non sottoposto a scalabilità automatica e configuri la scalabilità automatica da zero, il gestore della scalabilità automatica utilizza le dimensioni correnti del MIG come punto di partenza. Prima di eseguire lo scale in, il gestore della scalabilità automatica utilizza il periodo di stabilizzazione e poi i controlli di scale in per limitare la frequenza di scale in:

Configurazione del gestore della scalabilità automatica per la prima volta.

Modifica la modalità gestore della scalabilità automatica

Con la modalità di scalabilità automatica, puoi disattivare o limitare temporaneamente le attività di scalabilità automatica. La configurazione del gestore della scalabilità automatica persiste e il gestore continua a eseguire calcoli in background quando è disattivato o limitato. Il gestore della scalabilità automatica prende in considerazione i controlli di scale in nei calcoli in background mentre è disattivato o in modalità con restrizioni. Tutte le attività di scalabilità automatica riprendono utilizzando i calcoli più recenti quando riattivi la scalabilità automatica o quando annulli la restrizione:

Riavvio del gestore della scalabilità automatica inclusi i controlli di scale in.

Se il gestore della scalabilità automatica è attivo, si comporta come al solito (in questo caso con i controlli di scale in).
Quando il gestore della scalabilità automatica è disattivato, calcola comunque la dimensione consigliata del gruppo di istanze in base al carico. I calcoli del gestore della scalabilità automatica prendono comunque in considerazione i controlli di scale in. Tuttavia, il gestore della scalabilità automatica non applica i calcoli delle dimensioni quando è disattivato. Le dimensioni del gruppo di istanze rimangono costanti finché il gestore della scalabilità automatica non viene riattivato.
Quando riattivi il gestore della scalabilità automatica, vengono applicate immediatamente le dimensioni calcolate in precedenza. In questo modo, puoi scalare più rapidamente alle dimensioni corrette. La riattivazione del gestore della scalabilità automatica può causare uno scale in brusco (in questo caso da 80 a 40 istanze VM). Questa è un'operazione sicura perché i calcoli in background prendono già in considerazione i controlli di scale in.

Scalabilità automatica predittiva

Per scoprire di più sulla scalabilità automatica predittiva, incluso come funziona, consulta Scalabilità basata sulle previsioni.

Preparazione all'arresto delle istanze

Quando il gestore della scalabilità automatica fa lo scale in, determina il numero di istanze VM da eliminare. Il gestore della scalabilità automatica dà la priorità alle istanze VM da eliminare in base a diversi fattori, tra cui:

VM non in esecuzione per qualsiasi motivo.
VM in cui sono in corso o sono pianificate modifiche che causano interruzioni, ad esempio aggiornamenti, riavvii o sostituzioni.
VM non ancora aggiornate alla versione prevista del modello di istanza.
VM con l'indicatore di scalabilità automatica più basso. Ad esempio, se configuri il MIG in modo che la scalabilità sia basata sull'utilizzo della CPU e il gruppo deve fare lo scale in, il gestore della scalabilità automatica tenta di rimuovere le VM con l'utilizzo della CPU più basso.

Prima di interrompere un'istanza, ti consigliamo di assicurarti che queste eseguano determinate attività, ad esempio la chiusura di eventuali connessioni esistenti, l'arresto graduale di app o server app, il caricamento dei log e così via. Puoi istruire l'istanza a eseguire queste attività utilizzando uno script di arresto. Uno script di arresto viene eseguito secondo il criterio "best effort" nel breve periodo tra il momento in cui viene effettuata la richiesta di arresto e il momento in cui l'istanza viene effettivamente arrestata. Durante questo periodo, Compute Engine tenta di eseguire lo script di arresto per svolgere eventuali attività specificate nello script.

Questa operazione è particolarmente utile se utilizzi il bilanciamento del carico con il gruppo di istanze gestite. Se l'istanza non è più in stato di integrità, potrebbe essere necessario del tempo prima che il bilanciatore del carico lo riconosca, continuando così a inviare nuove richieste all'istanza. Con uno script di arresto, l'istanza può segnalare che non è in stato di integrità durante l'arresto in modo che il bilanciatore del carico possa interrompere l'invio di traffico all'istanza. Per ulteriori informazioni sui controlli di integrità del bilanciamento del carico, consulta la panoramica dei controlli di integrità.

Per ulteriori informazioni sugli script di arresto, consulta Script di arresto.

Per ulteriori informazioni sull'arresto delle istanze, consulta la documentazione sull'arresto o sull'eliminazione di un'istanza.

Monitoraggio di grafici e log della scalabilità automatica

Compute Engine fornisce diversi grafici e log che ti consentono di monitorare il comportamento del gruppo di istanze gestite in qualsiasi momento.

Puoi accedere ai grafici e ai log nella Google Cloud console.

Nella console Google Cloud , vai alla pagina Gruppi di istanze.
Vai a Gruppi di istanze
Fai clic sul nome del gruppo di istanze gestite che vuoi visualizzare.
Nella pagina del gruppo di istanze gestite, seleziona la scheda Monitoraggio.

I grafici di monitoraggio mostrano l'evoluzione delle seguenti metriche:

Dimensione gruppo
Utilizzo del gestore della scalabilità automatica
Utilizzo CPU
I/O disco (byte)
I/O disco (operazioni)
Byte di rete
Pacchetti di rete

Una descrizione comando accanto al titolo di ogni grafico fornisce dettagli aggiuntivi contestuali sulla metrica visualizzata.

Nella parte inferiore della pagina è disponibile un riquadro Log, in cui puoi trovare un elenco di log eventi per il gruppo di istanze gestite. Per visualizzare i log, fai clic sulla freccia di espansione.

Tutti i grafici e i log sono associati a un unico periodo di tempo che puoi personalizzare con il selettore dell'intervallo di tempo. Facendo clic e trascinando su un grafico, puoi aumentare lo zoom su un determinato evento e analizzare i grafici e i log nell'intervallo di tempo selezionato.

Monitoraggio della scalabilità automatica predittiva

Compute Engine fornisce un grafico per monitorare le previsioni del gestore della scalabilità automatica. Per visualizzare questo grafico, fai clic sul titolo Dimensione gruppo nel primo grafico e seleziona Scalabilità automatica predittiva.

Se la scalabilità automatica è attivata, puoi visualizzare in che modo le previsioni del gestore della scalabilità automatica determinano la dimensione del gruppo di istanze. Se la scalabilità automatica non è attivata, puoi comunque visualizzare le previsioni del gestore della scalabilità automatica e usarle per prendere decisioni in merito alle dimensioni del gruppo.

Utilizza le seguenti informazioni per comprendere questo grafico.

La linea blu indica il numero di istanze nel gruppo di istanze gestite.
La linea verde mostra il numero di istanze previste dal gestore della scalabilità automatica.
- Se la linea verde è sotto la linea blu, è disponibile una grande quantità di capacità e le tue istanze VM sono probabilmente sottoutilizzate.
- Se la linea verde è sopra la linea blu, la capacità rimanente è scarsa o non esiste affatto e devi aggiungere altre istanze al gruppo di istanze.
Le linee rosse orizzontali tratteggiate indicano il numero minimo e massimo di istanze consentite nel gruppo di istanze.

Visualizzazione dei messaggi di stato

Quando il gestore della scalabilità automatica riscontra un problema di scalabilità, restituisce un avviso o un messaggio di errore. Puoi esaminare questi messaggi di stato in due modi.

Visualizza i messaggi di stato nella pagina Gruppi di istanze

Puoi visualizzare i messaggi di stato direttamente nella pagina Gruppi di istanze in Google Cloud console.

Nella console Google Cloud , vai alla pagina Gruppi di istanze.
Vai a Gruppi di istanze
Cerca eventuali gruppi di istanze con l'icona di avviso che precede i relativi nomi.

Ad esempio:
Tieni premuto il puntatore sopra un'icona di stato per visualizzare i dettagli del messaggio di stato.

Visualizza i messaggi di stato nella pagina di riepilogo del gruppo di istanze

Puoi andare direttamente alla pagina di riepilogo di un gruppo di istanze specifico per visualizzare i messaggi di stato pertinenti.

Nella console Google Cloud , vai alla pagina Gruppi di istanze.
Vai a Gruppi di istanze
Fai clic sul gruppo di istanze per cui vuoi visualizzare i messaggi di stato.
Nella pagina del gruppo di istanze, visualizza il messaggio di stato sotto il nome del gruppo di istanze.

Messaggi di stato restituiti di frequente

Quando il gestore della scalabilità automatica riscontra un problema di scalabilità, restituisce un avviso o un messaggio di errore. Di seguito sono riportati alcuni messaggi restituiti di frequente e il loro significato.

All instances in the instance group are unhealthy (not in RUNNING state). If this is an error, check the instances.

Tutte le istanze del gruppo di istanze hanno uno stato diverso da RUNNING. Se si tratta di un'azione intenzionale, puoi ignorare questo messaggio. Se questa è una scelta non intenzionale, risolvi il problema del gruppo di istanze.

The number of instances has reached the maxNumReplicas. The autoscaler cannot add more instances.

Quando hai creato il gestore della scalabilità automatica, hai indicato il numero massimo di istanze che il gruppo di istanze può avere. Al momento il gestore della scalabilità automatica sta tentando di fare lo scale out del gruppo di istanze per soddisfare la domanda, ma ha raggiunto il valore maxNumReplicas. Per informazioni su come aggiornare maxNumReplicas a un numero maggiore, consulta Aggiornamento di un gestore della scalabilità automatica.

The monitoring metric that was specified does not exist or does not have the required labels. Check the metric.

Stai utilizzando la scalabilità automatica con una metrica di Cloud Monitoring, ma la metrica che hai fornito non esiste, non dispone delle etichette necessarie o non è accessibile per l'agente di servizio Compute Engine.

A seconda che la metrica sia standard o personalizzata, sono richieste etichette diverse. Per ulteriori informazioni, consulta la documentazione relativa alla Scalabilità in base a una metrica di monitoraggio.

Verifica che l'agente di servizio Compute Engine disponga del ruolo IAM compute.serviceAgent. Per aggiungerlo, consulta Prerequisiti del gestore della scalabilità automatica.

Quota for some resources is exceeded. Increase the quota or delete resources to free up more quota.

Puoi ottenere informazioni sulla quota disponibile nella pagina Quota della Google Cloud console.

Autoscaling does not work with an HTTP/S load balancer configured for maxRate.

Il gruppo di istanze viene bilanciato in base al carico utilizzando la configurazione maxRate, ma il gestore della scalabilità automatica non supporta questa modalità. Modifica la configurazione o disattiva la scalabilità automatica. Per scoprire di più su maxRate, leggi la sezione Limitazioni e linee guida della documentazione sul bilanciamento del carico.

The autoscaler is configured to scale based on a load balancing signal but the instance group has not received any queries from the load balancer. Check that the load balancing configuration is working.

Il gruppo di istanze è sottoposto a bilanciamento del carico, ma non riceve query. Il servizio potrebbe essere inattivo, ma non c'è da preoccuparsi. Tuttavia, questo messaggio può essere causato anche da una configurazione errata. Ad esempio, un gruppo di istanze con scalabilità automatica potrebbe essere il target di più bilanciatori del carico, il che non è supportato. Per un elenco completo delle linee guida, consulta Limitazioni e linee guida nella documentazione sul bilanciamento del carico.