Progettare per la riduzione controllata

Last reviewed 2024-12-30 UTC

Questo principio nel pilastro dell'affidabilità del Google Cloud framework Well-Architected fornisce consigli per aiutarti a progettare i tuoi carichi di lavoro Google Cloud in modo che non si verifichino errori.

Questo principio è pertinente all'area di interesse dell'affidabilità.

Panoramica del principio

Il degrado controllato è un approccio di progettazione in cui un sistema che subisce un carico elevato continua a funzionare, possibilmente con prestazioni o precisione ridotte. Il degrado controllato garantisce la disponibilità continua del sistema e ne impedisce il guasto completo, anche se il funzionamento non è ottimale. Quando il carico torna a un livello gestibile, il sistema riprende la piena funzionalità.

Ad esempio, durante i periodi di carico elevato, la Ricerca Google dà la priorità ai risultati delle pagine web con un ranking più elevato, sacrificando potenzialmente un po' di precisione. Quando il carico diminuisce, la Ricerca Google ricalcola i risultati di ricerca.

Consigli

Per progettare i tuoi sistemi per la riduzione controllata, tieni presenti i consigli nelle seguenti sottosezioni.

Implementare la limitazione

Assicurati che le repliche possano gestire in modo indipendente i sovraccarichi e limitare le richieste in entrata durante gli scenari di traffico elevato. Questo approccio ti aiuta a prevenire errori a cascata causati da spostamenti del traffico in eccesso tra zone.

Utilizza strumenti come Apigee per controllare la frequenza delle richieste API durante i periodi di traffico elevato. Puoi configurare le regole dei criteri in modo che riflettano il modo in cui vuoi ridurre le richieste.

Eliminare le richieste in eccesso in anticipo

Configura i tuoi sistemi in modo da eliminare le richieste in eccesso nel livello frontend per proteggere i componenti di backend. L'eliminazione di alcune richieste impedisce errori globali e consente al sistema di ripristinarsi in modo più controllato.Con questo approccio, alcuni utenti potrebbero riscontrare errori. Tuttavia, puoi ridurre al minimo l'impatto delle interruzioni, a differenza di un approccio come l'interruzione del circuito, in cui tutto il traffico viene interrotto durante un sovraccarico.

Gestire errori parziali e tentativi

Crea le tue applicazioni in modo che gestiscano senza problemi errori parziali e tentativi. Questo design contribuisce a garantire che il maggior traffico possibile venga gestito durante scenari di carico elevato.

Testare scenari di sovraccarico

Per verificare che i meccanismi di limitazione e interruzione delle richieste funzionino in modo efficace, simula regolarmente le condizioni di sovraccarico nel tuo sistema. I test contribuiscono a garantire che il tuo sistema sia preparato per i picchi di traffico reali.

Monitorare i picchi di traffico

Utilizza gli strumenti di analisi e monitoraggio per prevedere e rispondere ai picchi di traffico prima che si trasformino in sovraccarichi. Il rilevamento e la risposta tempestivi possono contribuire a mantenere la disponibilità del servizio durante i periodi di forte domanda.