Un'infrastruttura affidabile è un requisito fondamentale per i carichi di lavoro nel cloud. In qualità di Cloud Architect, per progettare un'infrastruttura affidabile per i tuoi carichi di lavoro, devi comprendere bene le funzionalità di affidabilità del tuo fornitore di servizi cloud preferito. Questo documento descrive i componenti fondamentali dell'affidabilità in Google Cloud (zone, regioni e risorse con ambito di località) e i livelli di disponibilità che forniscono. Questo documento fornisce anche linee guida per valutare i requisiti di affidabilità dei tuoi carichi di lavoro e presenta consigli architetturali per la creazione e la gestione di un'infrastruttura affidabile in Google Cloud.
Questo documento è suddiviso nelle seguenti parti:
- Panoramica dell'affidabilità (questa parte)
- Componenti di base dell'affidabilità in Google Cloud
- Valuta i requisiti di affidabilità per i tuoi carichi di lavoro cloud
- Progettare un'infrastruttura affidabile per i tuoi carichi di lavoro in Google Cloud
- Gestire il traffico e il carico per i carichi di lavoro in Google Cloud
- Gestisci e monitora la tua infrastruttura Google Cloud
Se hai già letto questa guida e vuoi vedere cosa è cambiato, consulta le Note di rilascio.
Panoramica dell'affidabilità
Un'applicazione o un carico di lavoro è affidabile quando soddisfa i tuoi obiettivi attuali per disponibilità e resilienza agli errori.
La disponibilità (o tempo di attività) è la percentuale di tempo in cui un'applicazione è utilizzabile. Ad esempio, per un'applicazione con un target di disponibilità del 99,99%, il tempo di inattività totale non deve superare gli 8,64 secondi in un periodo di 24 ore. A volte, la disponibilità viene misurata come la proporzione di richieste che l'applicazione gestisce correttamente durante un determinato periodo. Ad esempio, per un'applicazione con un target di disponibilità del 99,99%, per ogni 100.000 richieste ricevute, non più di dieci richieste possono non riuscire. La disponibilità è spesso espressa come il numero di nove nella percentuale. Ad esempio, la disponibilità del 99,99% viene espressa come "quattro nove".
A seconda dello scopo dell'applicazione, potresti avere diversi set di indicatori di affidabilità. Di seguito sono riportati alcuni esempi di questi indicatori:
- Per le applicazioni che pubblicano contenuti, disponibilità, latenza e throughput sono indicatori di affidabilità importanti. Indicano se l'applicazione può rispondere alle richieste, quanto tempo impiega a rispondere alle richieste e quante richieste può elaborare correttamente in un determinato periodo.
- Per database e sistemi di archiviazione, latenza, velocità effettiva, disponibilità e durabilità (il livello di protezione dei dati da perdita o danneggiamento) sono indicatori di affidabilità. Indicano il tempo necessario al sistema per leggere o scrivere i dati e se è possibile accedervi su richiesta.
- Per i carichi di lavoro di big data e analisi, come le pipeline di elaborazione dei dati, prestazioni coerenti della pipeline (velocità effettiva e latenza) sono essenziali per garantire l'aggiornamento dei prodotti dati e sono un importante indicatore di affidabilità. Indica la quantità di dati che possono essere elaborati e il tempo necessario alla pipeline per passare dall'importazione datil'elaborazione dei dati.
- La maggior parte delle applicazioni considera la correttezza dei dati un indicatore di affidabilità essenziale.
Per ulteriori linee guida per definire gli obiettivi di affidabilità per le tue applicazioni, consulta Valutare i requisiti di affidabilità per i workload cloud.
Fattori che influiscono sull'affidabilità dell'applicazione
L'affidabilità di un'applicazione di cui è stato eseguito il deployment in Google Cloud dipende dai seguenti fattori:
- La progettazione interna dell'applicazione.
- Le applicazioni o i componenti secondari da cui dipende l'applicazione.
- Google Cloud Risorse dell'infrastruttura come computing, networking, archiviazione, database e sicurezza su cui viene eseguita l'applicazione e come l'applicazione utilizza l'infrastruttura.
- La capacità dell'infrastruttura di cui esegui il provisioning e la modalità di scalabilità della capacità.
- I processi e gli strumenti DevOps che utilizzi per creare, eseguire il deployment e gestire l'applicazione, le relative dipendenze e l'infrastruttura Google Cloud.
Questi fattori sono riassunti nel seguente diagramma:
Come mostrato nel diagramma precedente, l'affidabilità di un'applicazione di cui è stato eseguito il deployment in Google Cloud dipende da più fattori. Questa guida è incentrata sull'affidabilità dell'infrastruttura Google Cloud .
Passaggi successivi
- Componenti di base dell'affidabilità in Google Cloud
- Valuta i requisiti di affidabilità per i tuoi carichi di lavoro cloud
- Progettare un'infrastruttura affidabile per i tuoi carichi di lavoro in Google Cloud
- Gestire il traffico e il carico per i carichi di lavoro in Google Cloud
- Gestisci e monitora la tua infrastruttura Google Cloud
Collaboratori
Autori:
- Nir Tarcic | Cloud Lifecycle SRE UTL
- Kumar Dhanagopal | Sviluppatore di soluzioni cross-product
Altri collaboratori:
- Alok Kumar | Distinguished Engineer
- Andrew Fikes | Engineering Fellow, Reliability
- Chris Heiser | SRE TL
- David Ferguson | Director, Site Reliability Engineering
- Joe Tan | Senior Product Counsel
- Krzysztof Duleba | Principal Engineer
- Narayan Desai | Principal SRE
- Sailesh Krishnamurthy | VP, Engineering
- Steve McGhee | Reliability Advocate
- Sudhanshu Jain | Product Manager
- Yaniv Aknin | Software Engineer