Questa pagina illustra i concetti relativi alla disponibilità e alla durabilità dei dati in Cloud Storage, tra cui la modalità di archiviazione ridondante dei dati, il comportamento di replica predefinito per le due e più regioni, la funzionalità di replica rapida per le due regioni e la funzionalità di replica tra bucket.
Concetti fondamentali
Cloud Storage è progettato per garantire una durabilità annuale del 99,999999999% (11 nove).
Per raggiungere questo obiettivo, Cloud Storage utilizza la codifica di cancellazione e archivia i pezzi di dati in modo ridondante su più dispositivi situati in più zone di disponibilità.
Cloud Storage archivia in modo ridondante gli oggetti scritti in almeno due diverse zone di disponibilità prima di considerare la scrittura riuscita.
I checksum vengono memorizzati e riconvalidati regolarmente per verificare in modo proattivo l'integrità di tutti i dati inattivi e per rilevare la corruzione dei dati in transito. Se necessario, le correzioni vengono apportate automaticamente utilizzando dati ridondanti.
La disponibilità mensile dei dati archiviati in Cloud Storage dipende dalla classe di archiviazione dei dati e dal tipo di località del bucket. Per ulteriori informazioni, vedi classi di archiviazione disponibili.
Gli oggetti archiviati in un bucket dual-region o multi-region vengono archiviati in modo ridondante in almeno due località geografiche separate.
Per le regioni doppie, seleziona le regioni specifiche in cui sono archiviati gli oggetti.
Per le multiregioni, i data center specifici utilizzati per l'archiviazione dei dati vengono determinati da Cloud Storage in base alle necessità, ma si trovano all'interno del confine geografico della multiregione e sono separati da almeno 160 km. In questo modo, la ridondanza tra le regioni è garantita a un costo di archiviazione inferiore rispetto alle regioni doppie.
Nell'improbabile caso di un'interruzione a livello di regione, ad esempio causata da un disastro naturale, i bucket con due regioni e più regioni rimangono disponibili, senza necessità di modificare i percorsi di archiviazione.
Per saperne di più sulle considerazioni specifiche per le regioni, consulta Area geografica e regioni.
Gli oggetti archiviati in bucket multiregionali e dual-region vengono in genere replicati in luoghi geografici utilizzando la replica predefinita.
Se uno dei luoghi in cui è archiviato un oggetto non è più disponibile dopo il caricamento riuscito dell'oggetto, ma prima che venga replicato nella seconda località, la coerenza forte di Cloud Storage garantisce che non vengano pubblicate versioni obsolete dell'oggetto e che le sovrascritture successive non vengano ripristinate quando la regione torna disponibile.
Gli oggetti archiviati in due regioni possono utilizzare facoltativamente la replica turbo per ottenere una replica più rapida e prevedibile tra le regioni.
Per ottenere la ridondanza tra un accoppiamento di regioni non disponibile come doppia regione, valuta la possibilità di creare un bucket separato in ogni regione e di utilizzare i trasferimenti basati su eventi o la replica tra bucket di Storage Transfer Service per mantenere sincronizzati i bucket.
Ridondanza tra regioni
Mentre i modelli di archiviazione tradizionali spesso si basano su un approccio attivo-passivo con località geografiche "principali" e "secondarie", le regioni doppie e le multiregioni di Cloud Storage forniscono un'architettura attivo-attivo basata su un singolo bucket con ridondanza tra le regioni. In questo modo si semplifica il processo di recupero di emergenza eliminando la necessità per gli utenti di replicare i dati da un bucket a un altro o di eseguire manualmente il failover a un bucket secondario in caso di tempi di inattività della regione principale.
Cloud Storage comprende sempre lo stato attuale di un bucket e fornisce in modo trasparente gli oggetti da una regione disponibile in base alle necessità. Di conseguenza, i bucket a due regioni e multiregionali sono progettati per avere un obiettivo di tempo di ripristino (RTO) pari a zero e gli errori regionali temporanei sono normalmente invisibili agli utenti; in caso di interruzione del servizio a livello regionale, i bucket a due regioni e multiregionali continuano automaticamente a pubblicare tutti i dati replicati tra le regioni.
Tuttavia, la ridondanza tra regioni si verifica in modo asincrono e tutti i dati che non vengono replicati tra regioni prima che una regione diventi non disponibile non sono accessibili finché la regione inattiva non torna online. I dati potrebbero andare persi nell'improbabile caso di distruzione fisica della regione.
La replica predefinita in Cloud Storage è progettata per fornire ridondanza tra le regioni per il 99,9% degli oggetti appena scritti entro un'ora e il 100% degli oggetti appena scritti entro 12 ore. Gli oggetti appena scritti includono caricamenti, riscritture, copie e composizioni.
Cloud Storage offre anche una funzionalità di replica tra bucket che può essere utilizzata per replicare i dati tra bucket indipendenti per soddisfare esigenze di replica dei dati aggiuntive non soddisfatte dalle località a due o più regioni.
Replica turbo
La replica Turbo offre una ridondanza più rapida tra le regioni per i dati nei bucket a doppia regione, il che riduce il rischio di esposizione alla perdita di dati e contribuisce a supportare un servizio ininterrotto in seguito a un'interruzione a livello di regione. Se abilitata, la replica turbo è progettata per replicare il 100% degli oggetti appena scritti nelle due regioni che costituiscono una doppia regione entro l'obiettivo del punto di ripristino di 15 minuti, indipendentemente dalle dimensioni dell'oggetto.
Tieni presente che anche per la replica predefinita, la maggior parte degli oggetti termina la replica in pochi minuti.
Sebbene la ridondanza tra regioni e la replica turbo contribuiscano a supportare gli sforzi di continuità aziendale e ripristino di emergenza (BCDR), gli amministratori devono pianificare e implementare un'architettura BCDR completa adatta al loro carico di lavoro.
Per ulteriori informazioni, consulta la Guida passo passo alla progettazione del ripristino di emergenza per le applicazioni in Google Cloud.
Limitazioni
La replica turbo è disponibile solo per i bucket in due regioni.
La replica turbo non può essere gestita tramite l'API XML, inclusa la creazione di un nuovo bucket con la replica turbo abilitata.
Quando la replica turbo è abilitata su un bucket, possono essere necessari fino a 10 secondi prima che inizi a essere applicata agli oggetti appena scritti.
Le scritture di oggetti iniziate prima dell'attivazione della replica turbo su un bucket vengono replicate tra regioni alla velocità di replica predefinita.
- La composizione di oggetti che utilizza qualsiasi oggetto di origine scritto utilizzando la replica predefinita nelle ultime 12 ore crea un oggetto composito che utilizza anche la replica predefinita.
Replica tra bucket
In alcuni casi, potresti voler conservare una copia dei tuoi dati in un secondo bucket. La replica tra bucket copia in modo asincrono gli oggetti nuovi e aggiornati da un bucket di origine a un bucket di destinazione.
La replica tra bucket differisce dalla replica predefinita e dalla replica turbo in quanto i dati esistono in due bucket indipendenti, ognuno con le proprie configurazioni, come località di archiviazione, crittografia, accesso e classe di archiviazione. È particolarmente adatta per:
- Sovranità dei dati: mantieni i dati in regioni geograficamente distanti.
- Gestione di versioni di sviluppo e produzione separate: crea bucket e spazi dei nomi distinti, in modo che lo sviluppo non influisca sul tuo workload di produzione.
- Condivisione dei dati: replica i dati in un bucket di proprietà di un fornitore o partner.
- Aggregazione dei dati: combina i dati di bucket diversi in un unico bucket per eseguire carichi di lavoro di analisi.
- Gestione di costi, sicurezza e conformità: mantieni i tuoi dati in diverse proprietà, classi di archiviazione e periodi di conservazione.
La replica tra bucket utilizza Storage Transfer Service per replicare gli oggetti e Pub/Sub per ricevere avvisi relativi alle modifiche ai bucket di origine e di destinazione. Puoi attivare la replica tra bucket sui nuovi bucket che crei e su quelli esistenti.
Per i bucket in cui la velocità di modifica degli oggetti è inferiore a 3000 al secondo e gli oggetti sono inferiori a 1 GiB, la replica tra bucket richiede in genere da pochi minuti a decine di minuti, ma non è supportato alcun limite superiore specifico. Inoltre, i bucket con tassi di modifica più elevati o con oggetti più grandi possono prevedere ritardi di replica maggiori.
Per istruzioni sull'utilizzo della replica tra bucket, vedi Utilizzare la replica tra bucket.
Limitazioni
Le eliminazioni di oggetti nel bucket di origine non vengono replicate nel bucket di destinazione.
Le configurazioni del ciclo di vita degli oggetti non vengono replicate.
Quando gli oggetti vengono replicati, i metadati del timestamp (ad esempio,
timeCreated
etimeUpdated
) non vengono conservati. Per informazioni dettagliate sulla conservazione dei metadati, consulta la sezione Trasferimenti tra bucket Cloud Storage.Poiché la replica tra bucket può essere utilizzata per replicare i dati tra bucket situati in qualsiasi Google Cloud posizione, le prestazioni della replica tra bucket variano in base alle posizioni selezionate. Di conseguenza, la replica tra bucket non offre un Recovery Point Objective (RPO).
Monitoraggio delle prestazioni
Cloud Storage monitora gli oggetti non replicati più vecchi nei bucket a due regioni e multiregionali utilizzando la replica predefinita o la replica turbo. Se un oggetto rimane non replicato per un periodo di tempo superiore al suo RPO (Recovery Point Objective), viene considerato fuori dall'RPO. Ogni minuto in cui uno o più oggetti non rispettano l'RPO viene conteggiato come minuto "non valido".
Ad esempio, se un oggetto ha generato 20 minuti di dati non validi dalle 9:00 alle 9:20 e un altro oggetto ha generato 10 minuti di dati non validi dalle 9:15 alle 9:25, ci sono due oggetti per il mese che non rispettano l'RPO. Il numero totale di minuti non conformi per il mese è 25 minuti, perché dalle 9:00 alle 9:25 almeno un oggetto non rispettava l'RPO.
Per i bucket che utilizzano la replica turbo, l'RPO per gli oggetti è di 15 minuti.
Per i bucket che utilizzano la replica predefinita, l'RPO per gli oggetti è di 12 ore.
- Per i bucket che utilizzano la replica predefinita, gli oggetti vengono in genere replicati in un'ora o meno.
La replica tra bucket non fornisce un RPO.
Nella console Google Cloud , il grafico Percentuale di minuti al di fuori dell'RPO ti consente di monitorare la percentuale di minuti non validi negli ultimi 30 giorni per il tuo bucket quando utilizzi la replica predefinita o la replica turbo all'interno di bucket multiregionali o in due regioni. Questo indicatore del livello di servizio può essere utilizzato per monitorare la conformità al tempo di replica mensile del bucket. Analogamente, la Percentuale di oggetti fuori dal target tiene traccia delle repliche di oggetti che non si sono verificate entro l'RPO. Questo indicatore del livello di servizio può essere utilizzato per monitorare la conformità del volume di replica mensile del bucket. Per maggiori informazioni, consulta Monitoraggio di Cloud Storage e SLA di Cloud Storage.
Passaggi successivi
- Abilita la replica turbo in un bucket a doppia regione esistente.
- Scopri di più sui prezzi della replica turbo.
- Sposta i dati in un bucket diverso in una nuova posizione.