Questa pagina è stata tradotta dall'API Cloud Translation.

Progetta una strategia di archiviazione ottimale per il tuo carico di lavoro cloud

Last reviewed 2025-05-09 UTC

Questa guida ti aiuta a valutare i requisiti di archiviazione del tuo carico di lavoro cloud, a comprendere le opzioni di archiviazione disponibili in Google Cloude a progettare una strategia di archiviazione che offra un valore aziendale ottimale.

Per un riepilogo visivo dei principali consigli di progettazione, consulta il diagramma ad albero decisionale.

Per informazioni sulla selezione dei servizi di archiviazione per i carichi di lavoro di AI e ML, consulta Progettare l'archiviazione per i carichi di lavoro di AI e ML in Google Cloud.

Panoramica del processo di progettazione

In qualità di cloud architect, quando pianifichi l'archiviazione per un carico di lavoro cloud, devi innanzitutto considerare le caratteristiche funzionali del carico di lavoro, i vincoli di sicurezza, i requisiti di resilienza, le aspettative di prestazioni e gli obiettivi di costo. Successivamente, devi esaminare i servizi e le funzionalità di archiviazione disponibili in Google Cloud. Poi, in base ai tuoi requisiti e alle opzioni disponibili, seleziona i servizi e le funzionalità di archiviazione di cui hai bisogno. Il seguente diagramma mostra questo processo di progettazione in tre fasi:

Approccio graduale alla progettazione dell'archiviazione per i carichi di lavoro cloud.

Definisci i tuoi requisiti

Utilizza i questionari in questa sezione per definire i requisiti di archiviazione delle chiavi del carico di lavoro che vuoi implementare in Google Cloud.

Linee guida per la definizione dei requisiti di spazio di archiviazione

Quando rispondi ai questionari, tieni presente le seguenti linee guida:

Definisci i requisiti in modo granulare

Ad esempio, se la tua applicazione ha bisogno di spazio di archiviazione basato su Network File System (NFS), identifica la versione NFS richiesta.
Considerare i requisiti futuri

Ad esempio, la tua attuale implementazione potrebbe servire utenti in paesi dell'Asia, ma potresti pianificare di espandere l'attività ad altri continenti. In questo caso, considera eventuali requisiti normativi relativi all'archiviazione dei nuovi territori commerciali.
Considera le opportunità e i requisiti specifici del cloud
- Sfrutta le opportunità specifiche del cloud.
  
  Ad esempio, per ottimizzare il costo di archiviazione dei dati archiviati in Cloud Storage, puoi controllare la durata dell'archiviazione utilizzando le norme di conservazione dei dati e le configurazioni del ciclo di vita.
- Considera i requisiti specifici del cloud.
  
  Ad esempio, i dati on-premise potrebbero esistere in un unico data center e potresti dover replicare i dati migrati in due posizioniGoogle Cloud per la ridondanza.

Questionari

I questionari che seguono non sono elenchi di controllo esaustivi per la pianificazione. Utilizzali come punto di partenza per analizzare sistematicamente tutti i requisiti di archiviazione del workload che vuoi implementare in Google Cloud.

Valuta le caratteristiche del tuo workload

Che tipo di dati devi archiviare?
Esempi
- Contenuti del sito web statico
- Backup e archivi per il ripristino di emergenza
- Audit log per la conformità
- Oggetti di dati di grandi dimensioni che gli utenti scaricano direttamente
- Dati transazionali
- Dati non strutturati ed eterogenei
Di quanta capacità hai bisogno? Considera i tuoi requisiti attuali e futuri.
La capacità deve essere scalata automaticamente in base all'utilizzo?
Quali sono i requisiti di accesso? Ad esempio, i dati devono essere accessibili dall'esterno Google Cloud?
Quali sono i pattern di lettura/scrittura previsti?
Esempi
- Scritture e letture frequenti
- Scritture frequenti, ma letture occasionali
- Scritture e letture occasionali
- Scritture occasionali, ma letture frequenti
Il workload richiede l'accesso basato su file, ad esempio utilizzando NFS?
Più client devono essere in grado di leggere o scrivere dati contemporaneamente?

Identificare i vincoli di sicurezza

Quali sono i tuoi requisiti di crittografia dei dati? Ad esempio, devi utilizzare chiavi che controlli?
Esistono requisiti di residenza dei dati?

Definisci i requisiti di resilienza dei dati

Il tuo workload ha bisogno di una memorizzazione nella cache a bassa latenza o di spazio di lavoro?
Hai bisogno di replicare i dati nel cloud per la ridondanza?
Hai bisogno di una coerenza di lettura/scrittura rigorosa per i set di dati replicati?

Definisci le aspettative di rendimento

Qual è la velocità I/O richiesta?
Di quali livelli di throughput di lettura e scrittura ha bisogno la tua applicazione?
Per quali ambienti hai bisogno di spazio di archiviazione? Per un determinato carico di lavoro, potresti aver bisogno di spazio di archiviazione ad alte prestazioni per l'ambiente di produzione, ma potresti scegliere un'opzione a prestazioni inferiori per gli ambienti non di produzione.

Esaminare le opzioni di archiviazione

Google Cloud offre servizi di archiviazione per tutti i principali formati di archiviazione: a blocchi, di file e di oggetti. Esamina e valuta le funzionalità, le opzioni di progettazione e i vantaggi relativi dei servizi disponibili per ogni formato di archiviazione.

Panoramica

Archiviazione a blocchi

I dati archiviati nell'archiviazione a blocchi sono suddivisi in blocchi, ognuno memorizzato come blocco separato con un indirizzo univoco. Le applicazioni accedono ai dati facendo riferimento agli indirizzi dei blocchi appropriati. L'archiviazione a blocchi è ottimizzata per i carichi di lavoro con IOPS elevati, come l'elaborazione delle transazioni. È simile ai sistemi SAN (Storage Area Network) e DAS (Directly Attached Storage) on-premise.

Le opzioni di archiviazione a blocchi in Google Cloud fanno parte del servizio Compute Engine.

Opzione	Panoramica
Persistent Disk	Unità disco rigido (HDD) e unità a stato solido (SSD) dedicate per applicazioni aziendali e di database di cui è stato eseguito il deployment su VM di Compute Engine e cluster Google Kubernetes Engine (GKE).
Google Cloud Hyperdisk	Spazio di archiviazione di rete veloce e ridondante per le VM di Compute Engine e i cluster GKE, con prestazioni configurabili e volumi ridimensionabili in modo dinamico.
SSD locale	Archiviazione a blocchi temporanea collegata in locale per applicazioni ad alte prestazioni.

Archiviazione di file

I dati sono organizzati e rappresentati in una gerarchia di file archiviati in cartelle, in modo simile all'archiviazione NAS (Network Attached Storage) on-premise. I file system possono essere montati sui client utilizzando protocolli come NFS e Server Message Block (SMB). Le applicazioni accedono ai dati utilizzando il nome file e il percorso della directory pertinenti.

Google Cloud offre una gamma di soluzioni completamente gestite e di terze parti per l'archiviazione dei file.

Soluzione	Panoramica
Filestore	Archiviazione basata su file che utilizza file server NFS per VM Compute Engine e cluster Google Kubernetes Engine. Puoi scegliere un livello di servizio (Basic, Zonal o Regional) adatto al tuo caso d'uso.
Google Cloud Managed Lustre	File system parallelo a bassa latenza per AI, computing ad alte prestazioni (HPC) e applicazioni ad alta intensità di dati.
NetApp Volumes	Archiviazione basata su file tramite NFS o SMB. Puoi scegliere un livello di servizio (Flex, Standard, Premium o Extreme) adatto al tuo caso d'uso.
Altre opzioni	Consulta Riepilogo delle opzioni del file server.

Archiviazione di oggetti

I dati vengono archiviati come oggetti in una gerarchia piatta di bucket. A ogni oggetto viene assegnato un ID univoco globale. Gli oggetti possono avere metadati assegnati dal sistema e definiti dall'utente, per aiutarti a organizzare e gestire i dati. Le applicazioni accedono ai dati facendo riferimento agli ID oggetto, utilizzando le API REST o le librerie client.

Cloud Storage fornisce archiviazione di oggetti a basso costo, a elevata durabilità e senza limiti per diversi tipi di dati. I dati archiviati in Cloud Storage sono accessibili da qualsiasi luogo, all'interno e all'esterno di Google Cloud. La ridondanza facoltativa tra regioni offre la massima affidabilità. Puoi selezionare una classe di archiviazione adatta ai tuoi requisiti di conservazione dei dati e frequenza di accesso.

Analisi comparativa

La seguente tabella elenca le funzionalità chiave dei servizi di archiviazione in Google Cloud.

	Persistent Disk	Hyperdisk	SSD locale	Filestore	Managed Lustre	NetApp Volumes	Cloud Storage
Capacità	Da 10 GiB a 64 TiB per disco Fino a 257 TiB per VM	Da 4 GiB a 64 TiB per disco Fino a 512 TiB per VM Da 10 TiB a 1 PiB per pool di archiviazione	375 GiB per disco Fino a 12 TiB per VM Titanium SSD è un'opzione SSD locale con una capacità maggiore.	1-100 TiB per istanza	Da 18 TiB a 8 PiB	Da 1 TiB a 10 PiB per pool di archiviazione Da 1 GiB a 1 PiB per volume	Nessun limite inferiore o superiore
Scalabilità	Scale up Aggiungere e rimuovere dischi Scalabilità automatica	Scale up	Non scalabile	Di base: scale up A livello di zona e regionale: scale up e scale down	Scalabile	Scale up e scale down	Scalabilità automatica in base all'utilizzo
Condivisione	Supportato	Supportato	Non condivisibile	Montabile su più VM di Compute Engine, client remoti e cluster GKE	Può essere montato su più VM Compute Engine e cluster GKE.	Montabile su più VM di Compute Engine e cluster GKE	Leggere/scrivere ovunque Si integra con Cloud CDN e le CDN di terze parti
Opzioni di chiave di crittografia	Google-owned and Google-managed encryption keys Gestita dal cliente Fornita dal cliente	Google-owned and Google-managed encryption keys Gestita dal cliente Fornita dal cliente	Google-owned and Google-managed encryption keys	Google-owned and Google-managed encryption keys Gestita dal cliente (livelli a livello di zona e di regione)	Google-owned and Google-managed encryption keys	Google-owned and Google-managed encryption keys Gestita dal cliente	Google-owned and Google-managed encryption keys Gestita dal cliente Fornita dal cliente
Persistenza	Durata del disco	Durata del disco	Temporaneo (i dati vengono persi quando la VM viene arrestata o eliminata)	Durata dell'istanza Filestore	Durata dell'istanza Managed Lustre	Durata del volume	Durata del bucket
Disponibilità	A livello di zona Replica tra zone Snapshot (manuali o pianificati) Clonazione di dischi	A livello di zona Clonazione di dischi Replica tra zone	A livello di zona	A livello di zona o di regione in base al livello Snapshot per i livelli a livello di zona e regionale Backup Replica	A livello di zona	Regionale (flessibile) o a livello di zona (tutti i livelli) Backup Snapshot Replica tra regioni	Dati ridondanti tra zone Opzioni per la ridondanza tra regioni
Prestazioni	Scalabilità lineare con dimensioni del disco e numero di CPU	Scalabilità dinamica archiviazione permanente	Spazio di archiviazione scratch ad alte prestazioni	Base: prestazioni costanti A livello di zona e regionale: scalabilità dinamica	Scalabilità lineare con capacità di cui è stato eseguito il provisioning e più opzioni di livello di prestazioni	Prestazioni scalabili Le aspettative dipendono dal livello di servizio	Scalabilità automatica delle velocità di lettura/scrittura e ridistribuzione dinamica del carico Anywhere Cache
Gestione	Formattare e montare manualmente	Formattare e montare manualmente	Formattare, suddividere in strisce e montare manualmente	Completamente gestito	Completamente gestito	Completamente gestito	Completamente gestito

La tabella seguente elenca i tipi di workload per cui è adatta ciascuna opzione di archiviazione: Google Cloud

Opzione di archiviazione	Tipi di workload
Persistent Disk	Applicazioni che utilizzano molte operazioni di I/O al secondo o sensibili alla latenza Database Spazio di archiviazione condiviso di sola lettura Backup rapidi e durevoli delle VM
Hyperdisk	Applicazioni che utilizzano molte operazioni di I/O al secondo o sensibili alla latenza Database Spazio di archiviazione condiviso di sola lettura Backup rapidi e durevoli delle VM Analisi dello scale out
SSD locale	Database ottimizzati per Flash Memorizzazione nella cache ad accesso frequente per l'analisi Disco temporaneo
Filestore	Eseguire la migrazione lift and shift dei file system on-premise File di configurazione condivisi Strumenti e utilità comuni Log centralizzati
Managed Lustre	Workload AI e ML HPC (computing ad alte prestazioni)
NetApp Volumes	Eseguire la migrazione lift and shift dei file system on-premise File di configurazione condivisi Strumenti e utilità comuni Log centralizzati Workload Windows
Cloud Storage	Video in streaming Raccolte di asset multimediali Data lake ad alta velocità effettiva Backup e archivi Contenuti long-tail

Scegliere un'opzione di archiviazione

La selezione di un'opzione di archiviazione si articola in due parti:

Decidere quali servizi di archiviazione ti servono.
Scegliere le funzionalità e le opzioni di progettazione richieste in un determinato servizio.
Esempi di funzionalità e opzioni di design specifiche del servizio
Persistent Disk

Regione e zona di deployment

Replica regionale

Tipo, dimensioni e IOPS del disco (per il disco permanente con carico estremo)

Chiavi di crittografia: di proprietà di Google e gestite da Google, gestite dal cliente o fornite dal cliente

Pianificazione snapshot
Hyperdisk

Zona di deployment

Tipo, dimensioni, throughput (per Hyperdisk Throughput) e IOPS (per Hyperdisk Extreme) del disco

Chiavi di crittografia: di proprietà di Google e gestite da Google, gestite dal cliente o fornite dal cliente

Pianificazione snapshot
Filestore

Regione e zona di deployment

Livello istanza

Capacità

Intervallo IP: allocato automaticamente o personalizzato

Controllo degli accessi
NetApp Volumes

Regione di deployment

Livello di servizio per il pool di archiviazione

Capacità del pool e del volume

Protocollo del volume

Regole di esportazione dei volumi
Cloud Storage

Località: multiregionale, a due regioni, singola regione

Classe di archiviazione: Standard, Nearline, Coldline, Archive

Controllo dell'accesso: uniforme o granulare

Chiavi di crittografia: di proprietà di Google e gestite da Google, gestite dal cliente o fornite dal cliente

Criterio di conservazione

Suggerimenti per lo spazio di archiviazione

Utilizza i seguenti consigli come punto di partenza per scegliere i servizi e le funzionalità di archiviazione che soddisfano i tuoi requisiti. Per indicazioni specifiche per i workload AI e ML, consulta Progettare l'archiviazione per i workload AI e ML in Google Cloud.

Più avanti in questo documento vengono presentati anche consigli generali per l'archiviazione sotto forma di albero decisionale.

Per le applicazioni che richiedono un file system parallelo, utilizza Managed Lustre.

Per le applicazioni che richiedono l'accesso basato su file, scegli un servizio di archiviazione di file adatto in base ai tuoi requisiti per protocollo di accesso, disponibilità e prestazioni.

Protocollo di accesso	Consiglio
NFS	Se hai bisogno di disponibilità regionale e prestazioni elevate che scalano in base alla capacità, utilizza Filestore regionale. Se la disponibilità a livello di zona è sufficiente, ma hai bisogno di prestazioni elevate che si adattino alla capacità, utilizza Filestore Zonal o NetApp Volumes Premium o Extreme. Altrimenti, utilizza Filestore Basic o NetApp Volumes. Per informazioni sulle differenze tra i livelli di servizio di Filestore, consulta Livelli di servizio.
SMB	Utilizza NetApp Volumes.

Protocollo di accesso

Consiglio

NFS

Se hai bisogno di disponibilità regionale e prestazioni elevate che scalano in base alla capacità, utilizza Filestore regionale.
Se la disponibilità a livello di zona è sufficiente, ma hai bisogno di prestazioni elevate che si adattino alla capacità, utilizza Filestore Zonal o NetApp Volumes Premium o Extreme.
Altrimenti, utilizza Filestore Basic o NetApp Volumes.

Per informazioni sulle differenze tra i livelli di servizio di Filestore, consulta Livelli di servizio.

SMB

Utilizza NetApp Volumes.

Per i workload che richiedono spazio di archiviazione primario con prestazioni elevate, utilizza Hyperdisk, SSD locale o Persistent Disk a seconda dei tuoi requisiti.

Requisito Consiglio

Disco temporaneo rapido o cache Utilizza dischi SSD locali (temporanei).

Archiviazione a blocchi con prestazioni e capacità scalabili in modo indipendente

Requisito	Consiglio
Disco temporaneo rapido o cache	Utilizza dischi SSD locali (temporanei).
Archiviazione a blocchi con prestazioni e capacità scalabili in modo indipendente	Utilizza Hyperdisk. Scegli un tipo di disco appropriato in base ai tuoi requisiti: Carichi di lavoro per uso generico: `hyperdisk-balanced` Workload con I/O elevato, come database ad alte prestazioni: `hyperdisk-extreme` Analisi dello scale out, unità di dati per app sensibili ai costi e spazio di archiviazione inattivo: `hyperdisk-throughput` Carichi di lavoro ML che richiedono un'elevata velocità effettiva a più VM in modalità di sola lettura: `hyperdisk-ml` in modalità di sola lettura Più VM all'interno di una regione con accesso in scrittura simultaneo allo stesso disco: `hyperdisk-balanced-high-availability` in modalità multi-writer Per saperne di più, consulta Informazioni su Google Cloud Hyperdisk.
Archiviazione a blocchi con capacità scalabile	Utilizza Persistent Disk. Scegli un tipo di disco appropriato in base ai tuoi requisiti: IOPS sequenziali: `pd-standard` Workload ad alta intensità di IOPS: `pd-extreme` o `pd-ssd` Equilibrio tra rendimento e costi: `pd-balanced` Per saperne di più, consulta la pagina Informazioni su Persistent Disk.

Utilizza Hyperdisk. Scegli un tipo di disco appropriato in base ai tuoi requisiti:

Carichi di lavoro per uso generico: hyperdisk-balanced
Workload con I/O elevato, come database ad alte prestazioni: hyperdisk-extreme
Analisi dello scale out, unità di dati per app sensibili ai costi e spazio di archiviazione inattivo: hyperdisk-throughput
Carichi di lavoro ML che richiedono un'elevata velocità effettiva a più VM in modalità di sola lettura: hyperdisk-ml in modalità di sola lettura
Più VM all'interno di una regione con accesso in scrittura simultaneo allo stesso disco: hyperdisk-balanced-high-availability in modalità multi-writer

Per saperne di più, consulta Informazioni su Google Cloud Hyperdisk.

Archiviazione a blocchi con capacità scalabile

Utilizza Persistent Disk. Scegli un tipo di disco appropriato in base ai tuoi requisiti:

IOPS sequenziali: pd-standard
Workload ad alta intensità di IOPS: pd-extreme o pd-ssd
Equilibrio tra rendimento e costi: pd-balanced

Per saperne di più, consulta la pagina Informazioni su Persistent Disk.

A seconda dei tuoi requisiti di ridondanza, scegli tra dischi a livello di zona e a livello di regione.

Requisito	Consiglio
Ridondanza all'interno di una singola zona di una regione	Utilizza Hyperdisk o Persistent Disk a livello di zona.
Ridondanza in più zone all'interno di una regione	Utilizza Hyperdisk ad alta affidabilità o Persistent Disk a livello regionale.

Per uno spazio di archiviazione scalabile e disponibile a livello globale, utilizza Cloud Storage.

A seconda della frequenza di accesso ai dati e della durata dell'archiviazione, scegli una classe di Cloud Storage adatta.

Requisito	Consiglio>
La frequenza di accesso varia o il periodo di conservazione dei dati è sconosciuto o non prevedibile.	Utilizza la funzionalità Autoclass per trasferire automaticamente gli oggetti di un bucket alle classi di archiviazione appropriate in base al pattern di accesso di ciascun oggetto.
Archiviazione per i dati ad accesso frequente, inclusi quelli per analisi ad alto throughput, data lake, siti web, video in streaming e app mobile.	Utilizza la classe di archiviazione Standard. Per memorizzare nella cache i dati a cui si accede di frequente e pubblicarli da località vicine ai client, utilizza Cloud CDN. Per i workload con molte letture, modifiche dei dati poco frequenti e letture frequenti (come l'addestramento, l'inferenza e l'analisi ML), puoi migliorare le prestazioni di lettura e ridurre i costi di trasferimento dei dati utilizzando Anywhere Cache.
Archiviazione a basso costo per dati ad accesso non frequente che possono essere archiviati per almeno 30 giorni (ad esempio, backup e contenuti multimediali long-tail).	Utilizza la classe di archiviazione Nearline.
Archiviazione a basso costo per dati ad accesso non frequente che possono essere archiviati per almeno 90 giorni (ad esempio, ripristino di emergenza).	Utilizza la classe di archiviazione Coldline.
Spazio di archiviazione al costo più basso per i dati ad accesso non frequente che possono essere archiviati per almeno 365 giorni, inclusi gli archivi normativi.	Utilizza la classe di archiviazione Archive.

Per un'analisi comparativa dettagliata, consulta la sezione Classi di Cloud Storage.

Opzioni di trasferimento dei dati

Dopo aver scelto i servizi di archiviazione Google Cloud appropriati, per eseguire il deployment e l'esecuzione dei carichi di lavoro, devi trasferire i dati a Google Cloud. I dati che devi trasferire potrebbero esistere on-premise o su altre piattaforme cloud.

Puoi utilizzare i seguenti metodi per trasferire i dati a Google Cloud:

Trasferisci i dati online utilizzando Storage Transfer Service: automatizza il trasferimento di grandi quantità di dati tra sistemi di archiviazione di oggetti e file, tra cui Cloud Storage, Amazon S3, servizi di archiviazione Azure e origini dati on-premise.
Trasferisci i dati offline utilizzando Transfer Appliance: trasferisci e carica grandi quantità di dati offline su Google Cloud in situazioni in cui la connettività di rete e la larghezza di banda non sono disponibili, sono limitate o costose.
Carica dati in Cloud Storage: carica i dati online nei bucket Cloud Storage utilizzando la console Google Cloud , gcloud CLI, le API Cloud Storage o le librerie client.

Quando scegli un metodo di trasferimento dei dati, considera fattori come le dimensioni dei dati, i vincoli di tempo, la disponibilità di larghezza di banda, gli obiettivi di costo e i requisiti di sicurezza e conformità. Per informazioni sulla pianificazione e l'implementazione dei trasferimenti di dati a Google Cloud, consulta Eseguire la migrazione a Google Cloud: trasferire i set di dati di grandi dimensioni.

Albero decisionale delle opzioni di archiviazione

Il seguente diagramma della struttura decisionale ti guida attraverso i Google Cloud suggerimenti per lo spazio di archiviazione discussi in precedenza. Per indicazioni specifiche per i workload AI e ML, consulta Progettare lo spazio di archiviazione per i workload AI e ML in Google Cloud.

Visualizzare un'immagine più grande

Albero decisionale per selezionare una strategia di archiviazione.

Passaggi successivi

Stima il costo dello spazio di archiviazione utilizzando il Calcolatore prezzi diGoogle Cloud .
Scopri le best practice per creare una topologia cloud ottimizzata per sicurezza, resilienza, costi e prestazioni.
Scopri quando utilizzare file system paralleli come Lustre per i carichi di lavoro HPC.

Collaboratori

Autore: Kumar Dhanagopal | Sviluppatore di soluzioni cross-prodotto

Altri collaboratori:

Brennan Doyle | Solutions Architect
Dean Hildebrand | Technical Director, Office of the CTO
Geoffrey Noer | Group Product Manager
Jack Zhou | Technical Writer
Jason Wu | Director, Product Management
Jeff Allen | Solutions Architect
Samantha He | Technical Writer
Sean Derrington | Group Product Manager, Storage