Questa pagina spiega come creare un backup di un servizio Dataproc Metastore.
Un backup acquisisce uno snapshot del servizio, salva le impostazioni di configurazione correnti e tutti i metadati archiviati.
Dopo aver creato un backup, puoi utilizzare la funzionalità Ripristina da un backup per popolare un nuovo servizio Dataproc Metastore con i dati salvati nello snapshot.
Prima di iniziare
- Abilita Dataproc Metastore nel tuo progetto.
- Crea un servizio Dataproc Metastore.
- (Facoltativo) Importa i metadati in Dataproc Metastore.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per eseguire il backup di un servizio Dataproc Metastore, chiedi all'amministratore di concederti i seguenti ruoli IAM:
-
Per concedere il controllo completo delle risorse Dataproc Metastore per completare un backup, è necessario:
-
Editor Dataproc Metastore (
roles/metastore.editor
) sul servizio di metadati. -
Amministratore Dataproc Metastore (
roles/metastore.admin
) sul progetto.
-
Editor Dataproc Metastore (
-
Per concedere l'accesso in lettura e modifica a metadati specifici di database e tabelle:
Dataproc Metastore Metadata Operator (
roles/metastore.metadataOperator
) sul servizio di metadati -
Per utilizzare l'oggetto Cloud Storage che archivia i backup pianificati:
Utente oggetto Cloud Storage (
roles/storage.objectUser
) nell'agente di servizio Dataproc Metastore
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Questi ruoli predefiniti contengono le autorizzazioni necessarie per eseguire il backup di un servizio Dataproc Metastore. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per eseguire il backup di un servizio Dataproc Metastore sono necessarie le seguenti autorizzazioni:
-
Per eseguire il backup di un servizio di metadati:
metastore.backups.create
-
Per utilizzare l'oggetto Cloud Storage:
-
orgpolicy.policy.get
-
resourcemanager.projects.get
-
resourcemanager.projects.list
-
storage.managedFolders.create
-
storage.managedFolders.delete
-
storage.managedFolders.get
-
storage.managedFolders.list
-
storage.multipartUploads.*
-
storage.objects.create
-
storage.objects.delete
-
storage.objects.get
-
storage.objects.list
-
storage.objects.restore
-
storage.objects.update
-
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Per ulteriori informazioni su ruoli e autorizzazioni specifici di Dataproc Metastore, consulta la panoramica di IAM di Dataproc Metastore.Considerazioni sul backup
Prima di eseguire un'operazione di backup, tieni presente quanto segue:
- Per ogni servizio Dataproc Metastore, puoi creare e archiviare fino a sette backup alla volta. Se provi a superare i sette backup, la procedura di backup non va a buon fine. Se vuoi creare un altro backup, devi prima eliminare manualmente uno dei file di backup archiviati.
- Mentre è in esecuzione un'operazione di backup, non puoi aggiornare il servizio Dataproc Metastore, ad esempio non puoi modificare le impostazioni di configurazione. Tuttavia, puoi comunque utilizzare il servizio per le normali operazioni, ad esempio l'accesso ai metadati dai cluster Dataproc o autogestiti collegati.
- Puoi creare backup pianificati che vengono eseguiti a vari intervalli cron, ad esempio ogni giorno.
Crea backup
Per eseguire il backup di un servizio Dataproc Metastore, completa i passaggi in una delle seguenti schede:
Console
Nella console Google Cloud , apri la pagina Dataproc Metastore:
Nella pagina Dataproc Metastore, fai clic sul nome del servizio di cui vuoi eseguire il backup.
Viene visualizzata la pagina Dettagli del servizio.
Figura 1. La pagina dei dettagli del servizio Dataproc Metastore Nella parte superiore della pagina, fai clic su Backup.
Si apre la pagina Backup.
Inserisci il nome del backup.
(Facoltativo) Inserisci una Descrizione del backup.
Per avviare l'operazione di backup, fai clic su Backup.
Torna alla pagina Dataproc Metastore e verifica che il backup del servizio sia stato eseguito correttamente.
Al termine del backup, Dataproc Metastore torna automaticamente allo stato attivo indipendentemente dal fatto che il backup sia riuscito o meno.
Interfaccia a riga di comando gcloud
Per eseguire il backup di un servizio Dataproc Metastore, esegui il seguente comando
gcloud metastore services backups create
:gcloud metastore services backups create BACKUP \ --location=LOCATION \ --service=SERVICE \ --description=DESCRIPTION
Sostituisci quanto segue:
BACKUP
: l'ID o l'identificatore completo del backup.LOCATION
: la Google Cloud regione in cui risiede il servizio Dataproc Metastore.SERVICE
: il nome del servizio Dataproc Metastore.DESCRIPTION
: una descrizione del backup.
Verifica che il servizio sia stato sottoposto a backup correttamente.
Al termine del backup, Dataproc Metastore torna automaticamente allo stato attivo indipendentemente dal fatto che il backup sia riuscito o meno.
REST
Segui le istruzioni dell'API per eseguire il backup dei metadati da un servizio utilizzando Explorer API.
Al termine del backup, Dataproc Metastore torna automaticamente allo stato attivo indipendentemente dall'esito positivo o negativo del backup.
Visualizzare la cronologia dei backup
Per visualizzare la cronologia dei backup di un servizio Dataproc Metastore nella console Google Cloud , completa i seguenti passaggi:
- Nella console Google Cloud , apri la pagina Dataproc Metastore.
Nella barra di navigazione, fai clic su Backup/Restore (Backup/Ripristino).
La cronologia dei backup viene visualizzata in una tabella nella sezione Backup.
La cronologia mostra fino agli ultimi 7 backup.
Se elimini un servizio Dataproc Metastore, viene eliminata anche tutta la cronologia dei backup associata.
Eliminare un backup
Per eliminare un backup di Dataproc Metastore nella console Google Cloud , completa i seguenti passaggi:
- Nella console Google Cloud , apri la pagina Dataproc Metastore.
- Nella barra di navigazione, fai clic su Backup/Restore (Backup/Ripristino).
- Trova il backup da eliminare e fai clic sul pulsante delle impostazioni.
- Fai clic su Elimina.
Pianificare un backup
I backup possono essere pianificati per essere eseguiti a intervalli di cron job specificati dall'utente, inclusa l'esecuzione giornaliera, settimanale o mensile. Una pianificazione cron utilizza il formato stringa unix-cron (* * * * *) che è un insieme di cinque campi in una riga, che indicano quando il job deve essere eseguito.
Ad esempio, puoi impostare un intervallo personalizzato per creare un backup ogni settimana, ad esempio ogni mercoledì alle 14:00 PST.
Considerazioni sul backup pianificato
- I backup pianificati devono specificare una posizione di backup, che deve essere un percorso Cloud Storage.
- I backup pianificati vengono sempre creati nel formato di file Avro.
- Per impostazione predefinita, i backup pianificati vengono configurati nel fuso orario UTC. Puoi modificare il fuso orario quando crei il backup per la prima volta.
- I backup pianificati possono essere impostati per essere eseguiti a intervalli orari, giornalieri, settimanali o mensili. L'intervallo orario minimo che puoi impostare è di 4 ore.
Creare un backup pianificato
Le pianificazioni dei backup possono essere impostate quando crei il servizio per la prima volta o aggiunte in un secondo momento quando aggiorni il servizio.
Per creare un servizio Dataproc Metastore 2 con un backup pianificato, completa i passaggi in una delle seguenti schede:
Console
Nella console Google Cloud , apri la pagina Dataproc Metastore.
Nella parte superiore della pagina Dataproc Metastore, fai clic sul pulsante Crea.
Viene visualizzata la pagina Crea servizio.
Seleziona Dataproc Metastore 2.
In Backup pianificati, imposta il pulsante di attivazione/disattivazione su Attiva.
In Posizione, seleziona la località di Cloud Storage in cui vuoi archiviare il backup pianificato.
(Facoltativo) In Pianificazione, seleziona quanto segue:
- Per Si ripete, seleziona la ricorrenza, ad esempio Ogni giorno o Ogni settimana.
- Per All'ora, seleziona l'ora di ricorrenza, ad esempio 00:00.
- Per Fuso orario, seleziona il fuso orario appropriato, ad esempio UTC-8.
Per le restanti opzioni di configurazione del servizio, utilizza i valori predefiniti forniti.
Fai clic su Invia.
Interfaccia a riga di comando gcloud
Per pianificare un backup di un servizio Dataproc Metastore, esegui il seguente comando
gcloud metastore services backups create
:gcloud metastore services create SERVICE \ --location=LOCATION \ --enable-scheduled-backup \ --scheduled-backup-cron=SCHEDULED_BACKUP_CRON \ --scheduled-backup-location=SCHEDULED_BACKUP_LOCATION
Sostituisci quanto segue:
SERVICE
: l'ID o l'identificatore completo del backup.LOCATION
: la Google Cloud regione in cui risiede il servizio Dataproc Metastore.SCHEDULED_BACKUP_CRON
: la frequenza del backup, specificata nel formato dell'ora cron. Ad esempio, un valore cron di0 0 * * *
pianifica un backup giornaliero.SCHEDULED_BACKUP_LOCATION
: la posizione Cloud Storage del backup. Ad esempio:gs://my-bucket/path/to/location
.
o
Puoi anche pianificare un backup memorizzando i valori precedenti in un file di configurazione:
gcloud metastore services create SERVICE \ --location=LOCATION \ --scheduled-backup-configs-from-file=SCHEDULED_BACKUP_CONFIGS_FROM_FILE
Sostituisci quanto segue:
SCHEDULED_BACKUP_CONFIGS_FROM_FILE
: un percorso a un file JSON contenente i valori di configurazione del backupenabled
,cront_schedule
,time_zone
ebackup_location
.
L'esempio seguente mostra un file di configurazione del backup che attiva i backup pianificati, imposta la pianificazione del backup su ogni ora, specifica il fuso orario PST e definisce la posizione del backup come bucket Cloud Storage. Puoi scegliere i fusi orari dall'elenco dei fusi orari del database tz comuni.
{ "enabled": true, "cron_schedule": "0 0 * * *", "time_zone": "PST", "backup_location": "gs://my-bucket/path/to/location" }
REST
Segui le istruzioni dell'API per creare un backup pianificato utilizzando Explorer API.
Aggiornare un backup pianificato
Per aggiornare un servizio Dataproc Metastore 2 configurato con un backup pianificato, completa i passaggi in una delle seguenti schede:
Console
Nella console Google Cloud , apri la pagina Dataproc Metastore.
Nella pagina Dataproc Metastore, fai clic sul nome del servizio per cui vuoi pianificare un backup.
In Backup pianificati, imposta il pulsante di attivazione/disattivazione su Attivato.
In Posizione, seleziona la località di Cloud Storage in cui vuoi archiviare il backup pianificato.
(Facoltativo) In Pianificazione, seleziona i valori per i seguenti campi:
- Per Si ripete, seleziona la ricorrenza, ad esempio Ogni giorno o Ogni settimana.
- Per All'ora, seleziona l'ora di ricorrenza, ad esempio 00:00.
- Per Fuso orario, seleziona il fuso orario appropriato, ad esempio UTC-8.
Interfaccia a riga di comando gcloud
Per pianificare un backup di un servizio Dataproc Metastore, esegui il seguente comando
gcloud metastore services backups update
:gcloud metastore services update SERVICE \ --location=LOCATION \ --enable-scheduled-backup \ --scheduled-backup-cron=SCHEDULED_BACKUP_CRON \ --scheduled-backup-location=SCHEDULED_BACKUP_LOCATION \
Sostituisci quanto segue:
SERVICE
: l'ID o l'identificatore completo del backup pianificato.LOCATION
: la Google Cloud regione in cui risiede il servizio Dataproc Metastore.SCHEDULED_BACKUP_CRON
: la frequenza del backup, specificata nel formato dell'ora cron. Ad esempio, un valore cron di0 0 * * *
pianifica un backup giornaliero.SCHEDULED_BACKUP_LOCATION
: la posizione Cloud Storage del backup pianificato. Ad esempio:gs://my-bucket/path/to/location
.
Puoi anche aggiornare un backup pianificato utilizzando i valori precedenti archiviati in un file di configurazione:
gcloud metastore services update SERVICE \ --location=LOCATION \ --scheduled-backup-configs-from-file=SCHEDULED_BACKUP_CONFIGS_FROM_FILE
Sostituisci quanto segue:
SCHEDULED_BACKUP_CONFIGS_FROM_FILE
: un percorso a un file JSON contenente la configurazione di backup.
L'esempio seguente mostra un file di configurazione di backup che disattiva un backup pianificato.
{ "enabled": false, }
REST
Segui le istruzioni dell'API per aggiornare un backup pianificato utilizzando Explorer API.
Visualizzare un backup pianificato
Per visualizzare un servizio Dataproc Metastore 2 configurato con un backup pianificato, completa i passaggi in una delle seguenti schede:
Console
Nella console Google Cloud , apri la pagina Dataproc Metastore.
Nella parte superiore della pagina, fai clic su Backup.
Si apre la pagina Backup, che mostra i backup pianificati. Tieni presente che i backup vengono effettivamente archiviati nel bucket Cloud Storage che hai fornito nella configurazione del backup pianificato.
Interfaccia a riga di comando gcloud
Esegui questo comando
gcloud storage ls
:gcloud storage ls gs://BUCKET_NAME/SERVICE/LOCATION
Sostituisci quanto segue:
BUCKET_NAME
: il percorso del bucket Cloud Storage che archivia il backup pianificato che vuoi visualizzare.SERVICE
: l'ID o l'identificatore completo del backup pianificato.LOCATION
: la Google Cloud regione in cui si trova il servizio Dataproc Metastore.
REST
Segui le istruzioni dell'API per visualizzare un backup pianificato utilizzando Explorer API.
Risolvere i problemi comuni
- L'agente di servizio o l'account utente non dispone delle autorizzazioni necessarie.
- Per ulteriore assistenza nella risoluzione dei problemi comuni, consulta Scenari di errore di backup e ripristino.
Passaggi successivi
- Ripristina un servizio Dataproc Metastore da un backup
- Aggiorna ed elimina un servizio Dataproc Metastore