En esta página, se explica cómo crear una copia de seguridad de un servicio de Dataproc Metastore.
Una copia de seguridad toma una instantánea de tu servicio, guarda su configuración actual y todos los metadatos almacenados.
Después de crear una copia de seguridad, puedes usar la función Restablecer desde una copia de seguridad para propagar un nuevo servicio de Dataproc Metastore con los datos guardados en la instantánea.
Antes de comenzar
- Habilita Dataproc Metastore en tu proyecto.
- Crea un servicio de Dataproc Metastore.
- Opcional: Importa metadatos a Dataproc Metastore.
Roles obligatorios
Para obtener los permisos que necesitas para crear una copia de seguridad de un servicio de Dataproc Metastore, pídele a tu administrador que te otorgue los siguientes roles de IAM:
-
Para otorgar control total de los recursos de Dataproc Metastore para completar una copia de seguridad, se debe cumplir con una de las siguientes condiciones:
-
Editor de Dataproc Metastore (
roles/metastore.editor
) en el servicio de metadatos -
Administrador de Dataproc Metastore (
roles/metastore.admin
) en el proyecto
-
Editor de Dataproc Metastore (
-
Para otorgar acceso de lectura y modificación a metadatos específicos de bases de datos y tablas, haz lo siguiente:
Operador de metadatos de Dataproc Metastore (
roles/metastore.metadataOperator
) en el servicio de metadatos -
Para usar el objeto de Cloud Storage que almacena copias de seguridad programadas, haz lo siguiente:
Usuario de objeto de Cloud Storage (
roles/storage.objectUser
) en el agente de servicio de Dataproc Metastore
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Estos roles predefinidos contienen los permisos necesarios para crear copias de seguridad de un servicio de Dataproc Metastore. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para crear una copia de seguridad de un servicio de Dataproc Metastore:
-
Para crear una copia de seguridad de un servicio de metadatos, haz lo siguiente:
metastore.backups.create
-
Para usar el objeto de Cloud Storage, haz lo siguiente:
-
orgpolicy.policy.get
-
resourcemanager.projects.get
-
resourcemanager.projects.list
-
storage.managedFolders.create
-
storage.managedFolders.delete
-
storage.managedFolders.get
-
storage.managedFolders.list
-
storage.multipartUploads.*
-
storage.objects.create
-
storage.objects.delete
-
storage.objects.get
-
storage.objects.list
-
storage.objects.restore
-
storage.objects.update
-
También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.
Para obtener más información sobre los roles y permisos específicos de Dataproc Metastore, consulta la Descripción general de IAM de Dataproc Metastore.Consideraciones sobre las copias de seguridad
Antes de ejecutar una operación de copia de seguridad, ten en cuenta las siguientes consideraciones:
- Para cada servicio de Dataproc Metastore, puedes crear y almacenar hasta siete copias de seguridad a la vez. Si intentas superar las siete copias de seguridad, el proceso fallará. Si quieres crear otra copia de seguridad, primero debes borrar manualmente uno de los archivos de copia de seguridad almacenados.
- Mientras se ejecuta una operación de copia de seguridad, no puedes actualizar tu servicio de Dataproc Metastore. Por ejemplo, no puedes cambiar la configuración. Sin embargo, puedes seguir usando tu servicio para las operaciones normales, como acceder a los metadatos de los clústeres de Dataproc o autoadministrados adjuntos.
- Puedes crear copias de seguridad programadas que se ejecuten en varios intervalos de cron, como todos los días.
Crear una copia de seguridad
Para crear una copia de seguridad de un servicio de Dataproc Metastore, completa los pasos que se indican en una de las siguientes pestañas:
Console
En la Google Cloud consola, abre la página Dataproc Metastore:
En la página Dataproc Metastore, haz clic en el nombre del servicio del que deseas crear una copia de seguridad.
Se abrirá la página Detalles del servicio.
Figura 1: La página de detalles del servicio de Dataproc Metastore Haz clic en Copia de seguridad en la parte superior de la página.
Se abrirá la página Copia de seguridad.
Ingresa el nombre de la copia de seguridad.
Opcional: Ingresa una descripción de la copia de seguridad.
Para iniciar la operación de copia de seguridad, haz clic en Copia de seguridad.
Regresa a la página Dataproc Metastore y verifica que se haya creado correctamente la copia de seguridad de tu servicio.
Cuando se completa la copia de seguridad, Dataproc Metastore vuelve automáticamente al estado activo, independientemente de si la copia de seguridad se realizó correctamente o no.
gcloud CLI
Para crear una copia de seguridad de un servicio de Dataproc Metastore, ejecuta el siguiente comando de
gcloud metastore services backups create
:gcloud metastore services backups create BACKUP \ --location=LOCATION \ --service=SERVICE \ --description=DESCRIPTION
Reemplaza lo siguiente:
BACKUP
: Es el ID o el identificador completamente calificado de la copia de seguridad.LOCATION
: Es la región en la que reside tu servicio de Dataproc Metastore. Google CloudSERVICE
: Es el nombre de tu servicio de Dataproc Metastore.DESCRIPTION
: Es una descripción de tu copia de seguridad.
Verifica que se haya creado correctamente la copia de seguridad de tu servicio.
Cuando se completa la copia de seguridad, Dataproc Metastore vuelve automáticamente al estado activo, independientemente de si la copia de seguridad se realizó correctamente o no.
REST
Sigue las instrucciones de la API para crear una copia de seguridad de los metadatos de un servicio con el Explorador de APIs.
Cuando se completa la copia de seguridad, Dataproc Metastore vuelve automáticamente al estado activo, independientemente de si la copia de seguridad se realizó correctamente o no.
Cómo ver el historial de copias de seguridad
Para ver el historial de copias de seguridad de un servicio de Dataproc Metastore en la consola de Google Cloud , completa los siguientes pasos:
- En la Google Cloud consola, abre la página Dataproc Metastore.
En la barra de navegación, haz clic en Backup/Restore.
Tu historial de copias de seguridad aparecerá en una tabla en Copias de seguridad.
En el historial, se muestran hasta las 7 copias de seguridad más recientes.
Borrar un servicio de Dataproc Metastore también borra todo el historial de copias de seguridad asociado.
Borrar una copia de seguridad
Para borrar una copia de seguridad de Dataproc Metastore en la consola de Google Cloud , completa los siguientes pasos:
- En la Google Cloud consola, abre la página Dataproc Metastore.
- En la barra de navegación, haz clic en Backup/Restore.
- Busca la copia de seguridad que deseas borrar y haz clic en el botón de configuración.
- Haz clic en Borrar.
Cómo programar una copia de seguridad
Las copias de seguridad se pueden programar para que se ejecuten en intervalos de trabajos cron especificados por el usuario, incluida la ejecución diaria, semanal o mensual. Un programa cron usa el formato de cadena unix-cron (* * * * *), que es un conjunto de cinco campos en una línea que indican cuándo se debe ejecutar el trabajo.
Por ejemplo, puedes establecer un intervalo personalizado para crear una copia de seguridad todas las semanas, como crear una copia de seguridad todos los miércoles a las 2:00 p.m. (hora del Pacífico).
Consideraciones sobre las copias de seguridad programadas
- Las copias de seguridad programadas deben especificar una ubicación, que debe ser una ruta de acceso de Cloud Storage.
- Las copias de seguridad programadas siempre se crean en formato de archivo Avro.
- De forma predeterminada, las copias de seguridad programadas se configuran en la zona horaria UTC. Puedes cambiar la zona horaria cuando creas la copia de seguridad por primera vez.
- Las copias de seguridad programadas se pueden configurar para que se ejecuten en intervalos por hora, diarios, semanales o mensuales. El intervalo mínimo por hora que puedes establecer es de 4 horas.
Crea una copia de seguridad programada
Puedes establecer programas de copias de seguridad cuando crees tu servicio por primera vez o agregarlos más adelante cuando lo actualices.
Para crear un servicio de Dataproc Metastore 2 con una copia de seguridad programada, completa los pasos que se indican en una de las siguientes pestañas:
Console
En la Google Cloud consola, abre la página Dataproc Metastore.
En la parte superior de la página Dataproc Metastore haz clic en el botón Crear.
Se abrirá la página Crear servicio.
Selecciona Dataproc Metastore 2.
En Scheduled Backups, establece el botón de activación en Enable.
En Ubicación, selecciona la ubicación de Cloud Storage en la que deseas almacenar la copia de seguridad programada.
Opcional: En Programar, selecciona lo siguiente:
- En Repeticiones, selecciona la recurrencia, como Diariamente o Semanalmente.
- En A la hora, selecciona la hora de recurrencia, por ejemplo, las 12 a.m.
- En Zona horaria, selecciona la zona horaria adecuada, como UTC-8.
Para las demás opciones de configuración del servicio, usa los valores predeterminados proporcionados.
Haz clic en Enviar.
gcloud CLI
Para programar una copia de seguridad de un servicio de Dataproc Metastore, ejecuta el siguiente comando de
gcloud metastore services backups create
:gcloud metastore services create SERVICE \ --location=LOCATION \ --enable-scheduled-backup \ --scheduled-backup-cron=SCHEDULED_BACKUP_CRON \ --scheduled-backup-location=SCHEDULED_BACKUP_LOCATION
Reemplaza lo siguiente:
SERVICE
: Es el ID o el identificador completamente calificado de la copia de seguridad.LOCATION
: Es la región de Google Cloud en la que reside tu servicio de Dataproc Metastore.SCHEDULED_BACKUP_CRON
: Es la frecuencia de tu copia de seguridad, especificada en el formato de hora cron. Por ejemplo, un valor cron de0 0 * * *
programa una copia de seguridad diaria.SCHEDULED_BACKUP_LOCATION
: Es la ubicación de Cloud Storage de tu copia de seguridad. Por ejemplo:gs://my-bucket/path/to/location
.
o
También puedes programar una copia de seguridad almacenando los valores anteriores en un archivo de configuración:
gcloud metastore services create SERVICE \ --location=LOCATION \ --scheduled-backup-configs-from-file=SCHEDULED_BACKUP_CONFIGS_FROM_FILE
Reemplaza lo siguiente:
SCHEDULED_BACKUP_CONFIGS_FROM_FILE
: Es la ruta de acceso a un archivo JSON que contiene los valores de configuración de la copia de seguridadenabled
,cront_schedule
,time_zone
ybackup_location
.
En el siguiente ejemplo, se muestra un archivo de configuración de copias de seguridad que habilita las copias de seguridad programadas, establece el programa de copias de seguridad cada hora, especifica la zona horaria como PST y define la ubicación de la copia de seguridad como un bucket de Cloud Storage. Puedes elegir zonas horarias de la lista de zonas horarias de bases de datos tz comunes.
{ "enabled": true, "cron_schedule": "0 0 * * *", "time_zone": "PST", "backup_location": "gs://my-bucket/path/to/location" }
REST
Sigue las instrucciones de la API para crear una copia de seguridad programada con el Explorador de APIs.
Actualiza una copia de seguridad programada
Para actualizar un servicio de Dataproc Metastore 2 configurado con una copia de seguridad programada, completa los pasos en una de las siguientes pestañas:
Console
En la Google Cloud consola, abre la página Dataproc Metastore.
En la página Dataproc Metastore, haz clic en el nombre del servicio para el que deseas programar una copia de seguridad.
En Copias de seguridad programadas, establece el botón de activación en Habilitado.
En Ubicación, selecciona la ubicación de Cloud Storage en la que deseas almacenar la copia de seguridad programada.
Opcional: En Programación, selecciona valores para los siguientes campos:
- En Repeticiones, selecciona la recurrencia, como Diariamente o Semanalmente.
- En A la hora, selecciona la hora de recurrencia, por ejemplo, las 12 a.m.
- En Zona horaria, selecciona la zona horaria adecuada, como UTC-8.
gcloud CLI
Para programar una copia de seguridad de un servicio de Dataproc Metastore, ejecuta el siguiente comando de
gcloud metastore services backups update
:gcloud metastore services update SERVICE \ --location=LOCATION \ --enable-scheduled-backup \ --scheduled-backup-cron=SCHEDULED_BACKUP_CRON \ --scheduled-backup-location=SCHEDULED_BACKUP_LOCATION \
Reemplaza lo siguiente:
SERVICE
: Es el ID o el identificador completamente calificado de la copia de seguridad programada.LOCATION
: Es la región en la que reside tu servicio de Dataproc Metastore. Google CloudSCHEDULED_BACKUP_CRON
: Es la frecuencia de tu copia de seguridad, especificada en el formato de hora cron. Por ejemplo, un valor cron de0 0 * * *
programa una copia de seguridad diaria.SCHEDULED_BACKUP_LOCATION
: Es la ubicación de Cloud Storage de tu copia de seguridad programada. Por ejemplo:gs://my-bucket/path/to/location
.
También puedes actualizar una copia de seguridad programada con los valores anteriores almacenados en un archivo de configuración:
gcloud metastore services update SERVICE \ --location=LOCATION \ --scheduled-backup-configs-from-file=SCHEDULED_BACKUP_CONFIGS_FROM_FILE
Reemplaza lo siguiente:
SCHEDULED_BACKUP_CONFIGS_FROM_FILE
: Es la ruta de acceso a un archivo JSON que contiene la configuración de la copia de seguridad.
En el siguiente ejemplo, se muestra un archivo de configuración de copia de seguridad que inhabilita una copia de seguridad programada.
{ "enabled": false, }
REST
Sigue las instrucciones de la API para actualizar una copia de seguridad programada con el Explorador de APIs.
Cómo ver una copia de seguridad programada
Para ver un servicio de Dataproc Metastore 2 configurado con una copia de seguridad programada, completa los pasos que se indican en una de las siguientes pestañas:
Console
En la Google Cloud consola, abre la página Dataproc Metastore.
Haz clic en Copia de seguridad en la parte superior de la página.
Se abrirá la página Copia de seguridad, en la que se mostrarán las copias de seguridad programadas. Ten en cuenta que las copias de seguridad se almacenan en el bucket de Cloud Storage que proporcionaste en la configuración de la copia de seguridad programada.
gcloud CLI
Ejecuta el siguiente comando
gcloud storage ls
:gcloud storage ls gs://BUCKET_NAME/SERVICE/LOCATION
Reemplaza lo siguiente:
BUCKET_NAME
: Es la ruta de acceso al bucket de Cloud Storage que almacena la copia de seguridad programada que deseas ver.SERVICE
: Es el ID o el identificador completamente calificado de la copia de seguridad programada.LOCATION
: Es la región de Google Cloud en la que reside tu servicio de Dataproc Metastore.
REST
Sigue las instrucciones de la API para ver una copia de seguridad programada con el Explorador de APIs.
Soluciona los problemas comunes.
- El agente de servicio o la cuenta de usuario no tienen los permisos necesarios.
- Para obtener más ayuda para resolver problemas comunes, consulta Situaciones de error de copia de seguridad y restauración.
¿Qué sigue?
- Restablece un servicio de Dataproc Metastore a partir de una copia de seguridad
- Actualiza y borra un servicio de Dataproc Metastore