本页介绍了如何在包含 Ranger 集群的 Dataproc 上备份和恢复 Ranger 架构。
准备工作
根据需要创建存储桶。您必须有权访问 Cloud Storage 存储桶,您将使用该存储分区存储和恢复 Ranger 架构。
要创建存储桶,请按以下步骤操作:
- In the Google Cloud console, go to the Cloud Storage Buckets page.
- Click Create bucket.
- On the Create a bucket page, enter your bucket information. To go to the next
step, click Continue.
- For Name your bucket, enter a name that meets the bucket naming requirements.
-
For Choose where to store your data, do the following:
- Select a Location type option.
- Select a Location option.
- For Choose a default storage class for your data, select a storage class.
- For Choose how to control access to objects, select an Access control option.
- For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
- Click Create.
备份 Ranger 架构
使用 SSH 连接到具有 Ranger 架构的集群的 Dataproc 主节点。在主节点上运行的 SSH 终端会话中运行本部分中的命令。
设置环境变量。
BUCKET_NAME=bucket name \ MYSQL_PASSWORD=MySQL password SCHEMA_FILE=schema filename
替换以下内容:
MySQL password:您可以在集群主节点上打开
/etc/mysql/my.cnf
来复制 MySQL 密码。bucket name:用于存储 Ranger 架构的 Cloud Storage 存储桶的名称。
schema filename:指定文件名(不带
.sql
文件名扩展名)。Ranger 架构会保存到主节点上的此文件,然后保存到 Cloud Storage 中的 bucket name。
停止 Hive 服务。
sudo systemctl stop hive-metastore.service sudo systemctl stop hive-server2.service
防止对 Ranger 架构表进行更改。
mysql -u root -p${MYSQL_PASSWORD} REVOKE ALL PRIVILEGES ON ranger.* from 'rangeradmin'@'localhost'; GRANT SELECT ON ranger.* TO 'rangeradmin'@'localhost'; FLUSH PRIVILEGES; SHOW GRANTS FOR 'rangeradmin'@'localhost'; exit;
将 Ranger 架构保存到
.sql
文件。mysqldump -u root -p${MYSQL_PASSWORD} ranger > ${SCHEMA_FILE}.sql
重置 Ranger 权限。
mysql -u root -p${MYSQL_PASSWORD} REVOKE SELECT ON ranger.* from 'rangeradmin'@'localhost'; GRANT ALL PRIVILEGES ON ranger.* to 'rangeradmin'@'localhost'; FLUSH PRIVILEGES; SHOW GRANTS FOR 'rangeradmin'@'localhost'; exit;
重启 Hive 和 Ranger 服务。
sudo systemctl start hive-metastore.service sudo systemctl start hive-server2.service sudo systemctl restart ranger-admin.service sudo systemctl restart ranger-usersync.service
将 Ranger 架构复制到 Cloud Storage。
gcloud storage cp ${SCHEMA_FILE}.sql gs://${BUCKET_NAME}
恢复 Ranger 架构
使用 SSH 连接到您要恢复集群架构的集群的 Dataproc 主节点。在主节点上运行的 SSH 终端会话中运行本部分中的命令。
设置环境变量。
BUCKET_NAME=bucket name \ MYSQL_PASSWORD=MySQL password SCHEMA_FILE=schema filename
替换以下内容:
MySQL password:您可以在集群主节点上打开
/etc/mysql/my.cnf
来复制 MySQL 密码。bucket name:包含已保存 Ranger 架构的 Cloud Storage 存储桶的名称。
schema filename:Ranger 架构文件名的名称(不带
.sql
文件名扩展名),保存在 Cloud Storage 中的 bucket name 中。
停止 Hive 服务。
sudo systemctl stop hive-metastore.service sudo systemctl stop hive-server2.service
防止对 Ranger 架构表进行更改。
mysql -u root -p${MYSQL_PASSWORD} REVOKE ALL PRIVILEGES ON ranger.* from 'rangeradmin'@'localhost'; GRANT SELECT ON ranger.* TO 'rangeradmin'@'localhost'; FLUSH PRIVILEGES; SHOW GRANTS FOR 'rangeradmin'@'localhost'; exit;
将 Cloud Storage 中的 Ranger 架构
.sql
文件复制到集群主节点。gcloud storage cp ${BUCKET_NAME}/${SCHEMA_FILE}.sql .
恢复 Ranger 架构。此步骤会覆盖现有 Ranger 架构的内容。
mysqldump -u root -p${MYSQL_PASSWORD} ranger < ${SCHEMA_FILE}.sql
重置 Ranger 权限。
mysql -u root -p${MYSQL_PASSWORD} REVOKE SELECT ON ranger.* from 'rangeradmin'@'localhost'; GRANT ALL PRIVILEGES ON ranger.* to 'rangeradmin'@'localhost'; FLUSH PRIVILEGES; SHOW GRANTS FOR 'rangeradmin'@'localhost'; exit;
更新 Ranger 配置文件。在以下文件中,将 Ranger DB 主机更改为具有以下属性的新数据库主机名:
文件 属性 ranger-hdfs-security.xml
ranger.plugin.hdfs.policy.rest.url
ranger-yarn-security.xml
ranger.plugin.yarn.policy.rest.url
重启 Hive 和 Ranger 服务。
sudo systemctl start hive-metastore.service sudo systemctl start hive-server2.service sudo systemctl restart ranger-admin.service sudo systemctl restart ranger-usersync.service