CDH 5.16.2原地升级到CDP7.1.7

耀灵1年前技术文章800

1 升级Cloudera管理器

1.1 升级Cloudera管理器准备

1.1.1.1 关闭cloudera上托管的组件

1.jpg
































2.jpg

1.1.1.2 关闭Cloudera management service服务

3.jpg


检查os版本

4.png

5.png


之后,停止 cm 代理和服务器,配置升级 cm 存储库并进行升级。

//停止cloudera manager server
# systemctl stop cloudera-scm-server
 
//停止cloudera manager代理
# systemctl stop cloudera-scm-agent


6.png


7.png


//清除旧版本的supervisor,通过ps命令找到supervisor的pid

# ps -ef |grep cloudera

//清理supervisor
# kill -9 <old_supervisor_pid>


8.png












//清理yum的cache

# sudo yum clean all

9.png


//删除cloudera manager server和agent

# sudo yum remove -y cloudera-manager-server cloudera-manager-daemons cloudera-manager-agent

10.png

11.png


//解压cm7.4.4本地安装包

# cd /home/training/Downloads
# tar xvzf cm7.4.4-redhat7.tar.gz

12.png


//安装cm7.4.4

# sudo yum localinstall -y cloudera-manager-server-7* cloudera-manager-daemons* cloudera-manager-agent*


13.png


//设置cm server的db连接配置

# cd /etc/cloudera-scm-server
# sudo cp db.properties.rpmsave db.properties


15.png

16.png

17.png


点击“Start Cloudera Management Service”启动cm管理服务,等待命令结束


18.png

19.png

20.png21.png


解决升级后service monitor实例报错问题:


22.png

##如下sql命令更改列METRIC_ID的数据类型为BIGINT
alter table CMON_METRIC_INFO  modify `METRIC_ID` BIGINT NOT NULL;
如下图所示,更改后Activity Monitor可以正常启动

23.png

24.png


根据提示更新陈旧的配置

25.png

26.png


在cm控制台的parcel页面,找到CDP Runtime 7.1.7 Parcel点击“Download”下载parcel,该过程耗时较长

27.png


28.png


跨集群节点分发下载的包裹

29.png


分发后,升级按钮出现

30.png


2 升级集群

2.1 升级Cloudera管理器准备


该步骤主要用于备份Cloudera Manager Server,Cloudera Management服务以及集群Hadoop服务的RDBMS数据库,可以参考附录中“第3步:备份集群”以及“第4步:备份 Cloudera Manager”,升级实践中为了聚焦于升级重要步骤,学员可以选择跳过这一步并继续下一步。

备份cm Server命令

sudo su
mkdir -p /root/backup
cd /root/backup
 
export CM_BACKUP_DIR="`date +%F`-CM"
echo $CM_BACKUP_DIR
mkdir -p $CM_BACKUP_DIR
 
tar cvzf $CM_BACKUP_DIR/cloudera-scm-server.tar.gz /etc/cloudera-scm-server /etc/default/cloudera-scm-server
tar cvzf $CM_BACKUP_DIR/repository.tar.gz /etc/yum.repos.d


31.png32.png

备份cm agent命令

tar cvzf $CM_BACKUP_DIR/cloudera-scm-agent.tar.gz --exclude=*.sock /etc/cloudera-scm-agent/ 
/etc/default/cloudera-scm-agent /var/run/cloudera-scm-agent/ /var/lib/cloudera-scm-agent/

33.png

mkdir -p /root/backup/databases
cd /root/backup/databases
 
mysqldump -u root -ptraining amon > amon_db_backup.sql
mysqldump -u root -ptraining scm > scm_db_backup.sql
mysqldump -u root -ptraining metastore > metastore_db_backup.sql
mysqldump -u root -ptraining rman > rman_db_backup.sql
mysqldump -u root -ptraining oozie > oozie_db_backup.sql
mysqldump -u root -ptraining hue > hue_db_backup.sql


34.png


##需要注意的是事,备份前需停止组件服务


Zookeeper备份

cp -rp /var/lib/zookeeper/ /root/backup/zookeeper-backup-`date +%F`CM-CDH


Namenode备份


//备份元数据
mkdir -p /root/backup/nn-CM-CDH
cp -rp /dfs/nn /root/backup/nn-CM-CDH
 
//备份namenode配置数据
mkdir -p /root/backup/conf.rollback.namenode
cd /var/run/cloudera-scm-agent/process/ && cd `ls -t1 | grep -e "-NAMENODE\$" | head -1`
cp -rp * /root/backup/conf.rollback.namenode/
rm -rf /root/backup/conf.rollback.namenode/log4j.properties
cp -rp /etc/hadoop/conf.cloudera.hdfs/log4j.properties /root/backup/conf.rollback.namenode/

35.png



Secondary Namenode 备份


mkdir -p /root/backup/conf.rollback.secondarynamenode
cd /var/run/cloudera-scm-agent/process/ && cd `ls -t1 | grep -e "-SECONDARYNAMENODE\$" | head -1`
cp -rp * /root/backup/conf.rollback.secondarynamenode/
rm -rf /root/backup/conf.rollback.secondarynamenode/log4j.properties
cp -rp /etc/hadoop/conf.cloudera.hdfs/log4j.properties /root/backup/conf.rollback.secondarynamenode/


36.png

Datanode 备份

mkdir -p /root/backup/conf.rollback.datanode
cd /var/run/cloudera-scm-agent/process/ && cd `ls -t1 | grep -e "-DATANODE\$" | head -1`
cp -rp * /root/backup/conf.rollback.datanode/
rm -rf /root/backup/conf.rollback. datanode/log4j.properties
cp -rp /etc/hadoop/conf.cloudera.hdfs/log4j.properties /root/backup/conf.rollback.datanode/


37.png

Hue备份

mkdir -p /root/backup/parcels_backup
cp -rp /opt/cloudera/parcels/CDH/lib/hue/app.reg /root/backup/parcels_backup/app.reg-CM-CDH

38.png


CM 管理服务备份

mkdir -p /root/backup/cm_mgt/cloudera-service-monitor-`date +%F`-CM
sudo cp -rp /var/lib/cloudera-service-monitor /root/backup/cm_mgt/cloudera-service-monitor-`date +%F`-CM
mkdir -p /root/backup/cm_mgt/cloudera-host-monitor-`date +%F`-CM
sudo cp -rp /var/lib/cloudera-host-monitor /root/backup/cm_mgt/cloudera-host-monitor-`date +%F`-CM
mkdir -p /root/backup/cm_mgt/cloudera-scm-eventserver-`date +%F`-CM
sudo cp -rp /var/lib/cloudera-scm-eventserver /root/backup/cm_mgt/cloudera-scm-eventserver-`date +%F`-CM


39.png


2.2 进入维护模式


您可以启用维护模式以避免在升级过程中出现不必要的警报。

为避免在升级过程中出现不必要的警报,请在开始升级之前在集群上进入维护模式。进入维护模式会停止发送电子邮件警报和 SNMP 陷阱,但不会停止检查和配置验证。完成升级以重新启用 Cloudera Manager 警报后,请务必退出维护模式。更多信息

主页 > 状态选项卡上,单击集群名称旁边的操作菜单,然后选择进入维护模式(Enter Maintenance Mode)。

40.png41.png42.png

2.3 运行升级集群向导


2.3.1登陆到Cloudera Manager 管理控制台

43.png44.png

2.3.2 点击“Add Yarn Queue Manager Service”,以下向导将引导您将公平调度器转换为容量调度器

45.png46.png47.png48.png49.png50.png51.png52.png53.png1. 其他任务部分列出了在继续之前要注意的其他任务或提醒。选择选项以确认您理解,然后再继续。


54.png55.png56.png57.png58.png

注意:

由公平调度升级到容量调度,生成容量调度配置文件中的调度配置参数要对应成现场的,否则后面升级会报错,以下命令标红的关键字

root@localhost:/home/training/Downloads$ /opt/cloudera/parcels/CDH-7.1.7-1.cdh7.1.7.p1000.24102687/bin/yarn fs2cs 
--cluster-resource memory-mb=1048576,vcores=8 --no-terminal-rule-check -y yarn-site.xml -f fair-scheduler.xml -o /root/output

59.png60.png61.png62.png63.png64.png65.png

集群退出维护模式:

66.png67.png

#使用hdfs dfsadmin -report命令查看报under replica


68.png

解决办法

sudo -u hdfs hdfs dfs -setrep -w 1 /user/


69.png

升级完成组件状态正常:

70.png

组件版本:

71.png



相关文章

SQL Server优化入门系列(一)——快速定位阻塞SQL

SQL Server优化入门系列(一)——快速定位阻塞SQL

引言我们在运维数据库的时候,经常会面对这样的问题:数据库现在运行得怎么样有哪些会话在执行,当前状态是什么,在执行什么SQL哪些会话被阻塞,阻塞原因是什么会话是从哪些IP连接过来的,使用了什么账号通过这...

zabbix监控华为存储设备

zabbix监控华为存储设备

确认监控方式开始监控之前首先思考确认好要监控的方式。提出疑问:zabbix 监控华为存储设备推荐使用snmptrap还是snmptt呢?回答:在 Zabbix 监控华为存储设备时,您可以选择使用 SN...

arm环境安装达梦数据库

arm环境安装达梦数据库

一、安装前准备1、创建用户和用户组groupadd dinstall useradd -g dinstall -m -d /home/dm...

Docker常用命令

1、找镜像去docker hub,查找需要的镜像,docker pull nginx  #下载最新版 镜像名:版本名(标签) docker pull nginx:1.20.1 #...

Admission 准入控制器

准入控制器什么是准入控制器?就是 API 请求进来后,准许它进入或者丰富进来的 API 请求的控制器。如图所示,MutatingAdmissionWebhook 和 ValidatingAdmissi...

开源大数据集群部署(二十二)Flink on yarn部署

开源大数据集群部署(二十二)Flink on yarn部署

flink on yarn部署(每个节点)cd  /root/bigdata/ tar -xzvf  flink-1.14.6-bin-scala_2.12.tgz -C /opt/  ln -s...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。