HDP实操--NameNode开启高可用

九月6个月前技术文章220

为了确定在namenode组件失败后集群中有其他的namenode可以工作,需要对hdp集群配置高可用,当前我们配置的非安全集群的高可用。

前置条件:

(1)确保你的集群至少有3个节点并且至少有3个Apache ZooKeeper servers在运行。

(2)确保你的hdfs和zookeeper不在维护模式中。

 (3)  If you have HBase running, please exit this wizard and stop HBase first.

1、设置nameservice

Ambari的web页面,选择Services > HDFS > Summary。点击Actions,然后选择Enable NameNode HA。在Get Started 窗口,设置nameservice。

图1.png

2、修改hive元数据配置

如果有安装的hive,在部署namenode ha的时候要修改hive metastore中的hdfs路径,将之前的hdfs配置修改成新设置的nameservice,可以执行一下命令:

在hive节点中执行命令查看当前hdfs配置:

hive --config /etc/hive/conf/conf.server --service metatool -listFSRoot

图2.png

更改hdfs的root配置:

#hive --config /etc/hive/conf/conf.server --service metatool -updateLocation [NEW_LOCATION][OLD_LOCATION]

hive --config /etc/hive/conf --service metatool -updateLocation hdfs://mycluster/apps/hive/warehouse hdfs://hdp001:8020/warehouse

图3.png

3、集群中配置zookeeper的失败次数

页面中选择Services > HDFS > Configs > Advanced core-site,设置

ha.failover-controller.active-standby-elector.zk.op.retries=120。

4、增加组件

选择节点对另外的namenode组件和journalnode组件进行部署。

Review页面,确定部署的节点然后点击next

5、create checkpoint

在Manual Steps Required: Create Checkpoint on NameNode 页面,要登录到之前的namenode节点,将namenode节点配置成安全模式并且创建checkpoint,当页面显示checkpoint已经创建的时候,选择next。



Configure Components页面查看安装情况,部署完毕后点击next。

图6.png

6、初始化jn组件

Manual Steps Required: Initialize JournalNodes页面显示要对JournalNodes组件进行初始化,登录之前的namenode节点运行以下命令

图7.png

7、在Start Components页面,监控zk和namenode的启动

图8.png

8、 初始化nn组件

Manual Steps Required: Initialize NameNode HA Metadata,在这一步,需要登录之前的namenode节点和要增加的另一台namenode节点,执行对应命令,确定完成初始化metastore后点击next。

图9.png

9、在Finalize HA Setup页面,监控安装进程。

图10.png


相关文章

大数据监控系列(一)——Prometheus+Grafana监控概述

大数据监控系列(一)——Prometheus+Grafana监控概述

1 概述这是介绍Prometheushe和Grafana主要是为了监控大数据产品,数栈平台也是使用Prometheushe+Grafana作为底层大数据组件的监控,并且均有配置模板,导入即在Grafa...

Haproxy配置负载均衡

yum安装haproxy如果后面要配置高可用,和keepalived配合使用更佳。yum install haproxy修改配置文件设置impala和ldap的负载均衡(Impala Daemon分布...

IDC:疫情下,第三方云管理服务市场逆势增长!

IDC:疫情下,第三方云管理服务市场逆势增长!

IDC预测,中国第三方云管理服务在2019年到2023年间将保持54.7%的增长率,2023年市场规模预计达到32.1亿美元。2019年第三方云管理服务市场呈现出如下特点:云管理服务成为众多服务商的战...

HDP-Yarn开启CPU调度和隔离

HDP-Yarn开启CPU调度和隔离

进入到ambari主界面 点击yarn 点击config CPU Scheduling and Isolation 设置为enable修改高级配置点击ADVANCED搜索需要修改的配yarn.node...

Hive优化之SQL的优化(三)

Hive优化之SQL的优化(三)

     Hive是大数据领域常用的组件之一,主要是大数据离线数仓的运算,关于Hive的性能调优在日常工作和面试中是经常涉及的一个点,因此掌握一些Hi...

ES运维(五)聚合分析流程及精准度

ES运维(五)聚合分析流程及精准度

1、 概述ES是一个近实时的搜索引擎,提供近实时海量数据的聚合分析功能,但这个海量数据聚合分析是会损失一定的精准度来满足实时性能需要的。 2、 分布式系统的近似统计算法如下图,在分布式数据分...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。