CDH实操--HDFS高可用设置

二龙3年前 (2023-01-11)技术文章1714

1 概述

在HDFS集群中NameNode存在单点故障（SPOF），对于只有一个NameNode的集群，如果NameNode机器出现意外，将导致整个集群无法使用。为了解决NameNode单点故障的问题，Hadoop给出了HDFS的高可用HA方案，HDFS集群由两个NameNode组成，一个处于Active状态，另一个处于Standby状态。

Active NameNode可对外提供服务，而Standby NameNode则不对外提供服务，仅同步Active NameNode的状态，以便在Active NameNode失败时快速的进行切换。本篇文章主要讲述如何使用Cloudera Manager启用HDFS的HA。

前置条件

a.拥有Cloudera Manager的管理员账号

b.CDH集群已安装成功并正常使用

2 启动HDFS的HA

2.1 使用管理员用户登录Cloudera Manager的Web管理界面，进入HDFS服务

2.2 点击“启用High Avaiability”，设置NameService名称

2.3 点击“继续”，选择NameNode主机及JouralNode主机

JouralNode主机选择，一般与Zookeeper节点一致即可（至少3个且为奇数）

2.4 点击“继续”，设置NameNode的数据目录和JouralNode的编辑目录

NameNode的数据目录默认继承已有NameNode数据目录。

2.5 点击“继续”，启用HDFS的High Availability，如果集群已有数据，格式化NameNode会报错，不用理。

2.6 点击“继续”，完成HDFS的High Availability

2.7 HDFS实例查看

返回列表

上一篇：CDH实操--客户端安装

下一篇：CDP实操--集群配置Kerberos

相关文章

查看相关服务器信息命令

查看相关服务器信息命令

1、查看服务器架构方式arch2、查看服务器cpu核数nproc3、查看服务器内存大小free -hdmidecode -t 17 | grep Size4、查看某目录下挂载磁盘大小lsblk5、查看...

Hive架构图及Hive SQL的执行流程

Hive架构图及Hive SQL的执行流程

1、Hive产生背景MapReduce编程的不便性HDFS上的文件缺少Schema(表名，名称，ID等，为数据库对象的集合)2、Hive是什么Hive的使用场景是什么？基于Hadoop做一些数据清洗啊...

SpringBootWeb 篇-深入了解 SpringBoot + Vue 的前后端分离项目部署上线与 Nginx 配置文件结构（3）

SpringBootWeb 篇-深入了解 SpringBoot + Vue 的前后端分离项目部署上线与 Nginx 配置文件结构（3）

4.0 SpringBoot 后端代码进行打包上传服务器将 SpringBoot 项目进行打包： &nb...

chengying-4.0登入接口逆向

chengying-4.0登入接口逆向

首先是登入的加密url：http://xxxxx/api/v2/user/login参数1. username:admin@dtstack.com2. password:614bb9438210c69...

数仓主流架构简介之二

数仓主流架构简介之二

一、流批一体数据批流一体是一种云计算架构模式，它结合了批处理和流处理的特点，以实现更高效、灵活和可扩展的数据处理能力。在这种模式下，数据可以同时进行批处理和流处理，以满足不同场景下的需求流批一体：是指...

压测实操--kafka-consumer压测方案

压测实操--kafka-consumer压测方案

环境信息：操作系统centos7.9，kafka版本为hdp集群中的2.0版本。Consumer相关参数使用Kafka自带的kafka-consumer-perf-test.sh脚本进行压测，该脚本参...

发表评论