CDP实操--集群扩容

九月3年前技术文章1250


一、前提准备工作

1.确保OS的yum源可以正常使用,通过yum repolist命令可以查看到匹配的OS的所有包

2.确保Cloudera Manager的yum源运行正常

3.hosts文件配置,需要将Gateway节点的IP和hostname加入到CDH集群节点的hosts文件中,并同步到所有机器包括Gateway节点

机房a节点host配置

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
10.60.1.1 cdp01
10.60.1.2 cdp02
10.60.1.3 cdp03

#10.60.1.1 cdp01
#10.188.0.2 cdp02
#10.188.0.3 cdp03
10.168.54.100 cdp04
10.168.54.101 cdp05

##
10.168.52.121 kafka1
10.168.52.122 kafka2
10.168.52.123 kafka3

机房b节点host配置

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
#10.60.1.1 cdp01
#10.60.1.2 cdp02
#10.60.1.3 cdp03

10.188.0.1 cdp01
10.188.0.2 cdp02
10.188.0.3 cdp03
10.168.54.100 cdp04
10.168.54.101 cdp05

##
10.168.52.121 kafka1
10.168.52.122 kafka2
10.168.52.123 kafka3

4.禁用SELinux

sed -i 's#SELINUX=enforcing#SELINUX=disabled#g' /etc/selinux/config 
setenforce 0

5.关闭防火墙

systemctl stop firewalld
systemctl status firewalld

6、设置swap内存配置

echo "vm.swappiness = 1" >> /etc/sysctl.conf 
sysctl -p

7、关闭透明大页面

echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled
echo 'echo never > /sys/kernel/mm/transparent_hugepage/defrag' >> /etc/rc.local
echo 'echo never > /sys/kernel/mm/transparent_hugepage/enabled' >> /etc/rc.local

8、配置时钟同步

yum -y install chrony

调整配置文件/etc/chrony.conf

# Use public servers from the pool.ntp.org project.
# Please consider joining the pool (http://www.pool.ntp.org/join.html).
#server 0.centos.pool.ntp.org iburst
#server 1.centos.pool.ntp.org iburst
#server 2.centos.pool.ntp.org iburst
#server 3.centos.pool.ntp.org iburst
server ntp1.aliyun.com iburst

# Record the rate at which the system clock gains/losses time.
driftfile /var/lib/chrony/drift

# Allow the system clock to be stepped in the first three updates
# if its offset is larger than 1 second.
makestep 1.0 3

# Enable kernel synchronization of the real-time clock (RTC).
rtcsync

# Enable hardware timestamping on all interfaces that support it.
#hwtimestamp *

# Increase the minimum number of selectable sources required to adjust
# the system clock.
#minsources 2

# Allow NTP client access from local network.
#allow 192.168.0.0/16

# Serve time even if not synchronized to a time source.
#local stratum 10

# Specify file containing keys for NTP authentication.
#keyfile /etc/chrony.keys

# Specify directory for log files.
logdir /var/log/chrony

# Select which information is logged.
#log measurements statistics tracking

重启服务

 systemctl restart chronyd

验证时钟是否同步

chronyc sources -v

图1.png

9、为待上线节点安装Kerberos客户端并配置krb5.conf文件

yum -y install krb5-libs krb5-workstation openldap-client

调整配置文件/etc/krb5.conf为

[libdefaults]
default_realm = HADOOP.NBGTEST.LOCAL
dns_lookup_kdc = false
dns_lookup_realm = false
ticket_lifetime = 86400
renew_lifetime = 604800
forwardable = true
default_tgs_enctypes = rc4-hmac aes256-cts
default_tkt_enctypes = rc4-hmac aes256-cts
permitted_enctypes = rc4-hmac aes256-cts
udp_preference_limit = 1
kdc_timeout = 3000
[realms]
HADOOP.NBGTEST.LOCAL = {
kdc = cdp02
admin_server = cdp02
}
[domain_realm]

10、安装jdk

二、页面增加节点

1、所有主机页面增加新节点

2、选择存储库

图4.png

3、安装jdk

由于前置准备中已经安装,所以选Manually manage JDK,然后继续

图5.png

4、提供ssh登录凭证

由于两个机房密码不一致,所以选私钥方式,将cdp01节点的私钥进行上传

图6.png

5、install agents

图7.png

6、install parcels

图8.png

7、检查主机正确性

忽略继续

图9.png

8、命令详细信息

图10.png

9、选择主机模版

由于cdp04新增节点中已经添加数据组件的角色,cdp05节点暂不设置组件

图11.png

10、命令详细信息

图12.png

11、查看主机情况

图13.png



标签: 大数据运维

相关文章

Flinksql Kafka 接收流数据并打印到控制台

Flinksql Kafka 接收流数据并打印到控制台

本文目的使用Flink SQL创建一个流处理作业,将来自Kafka主题"dahua_picrecord"的数据写入到另一个表”print_table”控制台中。使用sql-client前 需要启动ya...

haproxy服务无法正常启动

haproxy服务无法正常启动

【局点信息】测试环境【集群信息】【问题现象】haproxy设置配置文件后,无法正常启动,查看服务状态显示失败配置增加内容#增加如下配置 listen ApiApplicationServer   ...

CDP实操--Ranger开启ldap认证

CDP实操--Ranger开启ldap认证

集群中已经部署了ldap主主模式,并且使用haproxy进行负载均衡,keepalive提供了虚拟ip。页面配置:Ranger进行同步用户:验证:使用ldap用户登录页面:FAQ:1、admin超级管...

trino容器对接ldap(二)

trino容器对接ldap(二)

前提:本文前提是在trino容器已经对接上hive组件,并且ldap已经部署完成的基础上进行的对接。前提文章见:helm安装部署trino对接hive(一)安装部署1、设置证书因为不确定是在哪台机器中...

远程DEBUG HADOOP源码方法

远程DEBUG HADOOP源码方法

1. 安装IDEA2. 下载hadoop源码,必须与集群服务代码版本一致,否则会导致有的类无法找到3. 将源码导入IDEA工程并完成build4. 点击 菜单栏--运行--编辑配置 进行相关debug...

Debezium抽取SQL Server同步kafka

Debezium抽取SQL Server同步kafka

ebezium SQL Server连接器捕获SQL Server数据库模式中发生的行级更改。官方2.0文档:https://debezium.io/documentation/reference/2...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。