开源大数据集群部署(一)集群实施规划

櫰木3年前技术文章790

1、集群规划

1.1 本次集群规划信息

本次实际生产业务体量存在巨大差异,但集群规划内容相同,因此建议实际生产环境按照按照一定比例扩展即可。

主机操作系统要求

软硬件信息

参数

配置

8C16G

操作系统版本

CentOS Linux release 7.8.2003 (Core)

java版本

java version "1.8.0_281"

hadoop版本

hadoop 3.2.4

集群版本规划 

集群组件

版本

HDFS

3.2.4

YARN

3.2.4

MapReduce2

3.2.4

Hive

3.1.2

HBase

2.1.0

ZooKeeper

3.7.1

Trino

389

主机角色规划

服务器

IP

角色

hd1.dtstack.com(管理节点)

172.16.104.226

namenode/resourcemanager/journalnode/zkfc//hive_metastore/hiveserver2

hd2.dtstack.com(管理节点)

172.16.106.252

namenode/resourcemanager/journalnode/zkfc/hamster/ranger

hd3.dtstack.com(数据节点)

172.16.107.127

datanode/nodemanager/journalnode/

hd1.dtstack.com(kerberos节点)

172.16.106.165

freeipaserver

配置目录规划

所有安装包目录为/opt/hadoop 类似



组件

目录名称

目录

HADOOP

hadoop datanode目录

/data/hadoop/dfs/data

hadoop namenode目录

/data/hadoop/dfs/name

hadoop临时目录

/data/hadoop/tmp

ZOOKEEPER

zookeeper数据目录

/data/zookeeper/data/

zookeeper日志目录

/data/zookeeper/log/

 

组件系统用户规划

组件

启动用户

所属组

hdfs(namenode/datanode/zkfc/journalnode)

hdfs

hadoop

yarn(reourcemanager/nodemanager/)

yarn

hadoop

zookeeper

zookeeper

zookeeper

hive

hive

hadoop

hbase

hbase

hadoop

mysql

mysql

mysql

ranger

ranger

ranger

grafana

grafana

grafana

prometheus

prometheus

prometheus

trino

trino

hadoop


相关文章

linux中的buffer和cache

linux中的buffer和cache

linux中的buffer和cache一、buffer和cache的来源及应用1、来源Buffer 是缓冲区,而 Cache 是缓存,两者都是数据在内存中的临时存储。那么,这两种“临时存储”有什么区别...

 MySQL 两阶段提交

MySQL 两阶段提交

说明MySQL 开启 Binlog 后,所有的事务都会产生 Binlog Event,这些 Event 也是事务数据的一部分。本篇文章介绍 MySQL 如何保证事务 Binlog Event 和 In...

开源大数据集群部署(二十二)Flink on yarn部署

开源大数据集群部署(二十二)Flink on yarn部署

flink on yarn部署(每个节点)cd  /root/bigdata/ tar -xzvf  flink-1.14.6-bin-scala_2.12.tgz -C /opt/  ln -s...

MySQL 评估 ALTER TABLE 进度(5.7)

MySQL 评估 ALTER TABLE 进度(5.7)

一、前言问题:大表里执行 ALTER TABLE 的时候,经常会比较忐忑,会面临 “跑又跑不完 Kill 也不敢 Kill” 的窘境。需求:客户在执行 ALTER TABLE 时也会让我们来评估影响的...

Python 调用阿里云 OpenAPI 巡检到期云资源

Python 调用阿里云 OpenAPI 巡检到期云资源

前言本篇文章介绍我写的一个程序,通过调用阿里云 OpenAPI 巡检即将到期的云资源。https://github.com/COOH-791/cloud_instance_sentry1. 用途说到云...

Trino开启ldap认证

Trino开启ldap认证

1、背景由于对于安全监管的要求,需要对trino服务开启安全认证体系。2、基于私有证书的httpskeytool -genkeypair -validity 36500 -ext SAN=IP:172...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。