大数据集群部署规划（二）硬件配置要求

南墨3年前 (2023-02-01)技术文章3570

CPU（虚拟机建议配置*2）

X86服务器：

最低配置：双路4核Intel处理器。

推荐配置：双路8核Intel处理器。

ARM服务器：

双路32核ARM处理器

Bit-mode

64位

内存（虚拟机不建议超分）

物理内存不少于32GB
大集群（100节点以上）推荐单节点128GB～512GB内存

网卡

GE光口bond
大集群推荐10GE光口bond及以上配置

磁盘RAID配置

操作系统盘：独占一个RAID组，且RAID组级别为RAID1
元数据盘（nn、jn、zk、hive元数据所在磁盘，如共盘请确保磁盘安全稳定）：独占一个RAID组，且RAID组级别为RAID1
数据盘：配置RAID0或无RAID
也可采用共享存储和分布式存储的方式减少存储压力

磁盘空间

操作系统盘>100Gb
元数据盘>100GB
数据盘>200GB

磁盘类型

本地盘	SSD	即固态硬盘，具有较高的读写性能。但通常存储容量较小，单位存储成本比普通机械硬盘高。由于NVMe SSD盘不支持配置RAID1，建议配置OS盘或元数据盘时建议采用SAS SSD，建议元数据盘采用此种磁盘。	当数据量处于TB级别以上时，推荐使用本地盘，磁盘直接挂载在计算节点上，性能高于云盘。本地盘不能选择磁盘数量，只能使用默认配置好的数量，数据也没有后端的备份机制，需要上层的软件来保证数据可靠性。
本地盘	DISK（HDD）	DISK即普通机械硬盘，包括SATA和SAS类型。是HDFS用于保存数据的主力存储类型。DISK是大数据平台当前主要使用的磁盘存储类型。对于速度要求高的可以使用SSD类型的磁盘。例如：阿里云E-MapReduce HDFS数据量大于60 TB，建议采用本地盘实例（ECS.d1，ECS.d1NE）
云盘	SSD云盘	具备稳定的高随机读写性能、高可靠性的高性能云盘产品。建议在I/O密集型应用、中小型关系数据库和NoSQL数据库等场景中使用。	当业务数据量处于TB级别以下时，推荐使用云盘，云盘的IOPS和吞吐相比本地盘都会小些。磁盘不直接挂载在本地的计算节点上，而是通过网络访问远端的一个存储节点。每一份数据在后端都有两个实时备份，一共三份数据。当一份数据损坏时（磁盘损坏，不是业务上的破坏）
	高效云盘	具备高性价比、中等随机读写性能、高可靠性的云盘产品。建议在开发与测试业务和系统盘等场景中使用。例如：阿里云EMR，HDFS数据量小于60 TB，可以考虑高效云盘和SSD云盘。
	ESSD云盘	基于新一代分布式块存储架构的超高性能云盘产品，结合25GE网络和RDMA技术，单盘可提供高达100万的随机读写能力和更低的单路时延能力。建议在大型OLTP数据库、NoSQL数据库和ELK分布式日志等场景中使用。例如阿里云E-MapReduce默认使用ESSD云盘作为集群的系统盘。系统盘默认是一块。

性能对比：磁盘性能为SSD本地盘 > SSD云盘 > 本地盘 > 高效云盘。

注：关于云盘，这里参考的是阿里云的块存储：

https://help.aliyun.com/document_detail/63136.html

返回列表

上一篇：大数据集群部署规划（一）关于节点的定义

下一篇：大数据集群部署规划（三）节点选配方案

相关文章

单节点Kafka部署并开启Kerberos配置

安装Kerberosserver节点安装kerberos相关软件yum install -y krb5-server krb5-workstation krb5-libs修改配置文件krb5.conf...

k8s Krew 插件开发详解

前言：前面我们已经了解过krew插件的作用以及一些比较常用的插件，接下来我们讲一下如何开发krew插件。1、熟悉kubens 插件在开发krew插件之前，我们先通过kubens插件来熟悉krew，我们...

GTID 模式 - 通过跳过事务解决主从故障

一、前言很多场景下我们需要跳过一个事务来修复主从关系，例如主从事务不一致，或者对无主键表更新，导致较大延迟，操作过程在此记录。二、操作流程1. 获取最后一个 GTID 操作在 GTID 模式下，如果需...

CDH 5.16.2原地升级到CDP7.1.7

CDH 5.16.2原地升级到CDP7.1.7

1 升级Cloudera管理器1.1 升级Cloudera管理器准备1.1.1.1 关闭cloudera上托管的组件1.1.1.2 关闭Cloudera management service服务检查o...

SQL Server优化入门系列（三）—— 性能计数器(performance counter)

SQL Server优化入门系列（三）—— 性能计数器(performance counter)

说明Performance Counter是windows系统中通用的性能分析工具。Windows OS和SQL Server暴露了很多Performance Counter，可用户分析整个系统的运行...

Pod终止-preStop

由于 Pod 所代表的是在集群中节点上运行的进程，当不再需要这些进程时允许其体面地终止一般不应武断地使用 KILL 信号终止它们设计的目标是令你能够请求删除进程，并且知道进程何时被终止，同时也能够确...

发表评论