HDFS业务类型与相关架构优化措施

南墨3年前 (2023-03-20)技术文章954

低延迟业务

计算密集型业务，低延迟业务，这一类业务通常是对大量NameNode文件目录访问为主的（权限判断，文件存在性，文件信息查询等对NameNode元数据操作为主的）。因此需要针对NameNode的处理能力进行调整。主要可以采取以下措施：

通过新增NameNode引入Federation的方案实现，将高优先级的业务部署在单独的NameNode，以解决资源使用的问题。
调整日志级别，关闭HDFS的审计日志级别和运行日志级别修改为WARN级别（一般开源集群审计日志可能未配置）
硬件能力提升：

提升NameNode节点的CPU主频。

更换DataNode的磁盘为高性能磁盘或者SSD。

减少网络带宽延迟。

高吞吐业务

高吞吐量业务，这一类业务主要是大文件操作，对DataNode的IO需求更高。主要可以采取以下措施：

扩容DataNode节点数量。提高集群的吞吐量。
扩容DataNode节点的磁盘数量，以提高单DataNode的I/O能力。
更换DataNode挂载的磁盘类型，使用更高性能的磁盘或者SSD。

实时业务

实时数据需要HDFS能尽快响应业务请求，对节点性能有较高的要求。为保证业务实时性，一般采用配置高性能的节点，并将业务隔离的方案。主要可以采取以下措施：

采用分级存储，将存储节点按性能分组，由高性能节点为其提供业务。
数据节点采用SSD存储介质。
采用Federation特性，隔离NameNode以及数据节点。

频繁访问数据

频繁访问的数据一般指写入完成后，需要重复读取，偶尔有修改变化的数据。

对于这一类数据，主要可以采取以下措施：

使用Central Cache特性，将对应的文件缓存到内存。（在节点宕机时存在数据丢失风险）
使用分级存储特性，将对应文件存储到SSD介质。

临时数据

临时数据一般是指在写入完成后，立即进行业务处理，处理完成后删除的数据。

对于这一类数据，主要可以采取以下措施：

使用分级存储，将数据分布存储到RAM盘。
将副本数设置为2个，减少系统存储、网络压力。

归档数据

归档数据是指数据存储到集群后，一段时间不再访问的数据：

对于这一类数据，主要可以采取以下措施：

可以设置冷数据归档目录为I/O性能较慢的存储介质上，也可以减少副本数等。
存储数据时，采用HAR格式存储。
使用分级存储特性，将这些数据存储到低性能节点上。

返回列表

上一篇：DRDS 整库恢复介绍

下一篇：记一次zkfc故障问题定位

docker常用的操作总结

一、容器状态管理命令1．docker ps # 查看正在运行的容器 2．docker ps -a #查看当前所有容器 3．docker stop 容器名...

RDS通过DMS管理登录处理

问题描述无法通过DMS管理登录进入数据库,报错如下：问题处理方式一在RDS控制台新建账号账号管理--创建账号将此数据库添加进DMS在DMS控制台--数据库实例--新增实例将新建的数据库账号信息进行录...

strace

一、简介strace常用来跟踪进程执行时的系统调用和所接收的信号。在Linux世界，进程不能直接访问硬件设备，当进程需要访问硬件设备(比如读取磁盘文件，接收网络数据等等)时，必须由用户态模式切换至内...

Python 查询字符串转字典

Python 标准库中的 urllib.parse.parse_qs() 函数可以将查询字符串解析为一个字典，这个函数会将查询字符串中的键值对解析为字典的键和值。实例：from urllib.pars...

Rancher+dashboard安装部署

一、简介1、什么rancherRancher是一个开源软件平台，使组织能够在生产中运行和管理Docker和Kubernetes。使用Rancher，组织不再需要使用一套独特的开源技术从头开始构建容器服...

hbase-auto balancer失效

背景集群中，发现hbase 的compaction 队列一直增长，出现hang住的情况，排查发现，一些表的region集中在某些机器上，分布不均匀。但是排查发现auto balancer是默认开启的。...

HDFS业务类型与相关架构优化措施

相关文章

docker常用的操作总结

RDS通过DMS管理登录处理

strace

Python 查询字符串转字典

Rancher+dashboard安装部署

hbase-auto balancer失效

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号

HDFS业务类型与相关架构优化措施

相关文章

docker常用的操作总结

RDS通过DMS管理登录处理

strace

Python 查询字符串转字典

Rancher+dashboard安装部署

hbase-auto balancer失效

发表评论 取消回复

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?dcf8139ce75b768b71dccc5e589b983c"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号