hbase-auto balancer失效

櫰木7个月前技术文章194


背景

集群中,发现hbase 的compaction 队列一直增长,出现hang住的情况,排查发现,一些表的region集中在某些机器上,分布不均匀。但是排查发现auto balancer是默认开启的。所以猜测balancer失效。

排查步骤

排查的第一步,拿到日志,查看是否有相关balancer的日志信息。但是没有什么明显的发现。所以开启balancer 的debug模式

登录cm页面——》选择hbase ,打开active master web页面——》log level

在get/set的第二行,写入org.apache.hadoop.hbase.master.balancer这个类,Level中写入TRACE然后点击Set Log Level

image.pngimage.png

日志开启完成

image.png

这个配置可以不用重启,就直接在master节点上看到trace的日志

image.png

解决方案

如上图,发现balancer是被跳过了。

Skipping load balancing because balanced cluster; total cost is 40.0, sum multiplier is 1102.0 min cost which need balance is 0.05

然后梳理了下hbase 的balancer机制,参考以下文档

https://developer.aliyun.com/article/752985

cm——》hbase——》配置——》搜索hbase-site.xml 的 Master 高级配置代码段(安全阀)

配置以下参数

name: hbase.master.balancer.stochastic.minCostNeedBalance

value: 0.01   #默认是0.05


相关文章

MySQL运维实战(4.5) SQL_MODE之NO_ZERO_DATE和NO_ZERO_IN_DATE

NO_ZERO_DATE:日期中不允许'0000-00-00'NO_ZERO_IN_DATE:日期中年、月或日不允许为0,如不允许'2021-00-01', '...

chronyc时间同步器配置

chronyc时间同步器配置

chronyc & chronydchrony 有两个核心组件:chronyd守护进程,主要用于调整内核中运行的系统时间和时间服务器同步chronyc命令行界面程序,让用户能够对 chrony...

rds pg10 ssd云盘升级磁盘类型方案

rds pg10 ssd云盘升级磁盘类型方案

1、升级方案一原实例变更配置方案优缺点:优点:操作方便,升级后能保证数据和存储过程都是正常的。缺点:停机时间较长,整个变更配置期间业务不可用。变更步骤参考:在配置信息区域单击变更配置。(仅包年包月实例...

Prometheus+Consul服务自动发现监控

Prometheus+Consul服务自动发现监控

为什么使用consulprometheus作为新一代的监控利器,有很多优点,部署起来也十分方便。部署prometheus后自然会需要使用prometheus去监控物理机或者虚拟机的资源,这里就需要使用...

聊一聊什么是分布式系统

聊一聊什么是分布式系统

分布式系统原理1 概念1.1 模型节点在具体的工程项目中,一个节点往往是一个操作系统上的进程。在本文的模型中,认为节点是一个完整的、不可分的整体,如果某个程序进程实际上由若干相对独立部分构成,则在模型...

kafka开启Kerberos

1、修改server.properties#增加如下配置 listeners=SASL_PLAINTEXT://IP:port security.inter.broker.protocol=SAS...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。