HBase基本架构

浩客2年前技术文章865

111111111111111.PNG

架构角色:

(1)Master

Master 是所有 RegionServer 的管理者,负责监控集群中所有的 RegionServer 实例。主要作用如下:

  • 管理元数据表格 hbase:meta,接收用户对表格创建修改删除的命令并执行;对于表的操作:create, delete, alter

  • 监控 region 是否需要进行负载均衡,故障转移和 region 的拆分;对于 RegionServer的操作:分配 regions 到每个 RegionServer。


(2)Region Server

Region Server 为 Region 的管理者,主要作用如下:

  • 对于数据的操作:负责数据 cell 的处理,例如写入数据 put,查询数据 get 、delete

  • 对于 Region 的操作,拆分合并 region 的实际执行者,有 master 监控,有 regionServer 执行,splitRegion、compactRegion


(3)Zookeeper

HBase 通过 Zookeeper 来做 master 的高可用、RegionServer 的监控、记录 RegionServer 的部署信息、并且存储有 meta 表的位置信息。

HBase 对于数据的读写操作时直接访问 Zookeeper 的。


(4)HDFS

HDFS是Hadoop生态下的分布式文件系统,提供最终的底层数据存储服务,同时为 HBase 提供高容错的支持。

(5)WAL预写日志处理器

master 需要执行的任务记录到预写日志 WAL 中,如果 master 宕机,让 backupMaster

读取日志继续干。


(6)MemStore

写缓存,由于 HFile 中的数据要求是有序的,所以数据是先存储在 MemStore 中,排好序后,等到达刷写时机才会刷写到 HFile,每次刷写都会形成一个新的 HFile。


相关文章

ntp服务配置

ntp服务配置

安装:yum -y install ntp服务命令systemctl enable ntpd 开机启动systemctl start ntpd 启动服务systemctl stop ntpd 停止服务...

一条sql 在MySQL中是如何执行的

在 MySQL 中,SQL 查询的执行涉及多个内存区域和处理步骤,以确保查询能够高效地执行和返回结果。以下是 SQL 查询在 MySQL 中执行时通常会经过的内存路径:    &n...

.gitlab-ci.yml 语法

.gitlab-ci.yml 语法

介绍管道配置从作业(job)开始, 作业是 .gitlab-ci.yml 文件的最基本元素。job是:定义了约束,指出应在什么条件下执行具有任意名称的顶级元素,并且必须至少包含 script 子句不限...

MySQL 8.0 新特性:Persisted System Variables

MySQL 8.0 新特性:Persisted System Variables

一、前言MySQL 5.7 之前我们修改参数变量后,需要将其手动写入到服务端配置文件中,否则重启后又恢复原有的配置,在 8.0 中可以在 MySQL 客户端直接将参数持久化,节省在服务器操作的步骤,下...

开启kerberos配置HiveServer2负载均衡

开启kerberos配置HiveServer2负载均衡

1.HAProxy配置HiveServer2负载均衡1.编辑/etc/haproxy/haproxy.cfg文件,在文件末尾增加如下配置listen stats     bind 0.0.0.0:1...

CDH时钟同步问题

CDH时钟同步问题

首先执行如下命令:查看chronyd是否启动systemctl status chronyd如果没启动执行如下命令启动systemctl restart chronyd每台检查时间状态chronyc...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。