HBase基本架构

浩客1年前技术文章704

111111111111111.PNG

架构角色:

(1)Master

Master 是所有 RegionServer 的管理者,负责监控集群中所有的 RegionServer 实例。主要作用如下:

  • 管理元数据表格 hbase:meta,接收用户对表格创建修改删除的命令并执行;对于表的操作:create, delete, alter

  • 监控 region 是否需要进行负载均衡,故障转移和 region 的拆分;对于 RegionServer的操作:分配 regions 到每个 RegionServer。


(2)Region Server

Region Server 为 Region 的管理者,主要作用如下:

  • 对于数据的操作:负责数据 cell 的处理,例如写入数据 put,查询数据 get 、delete

  • 对于 Region 的操作,拆分合并 region 的实际执行者,有 master 监控,有 regionServer 执行,splitRegion、compactRegion


(3)Zookeeper

HBase 通过 Zookeeper 来做 master 的高可用、RegionServer 的监控、记录 RegionServer 的部署信息、并且存储有 meta 表的位置信息。

HBase 对于数据的读写操作时直接访问 Zookeeper 的。


(4)HDFS

HDFS是Hadoop生态下的分布式文件系统,提供最终的底层数据存储服务,同时为 HBase 提供高容错的支持。

(5)WAL预写日志处理器

master 需要执行的任务记录到预写日志 WAL 中,如果 master 宕机,让 backupMaster

读取日志继续干。


(6)MemStore

写缓存,由于 HFile 中的数据要求是有序的,所以数据是先存储在 MemStore 中,排好序后,等到达刷写时机才会刷写到 HFile,每次刷写都会形成一个新的 HFile。


相关文章

大数据集群二次开发及调优使用指导(一)-HDFS

1.   典型业务调优涉及HDFS的相关业务一般可以分为IO密集型业务,计算密集型业务,低延迟业务,高吞吐量业务1.1     低延迟业务计...

副本集同步原理

一、Initial Sync大体来说,MongoDB副本集同步主要包含两个步骤:1. Initial Sync,全量同步2. Replication,即sync oplog先通过init sync同步...

Flume使用案例之监控端口数据

监控端口数据目标:Flume监控一端Console,另一端Console发送消息,使被监控端实时显示。分步实现:1. 安装telnet工具yum -y install telnet2. 创建Flume...

EMR-flinksql运行失败问题

EMR-flinksql运行失败问题

运行flinksqlsql-client.sh报错:[root@emr1 bin]# ./sql-client.shSLF4J: Class path contains multiple SLF4J...

PostgreSQL 逻辑备份详解

前言当谈到关系型数据库的备份和恢复时,逻辑备份是一种备份方法,它备份数据库的逻辑结构和数据,而不是直接备份磁盘上的物理数据。这样做有许多好处,比如备份速度更快,可以选择性地备份数据库中的某些数据,以及...

卸载mysql

1、查看安装的mysql,并停止mysqlps -ef|grep mysql #停止mysql  kill -9 pid2、卸载mysql安装包二进制安装的没有安装包 #查看安装的mysql...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。