HBase基本架构

浩客2年前技术文章908

111111111111111.PNG

架构角色:

(1)Master

Master 是所有 RegionServer 的管理者,负责监控集群中所有的 RegionServer 实例。主要作用如下:

  • 管理元数据表格 hbase:meta,接收用户对表格创建修改删除的命令并执行;对于表的操作:create, delete, alter

  • 监控 region 是否需要进行负载均衡,故障转移和 region 的拆分;对于 RegionServer的操作:分配 regions 到每个 RegionServer。


(2)Region Server

Region Server 为 Region 的管理者,主要作用如下:

  • 对于数据的操作:负责数据 cell 的处理,例如写入数据 put,查询数据 get 、delete

  • 对于 Region 的操作,拆分合并 region 的实际执行者,有 master 监控,有 regionServer 执行,splitRegion、compactRegion


(3)Zookeeper

HBase 通过 Zookeeper 来做 master 的高可用、RegionServer 的监控、记录 RegionServer 的部署信息、并且存储有 meta 表的位置信息。

HBase 对于数据的读写操作时直接访问 Zookeeper 的。


(4)HDFS

HDFS是Hadoop生态下的分布式文件系统,提供最终的底层数据存储服务,同时为 HBase 提供高容错的支持。

(5)WAL预写日志处理器

master 需要执行的任务记录到预写日志 WAL 中,如果 master 宕机,让 backupMaster

读取日志继续干。


(6)MemStore

写缓存,由于 HFile 中的数据要求是有序的,所以数据是先存储在 MemStore 中,排好序后,等到达刷写时机才会刷写到 HFile,每次刷写都会形成一个新的 HFile。


相关文章

MySQL 评估 ALTER TABLE 进度(5.7)

MySQL 评估 ALTER TABLE 进度(5.7)

一、前言问题:大表里执行 ALTER TABLE 的时候,经常会比较忐忑,会面临 “跑又跑不完 Kill 也不敢 Kill” 的窘境。需求:客户在执行 ALTER TABLE 时也会让我们来评估影响的...

lru_cache 缓存

Python 语法: @functools.lru_cache(maxsize=128, typed=False)Least-recently-used 装饰器。Iru 最近最少使用、cache 缓存...

oracle adg切换

1 主库转备库注意:原则上至多只能有一个主库,但是备库可以多个,所以需要先进行主库转备库操作。1.1 查看主库角色切换状态SYS@proe>select name,database_role,s...

大数据集群部署规划(四)组件建议规格

类型指标名称规格说明HDFS单对NameNode最大文件数1亿-单DataNode最大block数500万GC参数 -Xmx32G单个DataNode磁盘最多block数50万-单个目录下最多文件目录...

Redis 命令行 redis-cli 介绍

前言redis-cli 是 Redis 自带的命令行工具,是运维和开发人员常用的工具,本篇文章将介绍它的使用技巧和一些有趣的功能。1. 连接 Redis 服务redis-cli 默认连接的是 127....

Linux高并发Nginx配置优化

在日常的运维工作中,经常会用到nginx服务,也时常会碰到nginx因高并发导致的性能瓶颈问题。一般来说nginx配置文件中对优化比较有作用的主要有以下几项:1)nginx进程数,建议按照cpu数目来...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。