HBase导出表和备份表操作

芒果2年前技术文章1553

HBase提供了几种导出数据的方式,包括使用HBase自带的工具和使用HBase的API。
本文主要是讲的使用HBase自带的工具进行导出
首先我们创建一个表 插入一些数据
hbase shell
list
create 'hbase_check3', 'data'
put 'hbase_check','row1','data:1','value1'
put 'hbase_check','row2','data:2','value2'
scan 'hbase_check'
get 'hbase_check','row1'
list

1C150528-C7A5-4E4A-A74D-1D1F7A9522C9.png
使用HBase自带的工具
使用该工具的命令如下
hbase org.apache.hadoop.hbase.mapreduce.Export hbase_check /opt/hbase_check
其中,<tablename>是要导出数据的表名,<outputdir>是导出数据的目录(hdfs的)。
走的是mr的逻辑
42352DAE-F9F2-4EF9-AC62-B562BD292806.png
这样就可以直接get下来了
73469196-CCC4-452E-8774-1DDCB5A62B02.png
备份表操作
0F4FDB1F-A1CC-4BB7-B4F2-F9797F62D9BC.png
我们要备份的是hbase_check表 
HBase提供了内置的备份功能,可以通过HBase Shell或HBase Java API进行操作。下面是一个使用HBase Shell进行备份的示例:
基于Hbase snapshot数据快速备份方法:
# 备份表数据
disable 'hbase_check'
snapshot 'hbase_check', 'hbase_check1'
enable 'hbase_check'
# 恢复表数据
disable 'hbase_check'
restore_snapshot 'hbase_check1'
enable 'hbase_check'
#查看快照
list_snapshots
基于hbase提供的类对hbase中某张表进行备份
hbase org.apache.hadoop.hbase.mapreduce.Export hbase_check /opt/hbase_check1
B78B286E-42CC-4E2E-B2B0-522C9A837E78.png
创建备份表
create 'hbase_check3', 'data'
将hdfs上的数据导入到备份目标表中
hbase org.apache.hadoop.hbase.mapreduce.Driver import hbase_check3 /opt/hbase_check/*
走的同样是mr
7D9E534F-3703-418B-B32C-7FB43831B296.png
最后我们查看下数据
scan 'hbase_check3'
B4DB2097-A8BB-4914-B1F8-08B80746B7D5.png
ps
手动flushflush ‘hbase_check'


相关文章

chengying-6.0登入接口逆向

chengying-6.0登入接口逆向

版本更新首先是登入的加密url:http://172.16.121.70/login参数1. username:admin@dtstack.com2. password:614bb9438210c69...

中国式IT运维,趟出自己的“长期主义”河流

2018年,Gartner曾做过一次长达6个月的调查问卷。在这个主题为AIOps的问卷中,Gartner选取了500家各行业头部的企业,针对其当下的IT架构来判断调研企业未来是否会加大对于AIOps的...

hive 报 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster

hive 报 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster

解决办法:关键需要配置两个配置:mapred-site.xml 和 yarn-site.xml下面配置hadoop classpath。先运行shell命令:hadoop classpath添加一个配...

基于Gitlab和Kubernetes的CI/CD

基于Gitlab和Kubernetes的CI/CD

此套CI/CD流程仅依赖gitlab。runner等组件安装在kubernetes集群中,尽量减少其他依赖,便于维护。依赖介绍gitlab runnergitlab runner用来运行我们的作业并将...

寻找CPU使用率高进程方法

寻找CPU使用率高进程方法

背景节点报CPU使用率高,需要定位是什么进程占用CPU使用率高。CPU使用率持续较高在对应节点使用 “top”命令,然后键盘输入“P”,即按照CPU使用率排序进程。执行ps -ef | grep &l...

nginx配置反向代理某个url

nginx配置反向代理某个url

本文讲的这个漏洞 主要是为了解决漏洞扫描的问题我先介绍下这个漏洞主要是因为访问https://172.16.120.17:18090/ws/v1/cluster/info这个 yarn rest的一个...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。