HBase导出表和备份表操作

芒果11个月前技术文章542

HBase提供了几种导出数据的方式,包括使用HBase自带的工具和使用HBase的API。
本文主要是讲的使用HBase自带的工具进行导出
首先我们创建一个表 插入一些数据
hbase shell
list
create 'hbase_check3', 'data'
put 'hbase_check','row1','data:1','value1'
put 'hbase_check','row2','data:2','value2'
scan 'hbase_check'
get 'hbase_check','row1'
list

1C150528-C7A5-4E4A-A74D-1D1F7A9522C9.png
使用HBase自带的工具
使用该工具的命令如下
hbase org.apache.hadoop.hbase.mapreduce.Export hbase_check /opt/hbase_check
其中,<tablename>是要导出数据的表名,<outputdir>是导出数据的目录(hdfs的)。
走的是mr的逻辑
42352DAE-F9F2-4EF9-AC62-B562BD292806.png
这样就可以直接get下来了
73469196-CCC4-452E-8774-1DDCB5A62B02.png
备份表操作
0F4FDB1F-A1CC-4BB7-B4F2-F9797F62D9BC.png
我们要备份的是hbase_check表 
HBase提供了内置的备份功能,可以通过HBase Shell或HBase Java API进行操作。下面是一个使用HBase Shell进行备份的示例:
基于Hbase snapshot数据快速备份方法:
# 备份表数据
disable 'hbase_check'
snapshot 'hbase_check', 'hbase_check1'
enable 'hbase_check'
# 恢复表数据
disable 'hbase_check'
restore_snapshot 'hbase_check1'
enable 'hbase_check'
#查看快照
list_snapshots
基于hbase提供的类对hbase中某张表进行备份
hbase org.apache.hadoop.hbase.mapreduce.Export hbase_check /opt/hbase_check1
B78B286E-42CC-4E2E-B2B0-522C9A837E78.png
创建备份表
create 'hbase_check3', 'data'
将hdfs上的数据导入到备份目标表中
hbase org.apache.hadoop.hbase.mapreduce.Driver import hbase_check3 /opt/hbase_check/*
走的同样是mr
7D9E534F-3703-418B-B32C-7FB43831B296.png
最后我们查看下数据
scan 'hbase_check3'
B4DB2097-A8BB-4914-B1F8-08B80746B7D5.png
ps
手动flushflush ‘hbase_check'


相关文章

EMR-java配置国密SM4加密

EMR-java配置国密SM4加密

首先找到bcprov-jdk15on-1.56.jar这个包<dependency>    <groupId>org.bouncycastle</groupId> ...

使用Sqoop将数据从Hive导入MySQL(一)

使用Sqoop将数据从Hive导入MySQL(一)

使用Sqoop将数据从Hive导入MySQL首先查看csv数据类型创建类似的hive表并导入数据CREATE TABLE data (    province STRING,    code INT,...

nginx配置反向代理某个url

nginx配置反向代理某个url

本文讲的这个漏洞 主要是为了解决漏洞扫描的问题我先介绍下这个漏洞主要是因为访问https://172.16.120.17:18090/ws/v1/cluster/info这个 yarn rest的一个...

Java-API-MapReduce的操作WordCount篇

Java-API-MapReduce的操作WordCount篇

首先就是pom文件<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/...

kubernetes HPA

kubernetes HPA

Horizontal Pod Autoscaling 可以根据 CPU 利用率自动伸缩一个 ReplicaSet、Deployment 或者中的 Pod 数量cat hpa-deploy.yaml a...

如何重塑IT运维核心竞争力?可观测运维这么做!

如何重塑IT运维核心竞争力?可观测运维这么做!

随着云计算、大数据、人工智能等新兴技术的兴起及运用,无论是通讯、金融、教育,还是交通、政府、企业等行业,都得到飞速发展,但在高速发展的同时,各行业巨大的 IT 维护和管理成本也在与日俱增,存在监控工具...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。