EMR部署Kudu

耀灵1年前技术文章492

前置准备

部署kudu的节点yum安装cyrus相关包,如果有不通外网的可以在通外网的节点开启yum缓存包配置,将yum包缓存在本地后scp到不通外网的节点在进行yum安装。

yum install cyrus-sasl-plain  cyrus-sasl-devel  cyrus-sasl-gssapi

先获取kudu包,放在em节点上,在kudu包所在的服务器上执行,127.0.0.1指向的是em服务器的ip

# {package_name}表示为具体的tar包名称
curl http://127.0.0.1:8864/api/v2/product/upload -F 'package=@{package_name}'

EM部署

1.png

2.png

3.png

4.png

5.png

根据主机中实际情况将tserver的data盘改为如下配置。

6.png

7.png

冒烟测试

新建impalasql任务,创建kudu表

CREATE TABLE  test_student2 (                                           
   id INT NOT NULL ENCODING AUTO_ENCODING COMPRESSION DEFAULT_COMPRESSION,    
   name STRING NULL ENCODING AUTO_ENCODING COMPRESSION DEFAULT_COMPRESSION,   
   adress STRING NULL ENCODING AUTO_ENCODING COMPRESSION DEFAULT_COMPRESSION, 
   PRIMARY KEY (id)                                                           
 )                                                                            
 PARTITION BY HASH (id) PARTITIONS 20                                         
 STORED AS KUDU                                                               
 TBLPROPERTIES ('kudu.master_addresses'='10.168.86.68,10.168.86.69,10.168.86.70') ; 


 INSERT INTO test_student2 VALUES (1, "john","北京"), (2, "jane","天津"), (3, "jim","上海");

 select * from test_student2;

8.png

FAQ:

Q1:Bad status:Not found:Unable to initialize catalog manager:Failed to initialize sys tables async:Couldnot load tablet metadata from/var/lib/kudu/master/tablet-meta/00000000000000000000000000000000:/var/lib/kudu/master/tablet-meta/00000000000000000000000000000000:No such file or directory (error 2)

A:清掉对应的/data和/wal目录后重启kudu服务。


相关文章

使用Sqoop将数据从MySQL导入HBase (二)

使用Sqoop将数据从MySQL导入HBase (二)

创建hbase表create_namespace 'data';create 'data:data', {NAME => 'cf1'}, {NAME => 'cf2'}, {NAME =&...

kafka部署

安装前准备修改环境变量vi /etc/profile export KAFKA_HOME=/opt/kafkaexport PATH=$PATH:$KAFKA_HOME/bin创建用户及用户组grou...

oracle自带存储过程的压测使用

1、使用前提条件:A、timed_statistics参数为true B、sysdba权限 C、11g及以上版本 D、ASYNCH_IO开启通过运行以下查询,确保为数据文件启用异步 I/OCOL NA...

触发kube-apiserver流控导致ACK集群中节点状态异常

触发kube-apiserver流控导致ACK集群中节点状态异常

问题现象ack集群中一个节点状态为notready,但是排查节点上的核心组件:kubelet、kube-proxy、flannel、etcd等状态均为正常。排查步骤1、查日志分别排查核心组件以及系统日...

MySQL 复制-半同步搭建及原理

MySQL 复制-半同步搭建及原理

前言MySQL 半同步复制解决了什么问题?在传统主从架构中,主库实例提交事务与发送二进制日志是异步的,也就是说从库是否成功接收到二进制日志不会影响到主库事务提交,因此可能会出现  “主库发生宕机,主库...

emr部署hive并适配达梦数据库

emr部署hive并适配达梦数据库

一、达梦 用户、数据库初始化1、创建hive的元数据库create tablespace hive_meta datafile '/dm8/data/DAMENG/hive_meta.dbf' siz...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。