使用impala操作kudu

九月1年前技术文章412

登录impala-shell,创建impala_kudu数据库。

1、创建表

CREATE TABLE student (
	id int not null,
	name STRING null ,
	adress STRING NULL ENCODING AUTO_ENCODING COMPRESSION DEFAULT_COMPRESSION,
	PRIMARY KEY (id) --主键
)PARTITION BY HASH (id) PARTITIONS 20--分区方式
STORED AS KUDU TBLPROPERTIES('kudu.master_addresses'='cdh01');

图3.png

也可以CREATE TABLE ... AS SELECT

CREATE TABLE impala_kudu_student
PRIMARY KEY (id)
PARTITION BY HASH(id) PARTITIONS 8
STORED AS KUDU
AS SELECT id,name,adress FROM student;

图4.png

其中

主键创建原则:

图5.png

字段数据类型包括:

图6.png

ENCODING格式:

图7.png

图8.png

COMPRESSION类型:

图9.png

分区方式:

图10.png

TBLPROPERTIES:

可以设置kudu的表名和kudu.master_addresses及表类型等。

ALTER TABLE impala_kudu_student SET TBLPROPERTIES('EXTERNAL' = 'FALSE');
ALTER TABLE 表名 RENAME TO 新表名;
ALTER TABLE 表名 SET TBLPROPERTIES('kudu.table_name' = '外部映射表')
ALTER TABLE 表名 SET TBLPROPERTIES('kudu.master_addresses' = 'kudu master新地址');


2、插入数据

INSERT INTO impala_kudu.student
(id, name, adress)
VALUES(1, '张三', '00号');

图11.png

3、更新数据

UPDATE student SET name="张三1" where id = 1;

图12.png

4、删除数据

DELETE FROM student  WHERE id =1;

图13.png

5、删除表

drop table impala_kudu_student;

图14.png


标签: kudu

相关文章

大数据高可用系列--kudu高可用应急方案

大数据高可用系列--kudu高可用应急方案

1 设置机架感知1.1 前置说明    1.9版本后的kudu已经支持机架感知(cdh6之后的版本中的kudu已支持),由于kudu的每个Tablet一般是三副...

CDH实操--kudumaster迁移

CDH实操--kudumaster迁移

1 概述本次kudumaster迁移,中间不需要停kudu集群(会涉及滚动重启kudu角色); 注:若因为任务持续运行导致kudu停止超时可手动一台台停止-启动2 master迁移将cdh2中的ma...

大数据组件--Hive与Impala的异同

大数据组件--Hive与Impala的异同

一、同数据存储:使用相同的存储数据池都支持把数据存储于HDFS, HBase。元数据:两者使用相同的元数据。SQL语法:基本类似。二、异1)、底层运行使用的技术hive底层默认使用mapreduce引...

大数据组件--Impala概述

Apache Impala是一个适用于实时交互的sql软件,是基于hive的大数据分析查询引擎,hive和impala有不同的侧重面,通常是两个互相配合工作,可以先用hive进行一个数据的预处理清洗转...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。