Hue简介

南墨2年前技术文章1324

1.    Hue介绍

1.1.  Hue是什么

l   HUE = Hadoop User Experience

l   An open source Hadoop GUI

l   Web based

Hue汇聚了与大多数Apache Hadoop组件交互的接口,致力为Hadoop组件的Web图形化操作界面。Hue组件让用户轻松使用Hadoop,不用担心底层的复杂性实现,不使用命令行操作。用户可以轻松快捷的获取到结果。

1.2.  Hue能干什么

l   提供HDFS文件管理操作界面

l   提供MapReduce作业管理界面

l   Hive元数据管理

l   Hive脚本编辑器

l   Oozie工作流编辑和管理

l   提供Solr搜索界面和定制能力

l   提供Zookeeper浏览界面

l   ……






1.3.  Hue架构

1.png

1.4.  Hue安全机制

l   浏览器与Hue之间采用HTTPS协议,防止消息拦截。

l   支持单点登录,Hue与Manager使用同样账号(Manager上创建的所有人机账号都可以登录Hue)。

l   Hue与Hadoop组件之间采用Kerberos认证。

1.5.  Hue支持哪些组件

HDFS、HBase、S3

Hive、Impala、Presto、Trino、Flink、Phoenix、Druid、Spark

Solr、ES、ClickHouse

Spark、Yarn、Ooize、Knox

Oracle、PG、DB2、Vertica、MYSQL

2.    Hue应用举例

从文件中创建一个表

说明

本例演示从本地上传一个文件,然后根据文件创建Hive表并导入数据。

数据准备

下面为某公司员工工资数据,将其保存为文件(salary.txt)

CustNo,Gender,Department,Age,Salary

0001,男,开发部,30,10000

0002,男,开发部,28,19000

0003,男,开发部,30,10500

0004,女,开发部,33,12000

0005,男,开发部,27,9000

0006,男,开发部,35,18000

0007,女,市场部,30,11000

0008,男,市场部,29,24500

0009,女,市场部,38,30500

0010,男,市场部,45,12600

0011,男,市场部,28,9700

0012,男,市场部,35,18000

0013,女,公共部,24,5000

0014,女,公共部,25,45000

0015,男,公共部,25,6500

0016,女,公共部,30,18000

0017,女,公共部,23,4000

0018,女,公共部,25,45000

 

l  步骤一:

a、从Hue菜单上选择“表”,单击右边“新建”。

b、“类型”选择File。

c、单击..,然后单击“上传文件”,从本地选择文件salary.txt上传到hdfs路径下。

D、单击“下一页”。

2.png

l  步骤二:

a、Hue显示上传的文件内容,自动识别为一个电子表格。

b、单击“下一页”。

3.png

l  步骤三:

a、“目标”区域下的“名称”为表名称。如果需要,需要用户手动修改。

b、Hue自动识别字段名和类型,如果不正确,需要用户手动修改。

c、单击“提交”。

4.png

l  步骤四:

点击左侧导航按钮,右侧显示salary表定义。

5.png

相关文章

MySQL的数据拆分

MySQL的数据拆分

一、拆分的概念数据拆分当数据过大,存储、SQL性能达到瓶颈;或多个业务共用一个数据库实例,一个小功能故障导致整个系统瘫痪;为解决类似问题,需考虑对数据进行拆分;粗一级的拆分,针对的是业务系统,将不同业...

crs启动报错CRS-4124 CRS-4000

现象:crs启动报错CRS-4124 CRS-4000 CRS-0715# crsctl start crsCRS-4124: Oracle High Availability Services st...

Flink 运行架构简介

Flink 运行架构简介

一、Flink简介Apache Flink 是一个开源的分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态计算。它具备强一致性的计算能力、大规模的扩展性,整体性能非常卓越,同时支持SQL、Ja...

Kafka日志管理

Kafka在运行时会生成大量的日志记录信息,包含了运行状态、错误信息、性能指标等。这些日志文件会占用很大的磁盘空间,过多的日志文件也会影响Kafka的性能,因此需要采取一些日志管理措施来清理无用的日志...

mcasttest-tool组播检测工具

mcasttest-tool组播检测工具

检测组播mcasttest-tool是oracle组播检测工具,组播是oracle 11.2.0.2开始的新功能1、上传mcasttest工具解压并授权[root@rac1 soft]# cd /u0...

MySQL 复制-无数据环境搭建异步复制

MySQL 复制-无数据环境搭建异步复制

全新初始化(新环境,无数据)搭建 MySQL 异步复制 & GTID 复制标准文档。一、前言环境说明:操作系统 CentOS 7  & 数据库版本 5.7.32参数要求:主库必须开启...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。