Hue简介

南墨2年前技术文章1465

1.    Hue介绍

1.1.  Hue是什么

l   HUE = Hadoop User Experience

l   An open source Hadoop GUI

l   Web based

Hue汇聚了与大多数Apache Hadoop组件交互的接口,致力为Hadoop组件的Web图形化操作界面。Hue组件让用户轻松使用Hadoop,不用担心底层的复杂性实现,不使用命令行操作。用户可以轻松快捷的获取到结果。

1.2.  Hue能干什么

l   提供HDFS文件管理操作界面

l   提供MapReduce作业管理界面

l   Hive元数据管理

l   Hive脚本编辑器

l   Oozie工作流编辑和管理

l   提供Solr搜索界面和定制能力

l   提供Zookeeper浏览界面

l   ……






1.3.  Hue架构

1.png

1.4.  Hue安全机制

l   浏览器与Hue之间采用HTTPS协议,防止消息拦截。

l   支持单点登录,Hue与Manager使用同样账号(Manager上创建的所有人机账号都可以登录Hue)。

l   Hue与Hadoop组件之间采用Kerberos认证。

1.5.  Hue支持哪些组件

HDFS、HBase、S3

Hive、Impala、Presto、Trino、Flink、Phoenix、Druid、Spark

Solr、ES、ClickHouse

Spark、Yarn、Ooize、Knox

Oracle、PG、DB2、Vertica、MYSQL

2.    Hue应用举例

从文件中创建一个表

说明

本例演示从本地上传一个文件,然后根据文件创建Hive表并导入数据。

数据准备

下面为某公司员工工资数据,将其保存为文件(salary.txt)

CustNo,Gender,Department,Age,Salary

0001,男,开发部,30,10000

0002,男,开发部,28,19000

0003,男,开发部,30,10500

0004,女,开发部,33,12000

0005,男,开发部,27,9000

0006,男,开发部,35,18000

0007,女,市场部,30,11000

0008,男,市场部,29,24500

0009,女,市场部,38,30500

0010,男,市场部,45,12600

0011,男,市场部,28,9700

0012,男,市场部,35,18000

0013,女,公共部,24,5000

0014,女,公共部,25,45000

0015,男,公共部,25,6500

0016,女,公共部,30,18000

0017,女,公共部,23,4000

0018,女,公共部,25,45000

 

l  步骤一:

a、从Hue菜单上选择“表”,单击右边“新建”。

b、“类型”选择File。

c、单击..,然后单击“上传文件”,从本地选择文件salary.txt上传到hdfs路径下。

D、单击“下一页”。

2.png

l  步骤二:

a、Hue显示上传的文件内容,自动识别为一个电子表格。

b、单击“下一页”。

3.png

l  步骤三:

a、“目标”区域下的“名称”为表名称。如果需要,需要用户手动修改。

b、Hue自动识别字段名和类型,如果不正确,需要用户手动修改。

c、单击“提交”。

4.png

l  步骤四:

点击左侧导航按钮,右侧显示salary表定义。

5.png

相关文章

MySQL 8.0 新特性:Descending Indexes

MySQL 8.0 新特性:Descending Indexes

一、前言MySQL 8.0 之前的索引排序规则之前只允许 ASC 存储,创建时指定 DESC 也会被忽略,8.0 版本为我们带来了 Descending Indexes 降序索引 👏👏👏只能使用 AS...

大数据自动化巡检系统使用说明

大数据自动化巡检系统使用说明

1. 大数据自动化巡检系统首页显示巡检集群数量、巡检模版、巡检指标、当日巡检情况等,如下图所示2. 自动化巡检提供基础配置,提供给两种巡检集群对接方式,一种是可以对接外部集群,通过系统接口调用,一种是...

数据湖技术之iceberg(十三)Iceberg与Hudi对比

Iceberg和Hudi都是数据湖技术,从社区活跃度上来看,Iceberg有超越Hudi的趋势。他们有以下共同点:l   都是构建于存储格式之上的数据组织方式l &nbs...

flink算子优化

flink算子优化

这里先看两个任务的逻辑执行图:图一:全部打散的任务执行图图二:使用slot资源共享的任务执行图图一和图二中的两个任务是同一个任务,不同点是图一将所有的算子全部打散,在代码中使用了以下逻辑:,或者就是禁...

Linux SSSD同步多ou用户

Linux SSSD同步多ou用户

1、背景在使用AD作为ldap服务器,使用sssd同步用户到服务器,但是AD中用户过多,分布在不同部门的ou中。如果全部进行同步,则会对ad服务器压力过大,用户缓存同步缓慢。需要能够指定多个ou进行同...

flink sql 批处理

进入flink sql命令行sql-client.shSource 表        与所有 SQL 引擎一样,Flink 查询操作是在表上进行。与传统数据库不同,Flink 不在本地管理静态数据;相...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。