Hue简介

南墨2年前技术文章1783

1.    Hue介绍

1.1.  Hue是什么

l   HUE = Hadoop User Experience

l   An open source Hadoop GUI

l   Web based

Hue汇聚了与大多数Apache Hadoop组件交互的接口,致力为Hadoop组件的Web图形化操作界面。Hue组件让用户轻松使用Hadoop,不用担心底层的复杂性实现,不使用命令行操作。用户可以轻松快捷的获取到结果。

1.2.  Hue能干什么

l   提供HDFS文件管理操作界面

l   提供MapReduce作业管理界面

l   Hive元数据管理

l   Hive脚本编辑器

l   Oozie工作流编辑和管理

l   提供Solr搜索界面和定制能力

l   提供Zookeeper浏览界面

l   ……






1.3.  Hue架构

1.png

1.4.  Hue安全机制

l   浏览器与Hue之间采用HTTPS协议,防止消息拦截。

l   支持单点登录,Hue与Manager使用同样账号(Manager上创建的所有人机账号都可以登录Hue)。

l   Hue与Hadoop组件之间采用Kerberos认证。

1.5.  Hue支持哪些组件

HDFS、HBase、S3

Hive、Impala、Presto、Trino、Flink、Phoenix、Druid、Spark

Solr、ES、ClickHouse

Spark、Yarn、Ooize、Knox

Oracle、PG、DB2、Vertica、MYSQL

2.    Hue应用举例

从文件中创建一个表

说明

本例演示从本地上传一个文件,然后根据文件创建Hive表并导入数据。

数据准备

下面为某公司员工工资数据,将其保存为文件(salary.txt)

CustNo,Gender,Department,Age,Salary

0001,男,开发部,30,10000

0002,男,开发部,28,19000

0003,男,开发部,30,10500

0004,女,开发部,33,12000

0005,男,开发部,27,9000

0006,男,开发部,35,18000

0007,女,市场部,30,11000

0008,男,市场部,29,24500

0009,女,市场部,38,30500

0010,男,市场部,45,12600

0011,男,市场部,28,9700

0012,男,市场部,35,18000

0013,女,公共部,24,5000

0014,女,公共部,25,45000

0015,男,公共部,25,6500

0016,女,公共部,30,18000

0017,女,公共部,23,4000

0018,女,公共部,25,45000

 

l  步骤一:

a、从Hue菜单上选择“表”,单击右边“新建”。

b、“类型”选择File。

c、单击..,然后单击“上传文件”,从本地选择文件salary.txt上传到hdfs路径下。

D、单击“下一页”。

2.png

l  步骤二:

a、Hue显示上传的文件内容,自动识别为一个电子表格。

b、单击“下一页”。

3.png

l  步骤三:

a、“目标”区域下的“名称”为表名称。如果需要,需要用户手动修改。

b、Hue自动识别字段名和类型,如果不正确,需要用户手动修改。

c、单击“提交”。

4.png

l  步骤四:

点击左侧导航按钮,右侧显示salary表定义。

5.png

相关文章

PG的pg_stat_statements插件

pg_stat_statements可追踪一个服务器所执行的所有 SQL 语句的执行统计信息,可以用于统计数据库的资源开销,分析TOP SQL。一、插件安装1、编译安装进入postgresql源码目录...

MySQL运维实战(2.1) 登录失败次数太多导致主机被block的问题处理

参数max_connect_errorsMySQL有参数max_connect_errors,当一个主机尝试登录MySQL,失败的次数超过了max_connect_errors,则这个主机将无法登录到...

阿里云ES跨账号数据迁移(reindex)

阿里云ES跨账号数据迁移(reindex)

1、背景与前置条件总的来说,阿里云es集群间数据迁移,有三中方式,logstash、reindex、镜像备份恢复,分别使用不同的场景,本文档主要讨论reindex方式进行账号下,ES跨集群迁移时,使用...

证书不识别问题处理

证书不识别问题处理

生成证书时客户端进入显示不识别在172.16.121.210生成一个证书后,使用keytool -importkeystore命令将其他节点172.16.121.114的条目进行合并,问题并没有解决,...

大数据平台袋鼠云托管运维与自建集群运维对比

对比维度袋鼠云托管运维自建hadoop集群运维成本根据业务需求定制架构,预估业务增涨合理规划,低成本高性价比需自行预估资源,规划架构性能大量集群优化经验,根据业务需求进行点对点优化采用开源社区版本,性...

CDH实操--HDFS高可用设置

CDH实操--HDFS高可用设置

1 概述        在HDFS集群中NameNode存在单点故障(SPOF),对于只有一个NameNode的集群,如果NameNode机...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。