大数据组件Superset

楼高2年前技术文章887
  1. Superset概述

    Apache Superset 是一个开源的、现代的、轻量级 BI 分析工具,能够对接多种数据源、 拥有丰富的图标展示形式、支持自定义仪表盘,且拥有友好的用户界面,十分易用。

  2. Superset应用场景

    由于 Superset 能够对接常用的大数据分析工具,如 Hive、Kylin、Druid 等,且支持自定 义仪表盘,故可作为数仓的可视化工具

  3. Superset安装使用

    3.1 安装Python环境

    Superset 是由 Python 语言编写的 Web 应用,要求 Python3.6 的环境

    3.2 安装Miniconda

    conda 是一个开源的包、环境管理器,可以用于在同一个机器上安装不同 Python 版本的软件包及其依赖,并能够在不同的 Python 环境之间切换,Anaconda 包括 Conda、Python 以 及一大堆安装好的工具包,比如:numpy、pandas 等,Miniconda 包括 Conda、Python。 此处,我们不需要如此多的工具包,只是用来管理不同版本的 Python 环境,故选择 MiniConda。

    3.3 Superset部署

    3.3.1 安装Superset依赖

    sudo yum install -y python-setuptools

  sudo yum install -y gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel cyrus-sasl-devel openldap-devel

  3.3.2 安装setuptools和pip

  pip install --upgrade setuptools pip -i https://pypi.douban.com/simple/

  3.3.3 安装Superset

  pip install apache-superset -i https://pypi.douban.com/simple/

  3.3.4 初始化Superset

  Superset是一个web应用,自带数据库需要初始化

  superset db upgrade

  3.3.5 创建管理员用户

  export FLASK_APP=superset

  flask fab create-admin

  下面根据提示填写管理员用户,flask 是一个 python web 框架,Superset 使用的就是 flask

    3.3.6 Superset初始化

  superset init

  3.3.7 启动Superset

  确保当前conda环境为superset,gunicorn --workers 5 --timeout 120 --bind hadoop001:8787 "superset.app:create_app()" --daemon

  说明: 

    workers:指定进程个数 

    timeout:worker 进程超时时间,超时会自动重启 

    bind:绑定本机地址,即为 Superset 访问地址 

    daemon:后台运行

    3.3.8 停止Superset

    ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9

  退出superset环境:conda deactivate

  3.3.9 登录Superset

  http://hdp001:8787

    

相关文章

Flink-CDC部署及测试

Flink-CDC部署及测试

1、CDC简介CDC (Change Data Capture) ,在广义的概念上,只要能捕获数据变更的技术,都可以称为 CDC 。但通常我们说的CDC 技术主要面向数据库(包括常见的mysql,Or...

Flink sql 集成hive metastore对接s3存储

1、hive metastore使用s3如何适配1、在flink conf目录中添加core-site.xml和hive-site.xml<?xml version="1.0" encoding...

开源大数据集群部署(十七)HADOOP集群配置(二)

开源大数据集群部署(十七)HADOOP集群配置(二)

1 HADOOP集群配置配置文件workers[root@hd1.dtstack.com software]# cd /opt/hadoop/etc/hadoop [root@hd1.dtstack...

SpringBootWeb 篇-深入了解 SpringBoot + Vue 的前后端分离项目部署上线与 Nginx 配置文件结构(3)

SpringBootWeb 篇-深入了解 SpringBoot + Vue 的前后端分离项目部署上线与 Nginx 配置文件结构(3)

4.0 SpringBoot 后端代码进行打包上传服务器        将 SpringBoot 项目进行打包:      &nb...

ChaosBlade介绍

ChaosBlade介绍

ChaosBlade 是阿里巴巴开源的一款遵循混沌工程原理和混沌实验模型的实验注入工具,帮助企业提升分布式系统的容错能力,并且在企业上云或往云原生系统迁移过程中业务连续性保障。Chaosblade 是...

Redis 慢查询相关配置

Redis 慢查询相关配置

一、查询生命周期一条查询的生命周期:发送命令命令排队执行命令返回结果Redis 慢日志只统计 “执行命令” 步骤 3 的耗时,所以没有慢查询并不代表客户端没有超时问题。二、慢日志配置参数慢日志相关的参...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。