大数据组件Superset

楼高2年前技术文章970
  1. Superset概述

    Apache Superset 是一个开源的、现代的、轻量级 BI 分析工具,能够对接多种数据源、 拥有丰富的图标展示形式、支持自定义仪表盘,且拥有友好的用户界面,十分易用。

  2. Superset应用场景

    由于 Superset 能够对接常用的大数据分析工具,如 Hive、Kylin、Druid 等,且支持自定 义仪表盘,故可作为数仓的可视化工具

  3. Superset安装使用

    3.1 安装Python环境

    Superset 是由 Python 语言编写的 Web 应用,要求 Python3.6 的环境

    3.2 安装Miniconda

    conda 是一个开源的包、环境管理器,可以用于在同一个机器上安装不同 Python 版本的软件包及其依赖,并能够在不同的 Python 环境之间切换,Anaconda 包括 Conda、Python 以 及一大堆安装好的工具包,比如:numpy、pandas 等,Miniconda 包括 Conda、Python。 此处,我们不需要如此多的工具包,只是用来管理不同版本的 Python 环境,故选择 MiniConda。

    3.3 Superset部署

    3.3.1 安装Superset依赖

    sudo yum install -y python-setuptools

  sudo yum install -y gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel cyrus-sasl-devel openldap-devel

  3.3.2 安装setuptools和pip

  pip install --upgrade setuptools pip -i https://pypi.douban.com/simple/

  3.3.3 安装Superset

  pip install apache-superset -i https://pypi.douban.com/simple/

  3.3.4 初始化Superset

  Superset是一个web应用,自带数据库需要初始化

  superset db upgrade

  3.3.5 创建管理员用户

  export FLASK_APP=superset

  flask fab create-admin

  下面根据提示填写管理员用户,flask 是一个 python web 框架,Superset 使用的就是 flask

    3.3.6 Superset初始化

  superset init

  3.3.7 启动Superset

  确保当前conda环境为superset,gunicorn --workers 5 --timeout 120 --bind hadoop001:8787 "superset.app:create_app()" --daemon

  说明: 

    workers:指定进程个数 

    timeout:worker 进程超时时间,超时会自动重启 

    bind:绑定本机地址,即为 Superset 访问地址 

    daemon:后台运行

    3.3.8 停止Superset

    ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9

  退出superset环境:conda deactivate

  3.3.9 登录Superset

  http://hdp001:8787

    

相关文章

ES运维(八)添加IK分词器

ES运维(八)添加IK分词器

一、概述ES自带standard analyzer、simple analyzer、whitespace analyzer、stop analyzer、language analyzer、patter...

Nginx实现数据库端口转发

一、需求客户想要将IDC服务器的数据库端口暴漏在公网上,然后其他业务来调数据库接口。为了保证安全,只开放指定的公网ip访问。二、逻辑设计由于客户的IDC服务器与云ECS服务器通过专线打通,所以只需要在...

Linux高并发系统内核优化

1)timewait的数量,默认是180000。(Deven:因此如果想把timewait降下了就要把tcp_max_tw_buckets值减小)net.ipv4.tcp_max_tw_buckets...

MySQL运维实战(3.1) MySQL官方客户端使用介绍

mysql是mysql安装包默认的客户端。位于二进制安装包的bin目录。或者通过rpm安装包安装mysql-community-client。使用mysql程序linux终端下,输入mysql命令登陆...

Linux操作系统之Linux命令的返回值

Linux命令执行后无论成功与否都有一个返回值,如果为 0,则表示命令执行成功,其它值则表示执行错误。具体的错误码含义如下:  "OS error code  1: Operation not per...

云原生之网络篇

云原生之网络篇

前言:在云原生如火如荼的今天,作为云原生的基石:kubernetes(简称k8s)是不得不掌握的技术。而k8s的网络插件是大家绕不开的技术,但是由于k8s的开源包容性,以及网络的复杂性,导致网络插件出...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。