Impala 操作命令

浩客2年前技术文章990

Impala的外部shell

选项

描述

-h, --help

显示帮助信息

-v or --version

显示版本信息

-i hostname, --impalad=hostname

指定连接运行 impalad 守护进程的主机。默认端口是 21000。

-q query, --query=query

从命令行中传递一个shell 命令。执行完这一语句后 shell 会立即退出。

-f query_file, --query_file= query_file

传递一个文件中的 SQL 查询。文件内容必须以分号分隔

-o filename or --output_file filename

保存所有查询结果到指定的文件。通常用于保存在命令行使用 -q 选项执行单个查询时的查询结果。

-c

查询执行失败时继续执行

-d default_db or --database=default_db

指定启动后使用的数据库,与建立连接后使用use语句选择数据库作用相同,如果没有指定,那么使用default数据库

-r or --refresh_after_connect

建立连接后刷新 Impala 元数据

-p, --show_profiles

对 shell 中执行的每一个查询,显示其查询执行计划

-B(–delimited)

去格式化输出

–output_delimiter=character

指定分隔符

–print_header

打印列名

1、连接指定hadoop101的impala主机

impala-shell -i cdh02

image.png

2、使用-q查询表中数据,并将数据写入文件中

impala-shell -q 'select * from hive_test.student' -o output.txt

3、查询执行失败时继续执行

vim impala.sql
   select * from hive_test.student;
   select * from hive_test.stu;
   select * from hive_test.student;

impala-shell -f impala.sql;
impala-shell -c -f impala.sql;

4、在Hive中创建表后,使用-r刷新元数据

impala-shell -r

5、显示查询执行计划

impala-shell -p
select * from student;

Impala的内部shell

选项

选项

help

显示帮助信息

explain <sql>

显示执行计划

profile

(查询完成后执行) 查询最近一次查询的底层信息

shell <shell>

不退出impala-shell执行shell命令

version

显示版本信息(同于impala-shell -v)

connect

连接impalad主机,默认端口21000(同于impala-shell -i)

refresh <tablename>

增量刷新元数据库

invalidate metadata

全量刷新元数据库(慎用)(同于 impala-shell -r)

history

历史命令

1、查看执行计划

[cdh02:21000] default> explain select * from student;

2、查询最近一次查询的底层信息

[cdh02:21000] default> select count(*) from student;
[cdh02:21000] default> profile;

3、查看HDFS及Linux文件系统

[cdh02:21000] default> shell hadoop fs -ls /;
[cdh02:21000] default> shell ls -al ./;

4、刷新指定表的元数据

hive> load data local inpath '/mnt/student.txt' into table student;
[cdh02:21000] default> select * from student;
[cdh02:21000] default> refresh student;
[cdh02:21000] default> select * from student;


相关文章

CDH时钟同步问题

CDH时钟同步问题

首先执行如下命令:查看chronyd是否启动systemctl status chronyd如果没启动执行如下命令启动systemctl restart chronyd每台检查时间状态chronyc...

热点现象(数据倾斜)怎么产生的,以及解决方法有哪些

热点现象:某个小的时段内,对HBase 的读写请求集中到极少数的Region 上,导致这些region所在的RegionServer 处理请求量骤增,负载量明显偏大,而其他的RgionServer明显...

prometheus operator部署(olm方式)

prometheus operator部署(olm方式)

prometheus operator部署(olm方式)olmolm即Operator Lifecycle Manager,是用来管理operator生命周期的工具homepage安装olm首先需要我...

ldap安装部署

ldap安装部署

一、关闭selinux和防火墙sed -i 's#SELINUX=enforcing#SELINUX=disabled#g' /etc/selinux/c...

SpringBootWeb 篇-深入了解 SpringBoot + Vue 的前后端分离项目部署上线与 Nginx 配置文件结构(2)

SpringBootWeb 篇-深入了解 SpringBoot + Vue 的前后端分离项目部署上线与 Nginx 配置文件结构(2)

        3.0 在云服务器进行环境配置        将项目放到云服务器上运行,那么离不开项目所依赖的环境,比如...

grafana7 监控https证书过期时间

grafana7 监控https证书过期时间

使用 Grafana 7 中new table visualization功能,使用Prometheus监视证书的到期日期,并使用Grafana进行展示。所有证书一目了然:证书到期之前的剩余时间,HT...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。