Impala 操作命令

浩客2年前 (2023-12-24)技术文章1279

Impala的外部shell

选项	描述
-h, --help	显示帮助信息
-v or --version	显示版本信息
-i hostname, --impalad=hostname	指定连接运行 impalad 守护进程的主机。默认端口是 21000。
-q query, --query=query	从命令行中传递一个shell 命令。执行完这一语句后 shell 会立即退出。
-f query_file, --query_file= query_file	传递一个文件中的 SQL 查询。文件内容必须以分号分隔
-o filename or --output_file filename	保存所有查询结果到指定的文件。通常用于保存在命令行使用 -q 选项执行单个查询时的查询结果。
-c	查询执行失败时继续执行
-d default_db or --database=default_db	指定启动后使用的数据库，与建立连接后使用use语句选择数据库作用相同，如果没有指定，那么使用default数据库
-r or --refresh_after_connect	建立连接后刷新 Impala 元数据
-p, --show_profiles	对 shell 中执行的每一个查询，显示其查询执行计划
-B（–delimited）	去格式化输出
–output_delimiter=character	指定分隔符
–print_header	打印列名

1、连接指定hadoop101的impala主机

impala-shell -i cdh02

2、使用-q查询表中数据，并将数据写入文件中

impala-shell -q 'select * from hive_test.student' -o output.txt

3、查询执行失败时继续执行

vim impala.sql
   select * from hive_test.student;
   select * from hive_test.stu;
   select * from hive_test.student;

impala-shell -f impala.sql;
impala-shell -c -f impala.sql;

4、在Hive中创建表后，使用-r刷新元数据

impala-shell -r

5、显示查询执行计划

impala-shell -p
select * from student;

Impala的内部shell

选项	选项
help	显示帮助信息
explain <sql>	显示执行计划
profile	(查询完成后执行）查询最近一次查询的底层信息
shell <shell>	不退出impala-shell执行shell命令
version	显示版本信息（同于impala-shell -v）
connect	连接impalad主机，默认端口21000（同于impala-shell -i）
refresh <tablename>	增量刷新元数据库
invalidate metadata	全量刷新元数据库（慎用）（同于 impala-shell -r）
history	历史命令

1、查看执行计划

[cdh02:21000] default> explain select * from student;

2、查询最近一次查询的底层信息

[cdh02:21000] default> select count(*) from student;
[cdh02:21000] default> profile;

3、查看HDFS及Linux文件系统

[cdh02:21000] default> shell hadoop fs -ls /;
[cdh02:21000] default> shell ls -al ./;

4、刷新指定表的元数据

hive> load data local inpath '/mnt/student.txt' into table student;
[cdh02:21000] default> select * from student;
[cdh02:21000] default> refresh student;
[cdh02:21000] default> select * from student;

返回列表

上一篇：hive元数据迁移

下一篇：Hive合并小文件：hive归档（archive）

百万并发下的nginx优化

百万并发下的nginx优化之道一、nginx地址重写1、nginx地址重写（rewrite）介绍nginx地址重写的主要功能是实现URL地址的重定向。服务器获得一个来访的URL请求，然后改写成服务器可...

CDP实操--配置Ranger对hive行过滤（七）

1.使用sam_sec查询person表2.用sam_sec认证.3.查询person表：4. 配置行过滤策略。5. 新增策略：6. 过滤anna：7. 查询测试。...

MySQL运维实战(7.1) 开启GTID复制

MySQL从5.6版本开始支持GTID复制。开启GTID之后，主库上执行的每一个事务都有一个全局唯一的ID。GTID由两部分组成：server_uuid和事务序列号。初始化数据库时，会生成一个全局唯一...

kafka高可靠性相关配置

为保证高可靠可以通过以下方面进行设置：1）物理机器场景配置项配置说明高可靠高性能不间断电源配置，防止服务器异常断电RAID卡电池配置，防止服务器异常断电RAID卡写缓存开启，提高性能RAID 1配置...

Kubernetes源码解读（五）--Reflector源码分析

Reflector 的任务就是向 apiserver watch 特定类型的资源，拿到变更通知后将其丢到 DeltaFIFO 队列中。1、Reflector的启动过程Reflector定义在k8s.i...

MySQL优化器特性（七）成本估算常数

成本估算常数表示执行一些MySQL基础操作时的成本，如读取一个页面，创建一个临时表，比较一条记录，解析一行记录等操作。mysql.engine_cost和mysql.server_cost表分别记录存...

Impala 操作命令

Impala的外部shell

Impala的内部shell

相关文章

百万并发下的nginx优化

CDP实操--配置Ranger对hive行过滤（七）

MySQL运维实战(7.1) 开启GTID复制

kafka高可靠性相关配置

Kubernetes源码解读（五）--Reflector源码分析

MySQL优化器特性（七）成本估算常数

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号

Impala 操作命令

Impala的外部shell

Impala的内部shell

相关文章

百万并发下的nginx优化

CDP实操--配置Ranger对hive行过滤（七）

MySQL运维实战(7.1) 开启GTID复制

kafka高可靠性相关配置

Kubernetes源码解读（五）--Reflector源码分析

MySQL优化器特性（七）成本估算常数

发表评论 取消回复

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?dcf8139ce75b768b71dccc5e589b983c"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号