CDH实操--hive表及分区检查

耀灵1年前技术文章471

1)DB数量

select count(1) from DBS;

1.jpg

2)DB中的TABLE数量

select TBLS.db_id, name, count(1) tab_num
from TBLS join DBS on TBLS.db_id = DBS.db_id
group by db_id, name
having tab_num >= 20
order by tab_num desc;

2.jpg

3)TABLEPARTITION数量

select TBLS.tbl_id, tbl_name, count(1) as part_num
from PARTITIONS join TBLS on PARTITIONS.tbl_id = TBLS.tbl_id
group by tbl_id, tbl_name
order by part_num desc limit 30;

3.jpg

4)DB中所有TABLEPARTITION总量

select DBS.db_id,name,count(1) as part_num
from PARTITIONS, TBLS, DBS
where PARTITIONS.tbl_id = TBLS.tbl_id
and TBLS.db_id = DBS.db_id
group by db_id, name
order by part_num desc limit 30;


4.jpg

5)TBL_COL_PRIVSTBL_PRIVS的数据量

TBL_PRIVSTBL_COL_PRIVS记录该hive表的表及列权限认证信息

5.jpg





















相关文章

MySQL Group Replication(一)部署篇

MySQL Group Replication(一)部署篇

MGR 简介Group Replication 是 MySQL 在 2016 年 12 月以 GA 的形式发布,以插件的形式绑定在 MySQL 服务器上。传统的 MySQL 复制功能是异步复制,而 M...

Trino配置yanagishima-23.0(包含编译)

Trino配置yanagishima-23.0(包含编译)

1 环境介绍1.1 本文采用trino 359yanagishima v23.02 编译yanagishima2.1 安装编译yanagishima需要的工具安装编译yanagishima需要的工具w...

HAProxy

HAProxy

1、HAProxy简介  HAProxy 是一款基于 TCP(第四层)和 HTTP(第七层)应用的代理软件,它也可作为负载均衡器,而且完全免费。 借助 HAProxy,可以快速并且可靠地提供基于 TC...

内存--模拟内存打满

1 tmpfs介绍tmpfs是一种虚拟内存文件系统,正如这个定义它最大的特点就是它的存储空间在VM里面     VM是由linux内核里面的vm子系统管理的东...

k8s service IP不能ping通?

k8s service IP不能ping通?

1、先看下serviceIP是怎么来的?serviceIP是serviceController生成的,参数--service-cluster-ip-range string会配置在controller...

Go 链表的实现

Go 链表的实现

链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表由一系列结点(链表中每一个元素称为结点)组成,结点可以在运行时动态生成。每个结点包括两个部分:...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。