hive执行count和spark执行count结果不一致

九月2年前 (2023-10-07)技术文章1938

【组件版本】hive on mr、spark

【问题现象】hive 执行count语句，结果条数为0，spark执行count语句能正常显示count数
【详细描述】

hive 执行count语句：显示count数为0.

select count(*) from edw_tmp.upcloud_warehouse_table_info_df where dt=20230813;

如果使用hive执行count语句，底层设置limit 限制条数的条件，可以正常显示出count数：

select count(*) from edw_tmp.upcloud_warehouse_table_info_df where dt=20230813 limit 10;

两者日志差别在于一个启动了底层mr程序，另一个没有启动。

正常客户是使用的spark进行的建表和查询

spark执行

spark 客户端thriftserver创建表和hive创建表，涉及到的元数据更新不一致，并且集群底层对count查询进行了优化，默认情况下，Hive会尝试使用表的统计信息（如表的行数、列统计等）来优化查询的执行计划，但是，在某些情况下，统计信息可能不准确或过时，这可能导致Hive做出不恰当的优化决策，影响查询性能和结果。

【解决方法】

方法1:设置如下参数，先禁用查询优化，走底层数据查询。

set hive.compute.query.using.stats=false;

方法2:

hive使用analyze收集元数据信息后再进行查询。

ANALYZE TABLE  edw_tmp.upcloud_warehouse_table_info_df COMPUTE STATISTICS;

标签: 大数据运维 hive

返回列表

上一篇：fio磁盘io压测

下一篇：使用Velero备份与恢复K8s集群及应用

Hive优化之SQL的优化(三)

Hive是大数据领域常用的组件之一，主要是大数据离线数仓的运算，关于Hive的性能调优在日常工作和面试中是经常涉及的一个点，因此掌握一些Hi...

HDP部署Tez UI

首先部署tomcat在官网下载apache-tomcat-9.0.22.tar.gz[root@hdp02 opt]# wget https://archive.apache.org/dist/tom...

helm安装部署trino对接hive（一）

前提：本文前提是基于hive组件已经提前安装的情况下，安装部署好trino容器之后进行对hive组件的对接。helm trino地址：https://artifacthub.io/packages/h...

Hive优化之监控(四)

Hive是大数据领域常用的组件之一，主要是大数据离线数仓的运算，关于Hive的性能调优在日常工作和面试中是经常涉及的一个点，因此掌握一些Hive调优是必...

Hive合并小文件：hive归档（archive）

一、概述在HDFS中数据和元数据分别由DataNode和NameNode负责，这些元数据每个对象一般占用大约150个字节。大量的小文件相对于大文件会占用大量的NameNode内存。对Na...

CDH实操--hive高可用

前言在CDH中，hive metastore、hiveserver2若角色单实例部署，或者部署多个实例但是连接配置任选其一的话，均存在单点问题，一旦实例故障就会影响业务稳定；这时我们就好考虑高可用部署...

hive执行count和spark执行count结果不一致

相关文章

Hive优化之SQL的优化(三)

HDP部署Tez UI

helm安装部署trino对接hive（一）

Hive优化之监控(四)

Hive合并小文件：hive归档（archive）

CDH实操--hive高可用

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号

hive执行count和spark执行count结果不一致

相关文章

Hive优化之SQL的优化(三)

HDP部署Tez UI

helm安装部署trino对接hive（一）

Hive优化之监控(四)

Hive合并小文件：hive归档（archive）

CDH实操--hive高可用

发表评论 取消回复

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?dcf8139ce75b768b71dccc5e589b983c"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号