spark与mr的异同

南墨2年前 (2023-12-25)技术文章1483

MR：抽象层次低，需要使用手工代码来完成程序编写，使用上难以上手；

Spark：Spark 采用RDD 计算模型，简单容易上手。

MR：只提供map 和reduce 两个操作，表达能力欠缺；

Spark：Spark 采用更加丰富的算子模型，包括map、flatmap、groupbykey、reducebykey 等；

MR：一个job 只能包含map 和reduce 两个阶段，复杂的任务需要包含很多个job，这些job 之间的管理以来需要开发者自己进行管理；

Spark：Spark 中一个job 可以包含多个转换操作，在调度时可以生成多个stage，而且如果多个map 操作的分区不变，是可以放在同一个task 里面去执行；

MR：中间结果存放在hdfs 中；

Spark：Spark 的中间结果一般存在内存中，只有当内存不够了，才会存入本地磁盘，而不是hdfs；

MR：只有等到所有的map task 执行完毕后才能执行reduce task；

Spark：Spark 中分区相同的转换构成流水线在一个task 中执行，分区不同的需要进行shuffle 操作，被划分成不同的stage 需要等待前面的stage 执行完才能执行。

MR：只适合batch 批处理，时延高，对于交互式处理和实时处理支持不够；

Spark：Spark streaming 可以将流拆成时间间隔的batch 进行处理，实时计算。

返回列表

上一篇：ranger审计Solr部署

下一篇：热点现象（数据倾斜）怎么产生的，以及解决方法有哪些

Apache hive 对接达梦数据库FQA

对接中遇到的问题问题1解决办法定义dm_svc.confIME_ZONE=(480) LANGUAGE=(cn) HIVE=(172.16.104.165:5236) [HIVE] KEYWO...

MySQL优化器特性（二）MRR优化

Index Range Scan索引范围扫描的一般步骤：1、根据where条件，从B+树定位到第一条记录。2、从索引页子节点中获取到行号（rowid），根据rowid回表查询数据。3、使用额外的whe...

MySQL运维实战之Clone插件（10.2）Clone插件原理

clone插件实现clone操作主要分为几个阶段：1、初始阶段。初始阶段，会开启页面跟踪（Page Tracking）。开启页面跟踪后，修改过的页面的编号会被记录下来。页面的修改可分为两个阶段：首先在...

Linux高并发Nginx配置优化

在日常的运维工作中，经常会用到nginx服务，也时常会碰到nginx因高并发导致的性能瓶颈问题。一般来说nginx配置文件中对优化比较有作用的主要有以下几项：1）nginx进程数，建议按照cpu数目来...

大数据集群部署规划（四）组件建议规格

类型指标名称规格说明HDFS单对NameNode最大文件数1亿-单DataNode最大block数500万GC参数 -Xmx32G单个DataNode磁盘最多block数50万-单个目录下最多文件目录...

Flume使用详解

一、Flume概念Flume 是 Cloudera 提供的日志收集系统，具有分布式、高可靠、高可用性等特点，对海量日志采集、聚合和传输，Flume 支持在日志系统中定制各类数据发送方，同时，Flum...

spark与mr的异同

相关文章

Apache hive 对接达梦数据库FQA

MySQL优化器特性（二）MRR优化

MySQL运维实战之Clone插件（10.2）Clone插件原理

Linux高并发Nginx配置优化

大数据集群部署规划（四）组件建议规格

Flume使用详解

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号

spark与mr的异同

相关文章

Apache hive 对接达梦数据库FQA

MySQL优化器特性（二）MRR优化

MySQL运维实战之Clone插件（10.2）Clone插件原理

Linux高并发Nginx配置优化

大数据集群部署规划（四）组件建议规格

Flume使用详解

发表评论 取消回复

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?dcf8139ce75b768b71dccc5e589b983c"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号