Ambari集群Spark3.x动态资源分配

芒果2年前 (2023-06-29)技术文章1209

环境		节点	hdp01
HDP	3.1.5		hdp02
Spark	3.2.4		hdp03

首先Spark配置History服务

配置spark-defaults.conf

spark.master spark://hdp01:7077

spark.eventLog.enabled true

spark.eventLog.dir hdfs://ha/sparklogs

spark.history.fs.logDirectory hdfs://ha/sparklogs

去hdfs创建对应目录

hdfs dfs -mkdir hdfs://ha/sparklogs

开启start-history-server.sh服务

sbin/start-history-server.sh

查看日志情况：

vim /opt/spark/logs/spark-root-org.apache.spark.deploy.history.HistoryServer-1-hdp01.out

启动成功

查看History Server WEB

开启动态资源分配前：

提交一个spark任务

bin/spark-shell --master yarn

可以看到启动后已经分配了资源

首先配置动态资源分配参数

拷贝spark-version-yarn-shuffle.jar(包含了external shuffle的spark实现)到yarn的lib下

cp /opt/spark/yarn/spark-3.2.4-yarn-shuffle.jar /usr/hdp/3.1.5.0-152/hadoop-yarn/lib/

分发其他节点

[root@hdp01 lib]# scp spark-3.2.4-yarn-shuffle.jar hdp02:$PWD

spark-3.2.4-yarn-shuffle.jar 100% 12MB 12.5MB/s 00:01

[root@hdp01 lib]# scp spark-3.2.4-yarn-shuffle.jar hdp03:$PWD

spark-3.2.4-yarn-shuffle.jar 100% 12MB 12.5MB/s 00:00

[root@hdp01 lib]#

修改yarn-site.xml配置文件，增加spark shuffle相关的配置：(Ambari界面修改)

<name>yarn.nodemanager.aux-services</name>

<value>spark_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.spark_shuffle.class</name>

<value>org.apache.spark.network.yarn.YarnShuffleService</value>

</property>

<name>spark.shuffle.service.port</name>

</property>

spark.shuffle.service.enabled=true

yarn.nodemanager.aux-services.spark_shuffle.classpath=/opt/spark/yarn/*

yarn.nodemanager.aux-services.spark2_shuffle.classpath=/opt/spark/yarn/*

重启yarn集群

测试动态资源分配

bin/spark-shell \

--master yarn --executor-memory 1g --total-executor-cores 1 \

--conf spark.shuffle.service.enabled=true \

--conf yarn.nodemanager.aux-services.spark_shuffle.classpath=/opt/spark/yarn/* \

--conf spark.dynamicAllocation.enabled=true \

--conf spark.dynamicAllocation.executorIdleTimeout=60s \

--conf spark.shuffle.service.port=7337

查看spark webui

可以看到没有执行action操作==没有分配Executor

在spark-shell执行操作

val lineText=sc.textFile("hdfs://ha/spark.txt")

lineText.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).foreach(println)

执行后我们可以看到执行的时候分配了Executor

但是过了60s之后Executor没有任务运行就会remove Executor释放资源。

再次运行

lineText.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).foreach(println)

返回列表

上一篇：离线部署Mysql 8.X

下一篇：Hue简介

ORA-00054报错处理

执行语句报错：ORA-00054: resource busy and acquire with NOWAIT specified or timeout expired原因：如错误信息提示，资源正忙（...

pg_dump

逻辑备份 PG提供了pg_dump、pg_dumpall两种方式进行逻辑备份，其区别就是pg_dumpall只能将数据库全部数据集dump到一个脚本文件中，而pg_dump可以选择指定数据库进行...

flink web监控

1.1 监控指标进入Flink的原生页面，需要从yarn的原生页面的后台链接进入，如下图：这里必须要用supergroup组的用户或者flink提交任务的用户（如果该用户是机机用户不能登录）才能够看到...

手动模拟 flannel 的 vxlan 实现节点命名空间互通

在flannel网络插件中实现两个节点互通方式有host-gw vxlan ipip等方式，之前已经手动模拟过host-gw模式，此处再模拟一下vxlan模式点对点访问。手动实验两个命名空间通信Nod...

百万并发下的nginx优化

百万并发下的nginx优化之道一、nginx地址重写1、nginx地址重写（rewrite）介绍nginx地址重写的主要功能是实现URL地址的重定向。服务器获得一个来访的URL请求，然后改写成服务器可...

MySQL 官方高可用方案：Innodb ReplicaSet

说明MySQL Innodb ReplicaSet 是 MySQL 团队在 2020 年推出的一款产品，用来帮助用户快速部署和管理主从复制，在数据库层仍然使用的是主从复制技术。ReplicaSet 主...

Ambari集群Spark3.x动态资源分配

相关文章

ORA-00054报错处理

pg_dump

flink web监控

手动模拟 flannel 的 vxlan 实现节点命名空间互通

百万并发下的nginx优化

MySQL 官方高可用方案：Innodb ReplicaSet

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号

Ambari集群Spark3.x动态资源分配

相关文章

ORA-00054报错处理

pg_dump

flink web监控

手动模拟 flannel 的 vxlan 实现节点命名空间互通

百万并发下的nginx优化

MySQL 官方高可用方案：Innodb ReplicaSet

发表评论 取消回复

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?dcf8139ce75b768b71dccc5e589b983c"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号