开源大数据集群部署（二十二）Flink on yarn部署

櫰木2年前 (2023-07-19)技术文章718

flink on yarn部署（每个节点）

cd  /root/bigdata/
tar -xzvf  flink-1.14.6-bin-scala_2.12.tgz -C /opt/
 ln -s /opt/flink-1.14.6 /opt/flink

修改环境变量添加内容

vi /etc/profile.d/bigdata.sh
export HADOOP_CLASSPATH=`hadoop classpath`

引用变量

source /etc/profile

生成keytab

bash /data/kerberos/getkeytabs.sh /etc/security/keytab/flink.keytab flink

3.1.2 配置修改

cd /opt/flink
cat conf/flink-conf.yaml
blob.server.port: 6124
jobmanager.memory.process.size: 1024m
jobmanager.rpc.address: localhost
jobmanager.rpc.port: 6123
query.server.port: 6125
rest.port: 8081
taskmanager.memory.process.size: 1024m
taskmanager.numberOfTaskSlots: 1
taskmanager.rpc.port: 6122
state.backend: rocksdb
state.checkpoints.dir: hdfs:///flink/flink/flink-checkpoints
state.savepoints.dir: hdfs:///flink/flink/fink-savepoints
jobmanager.archive.fs.dir: hdfs:///flink/flink/completed-jobs
historyserver.archive.fs.dir: hdfs:///flink/flink/completed-jobs
historyserver.archive.fs.refresh-interval: 1000
security.kerberos.login.keytab: /etc/security/keytab/flink.keytab
security.kerberos.login.principal: flink/hd1.dtstack.com@DTSTACK.COM
 
high-availability: zookeeper
high-availability.zookeeper.quorum:hd1:2181,hd2:2181,hd3:2181
high-availability.zookeeper.path.root: /flink
high-availability.cluster-id: /flink-ha
high-availability.storageDir: hdfs:///flink/flink/recovery
zookeeper.sasl.login-context-name: Client
zookeeper.sasl.service-name: zookeeper
yarn.application-attempts: 10
classloader.check-leaked-classloader: false

创建目录

hdfs dfs -mkdir -p /flink/flink/completed-jobs
hdfs dfs -mkdir -p /flink/flink/flink-checkpoints
hdfs dfs -mkdir -p hdfs:///flink/flink/fink-savepoints
hdfs dfs -mkdir /user/flink
hdfs dfs -chown -R  flink  /flink/flink/recovery/flink-ha
hdfs dfs -chown flink /user/flink

3.1.3 分发安装包

scp /opt/flink-1.14.6 root@hd2:/opt/
scp /opt/flink-1.14.6 root@hd3:/opt/

3.1.4 提交测试任务

Per_job 任务

./bin/flink run -m yarn-cluster -yjm 1024 -ytm 1024 examples/batch/WordCount.jar

图片5.png

提交session 模式

./bin/yarn-session.sh -n 3 -s 3 -nm flink-sessiontest -d -q

图片6.png

./bin/flink run -m hd2.dtstack.com:8081 -p 2  examples/batch/WordCount.jar

访问8081的页面

图片7.png

返回列表

上一篇：开源大数据集群部署（二十一）Spark on yarn 部署

下一篇：flink算子优化

创建跨集群用户

1. 登陆源集群和目标集群创建迁移时需要使用的用户（例：hadoop_copy），赋予用户集群超级管理员权限和hdfs超级用户权...

kafka高可靠性相关配置

为保证高可靠可以通过以下方面进行设置：1）物理机器场景配置项配置说明高可靠高性能不间断电源配置，防止服务器异常断电RAID卡电池配置，防止服务器异常断电RAID卡写缓存开启，提高性能RAID 1配置...

Elasticsearch写入优化

1.1 基本优化手段Elasticsearch默认的设置和参数配置下，是综合考虑了数据的可靠性、搜索实时性、写入速度等因素。但在安平实际场景中，业务对数据的可靠性和搜索实时性要求并不高，反而对写入速度...

MySQL基本配置文件

# 5.7 # mkdir /data/mysql57/{data,logs,run} -pv [client] port ...

Atlas架构与原理

一、总体架构Atlas 是一个可伸缩且功能丰富的数据管理系统，深度集成了 Hadoop 大数据组件。简单理解就是一个跟 Hadoop 关系紧密的，可以用来做元数据管理的一个系统,整个结构图如下所示：...

借助arthas工具打火焰图

1、下载arthas在命令行下面执行（使用和目标进程一致的用户启动，否则可能 attach 失败）：curl -O https://arthas.aliyun.com/arthas-boot.jar...

开源大数据集群部署（二十二）Flink on yarn部署

flink on yarn部署（每个节点）

3.1.2 配置修改

3.1.3 分发安装包

3.1.4 提交测试任务

相关文章

创建跨集群用户

kafka高可靠性相关配置

Elasticsearch写入优化

MySQL基本配置文件

Atlas架构与原理

借助arthas工具打火焰图

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号

开源大数据集群部署（二十二）Flink on yarn部署

flink on yarn部署（每个节点）

3.1.2 配置修改

3.1.3 分发安装包

3.1.4 提交测试任务

相关文章

创建跨集群用户

kafka高可靠性相关配置

Elasticsearch写入优化

MySQL基本配置文件

Atlas架构与原理

借助arthas工具打火焰图

发表评论 取消回复

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?dcf8139ce75b768b71dccc5e589b983c"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号