开源大数据集群部署(二十二)Flink on yarn部署

櫰木2年前技术文章718

flink on yarn部署(每个节点)

cd  /root/bigdata/
tar -xzvf  flink-1.14.6-bin-scala_2.12.tgz -C /opt/
 ln -s /opt/flink-1.14.6 /opt/flink


修改环境变量添加内容

vi /etc/profile.d/bigdata.sh
export HADOOP_CLASSPATH=`hadoop classpath`


 

引用变量

source /etc/profile

 

生成keytab

bash /data/kerberos/getkeytabs.sh /etc/security/keytab/flink.keytab flink


3.1.2 配置修改

c

cd /opt/flink
cat conf/flink-conf.yaml
blob.server.port: 6124
jobmanager.memory.process.size: 1024m
jobmanager.rpc.address: localhost
jobmanager.rpc.port: 6123
query.server.port: 6125
rest.port: 8081
taskmanager.memory.process.size: 1024m
taskmanager.numberOfTaskSlots: 1
taskmanager.rpc.port: 6122
state.backend: rocksdb
state.checkpoints.dir: hdfs:///flink/flink/flink-checkpoints
state.savepoints.dir: hdfs:///flink/flink/fink-savepoints
jobmanager.archive.fs.dir: hdfs:///flink/flink/completed-jobs
historyserver.archive.fs.dir: hdfs:///flink/flink/completed-jobs
historyserver.archive.fs.refresh-interval: 1000
security.kerberos.login.keytab: /etc/security/keytab/flink.keytab
security.kerberos.login.principal: flink/hd1.dtstack.com@DTSTACK.COM
 
high-availability: zookeeper
high-availability.zookeeper.quorum:hd1:2181,hd2:2181,hd3:2181
high-availability.zookeeper.path.root: /flink
high-availability.cluster-id: /flink-ha
high-availability.storageDir: hdfs:///flink/flink/recovery
zookeeper.sasl.login-context-name: Client
zookeeper.sasl.service-name: zookeeper
yarn.application-attempts: 10
classloader.check-leaked-classloader: false


 

创建目录

hdfs dfs -mkdir -p /flink/flink/completed-jobs
hdfs dfs -mkdir -p /flink/flink/flink-checkpoints
hdfs dfs -mkdir -p hdfs:///flink/flink/fink-savepoints
hdfs dfs -mkdir /user/flink
hdfs dfs -chown -R  flink  /flink/flink/recovery/flink-ha
hdfs dfs -chown flink /user/flink


3.1.3 分发安装包

scp /opt/flink-1.14.6 root@hd2:/opt/
scp /opt/flink-1.14.6 root@hd3:/opt/


3.1.4 提交测试任务

Per_job 任务

./bin/flink run -m yarn-cluster -yjm 1024 -ytm 1024 examples/batch/WordCount.jar

图片5.png

 

提交session 模式

./bin/yarn-session.sh -n 3 -s 3 -nm flink-sessiontest -d -q

 

 图片6.png

./bin/flink run -m hd2.dtstack.com:8081 -p 2  examples/batch/WordCount.jar


访问8081的页面

图片7.png


相关文章

创建跨集群用户

1.       登陆源集群和目标集群创建迁移时需要使用的用户(例:hadoop_copy),赋予用户集群超级管理员权限和hdfs超级用户权...

kafka高可靠性相关配置

kafka高可靠性相关配置

为保证高可靠可以通过以下方面进行设置:1) 物理机器场景配置项配置说明高可靠高性能不间断电源配置,防止服务器异常断电RAID卡电池配置,防止服务器异常断电RAID卡写缓存开启,提高性能RAID 1配置...

Elasticsearch写入优化

1.1 基本优化手段Elasticsearch默认的设置和参数配置下,是综合考虑了数据的可靠性、搜索实时性、写入速度等因素。但在安平实际场景中,业务对数据的可靠性和搜索实时性要求并不高,反而对写入速度...

MySQL基本配置文件

MySQL基本配置文件

# 5.7  # mkdir /data/mysql57/{data,logs,run} -pv [client] port ...

 Atlas架构与原理

Atlas架构与原理

一、总体架构Atlas 是一个可伸缩且功能丰富的数据管理系统,深度集成了 Hadoop 大数据组件。简单理解就是一个 跟 Hadoop 关系紧密的,可以用来做元数据管理的一个系统,整个结构图如下所示:...

借助arthas工具打火焰图

借助arthas工具打火焰图

1、下载arthas在命令行下面执行(使用和目标进程一致的用户启动,否则可能 attach 失败):curl -O https://arthas.aliyun.com/arthas-boot.jar...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。