开源大数据集群部署(二十二)Flink on yarn部署

櫰木2年前技术文章689

flink on yarn部署(每个节点)

cd  /root/bigdata/
tar -xzvf  flink-1.14.6-bin-scala_2.12.tgz -C /opt/
 ln -s /opt/flink-1.14.6 /opt/flink


修改环境变量添加内容

vi /etc/profile.d/bigdata.sh
export HADOOP_CLASSPATH=`hadoop classpath`


 

引用变量

source /etc/profile

 

生成keytab

bash /data/kerberos/getkeytabs.sh /etc/security/keytab/flink.keytab flink


3.1.2 配置修改

c

cd /opt/flink
cat conf/flink-conf.yaml
blob.server.port: 6124
jobmanager.memory.process.size: 1024m
jobmanager.rpc.address: localhost
jobmanager.rpc.port: 6123
query.server.port: 6125
rest.port: 8081
taskmanager.memory.process.size: 1024m
taskmanager.numberOfTaskSlots: 1
taskmanager.rpc.port: 6122
state.backend: rocksdb
state.checkpoints.dir: hdfs:///flink/flink/flink-checkpoints
state.savepoints.dir: hdfs:///flink/flink/fink-savepoints
jobmanager.archive.fs.dir: hdfs:///flink/flink/completed-jobs
historyserver.archive.fs.dir: hdfs:///flink/flink/completed-jobs
historyserver.archive.fs.refresh-interval: 1000
security.kerberos.login.keytab: /etc/security/keytab/flink.keytab
security.kerberos.login.principal: flink/hd1.dtstack.com@DTSTACK.COM
 
high-availability: zookeeper
high-availability.zookeeper.quorum:hd1:2181,hd2:2181,hd3:2181
high-availability.zookeeper.path.root: /flink
high-availability.cluster-id: /flink-ha
high-availability.storageDir: hdfs:///flink/flink/recovery
zookeeper.sasl.login-context-name: Client
zookeeper.sasl.service-name: zookeeper
yarn.application-attempts: 10
classloader.check-leaked-classloader: false


 

创建目录

hdfs dfs -mkdir -p /flink/flink/completed-jobs
hdfs dfs -mkdir -p /flink/flink/flink-checkpoints
hdfs dfs -mkdir -p hdfs:///flink/flink/fink-savepoints
hdfs dfs -mkdir /user/flink
hdfs dfs -chown -R  flink  /flink/flink/recovery/flink-ha
hdfs dfs -chown flink /user/flink


3.1.3 分发安装包

scp /opt/flink-1.14.6 root@hd2:/opt/
scp /opt/flink-1.14.6 root@hd3:/opt/


3.1.4 提交测试任务

Per_job 任务

./bin/flink run -m yarn-cluster -yjm 1024 -ytm 1024 examples/batch/WordCount.jar

图片5.png

 

提交session 模式

./bin/yarn-session.sh -n 3 -s 3 -nm flink-sessiontest -d -q

 

 图片6.png

./bin/flink run -m hd2.dtstack.com:8081 -p 2  examples/batch/WordCount.jar


访问8081的页面

图片7.png


相关文章

MySQL运维实战(5.6) 字符集设置对mysqldump的影响

mysqldump不指定字符集不指定字符集时,默认使用了utf8。可能和环境有关系。mysqldump -uroot test test_load >&n...

Elasticsearch查询慢日志配置

shard级别的查询慢日志会将慢查询(查询和获取阶段)记录到elasticsearch_cluster_index_search_slowlog.log日志中。设置查询慢日志各种级别下的阀值,同时也支...

Linux操作系统启动流程

Linux操作系统启动流程

无论Windows还是Linux操作系统,启动之前都会对硬件进行检测,之后硬盘引导启动操作系统,下面是与启动系统相关的几个概念。BIOS基本输入输出系统 是一组固化到计算机主板上的只读内存镜...

Dockerfile全面指南:从基础到进阶,掌握容器化构建的核心工具

Dockerfile全面指南:从基础到进阶,掌握容器化构建的核心工具

引言        Dockerfile 是构建 Docker 镜像的核心文件。它定义了如何将应用程序及其依赖打包成一个可以跨平台运行的容器。本篇博客将从基础概...

Hive优化之监控(四)

Hive优化之监控(四)

    Hive是大数据领域常用的组件之一,主要是大数据离线数仓的运算,关于Hive的性能调优在日常工作和面试中是经常涉及的一个点,因此掌握一些Hive调优是必...

SonarQube 代码质量平台

SonarQube 代码质量平台

官网:https://www.sonarqube.org/SonarQube 是一个开源的代码质量管理系统。可以对代码进行自动审查,检测代码中的错误、漏洞和代码味道。它可以与您现有的工作流程集成,以实...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。