flink应用场景分析

南墨1年前技术文章563

       Flink适合场景:

       实时数据流处理,对实时的海量数据流进行处理,例如:实时ETL、实时报表、监控预警等

       支持对接多种数据源,多种类数据源,例如Kafka,Hbase,DB均能够作为Flink前后的输入端和输出端

       Flink不适合的场景:

       使用Flink作为数据源的桥接器时,前端使用的输出组件性能远大于后端的输入组件。例如:从kafka消费数据直接写入oracle、GaussDB。Kafka的输出性能远比oracle、GaussDB写入性能高。

       Flink使用建议:

       Flink任务是依赖于yarn,建议使用单独的队列或者资源池,不跟其它的短期任务(例如:spark,MR任务等合用一个资源池)合并使用。

       Flink任务启动方式分为yarn-cluster和yarn-session两种启动方式,如果有多个Flink有界任务,建议使用yarn-session统一管控;如果是无界的流式任务使用yarn-cluster启动


相关文章

CDH实操--Zookeeper角色迁移

CDH实操--Zookeeper角色迁移

Zookeeper角色迁移计划1.集群Zookeeper服务角色实例分配情况2.由于角色规划不合理,需要将cdp1.hadoop.com节点的Zookeeper实例实例迁移到cdp4.hadoop.c...

Kafka优化参数

一、配置文件Kafka的配置文件为 config/server.properties,在此文件中进行 Kafka 的基础配置,例如端口、日志目录、Zookeeper 信息和 Broker ID 等还可...

git常用命令

git status/git status -s查看状态[root@zutuanxue git_data]# git status位于分支 master尚无提交无文件要提交(创建/拷贝文件并使用 "g...

在kubernetes中,让某个node成为专属节点

如何让node 去”选择”只有谁(pod)能部署到自身上面?看了下现有的Node Selectors、Node Affinity、Node Taints, 经过比对,发现Node Taints 更适合...

Zeppelin简介

1.    Zeppelin1.1.  Zeppelin是什么zeppelin是一个非常流行的开源数据探索分析平台。zeppelin集成了非...

Kubernetes源码解读(二)--DeltaFIFO源码分析

Kubernetes源码解读(二)--DeltaFIFO源码分析

1、Queue接口与DeltaFIFO的实现1.1、Queue和Store接口接口和结构体先相关代码类似 workqueue 里的队列概念,这里也有一个队列,Queue 接口定义在 client-go...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。