flink应用场景分析

南墨12个月前技术文章380

       Flink适合场景:

       实时数据流处理,对实时的海量数据流进行处理,例如:实时ETL、实时报表、监控预警等

       支持对接多种数据源,多种类数据源,例如Kafka,Hbase,DB均能够作为Flink前后的输入端和输出端

       Flink不适合的场景:

       使用Flink作为数据源的桥接器时,前端使用的输出组件性能远大于后端的输入组件。例如:从kafka消费数据直接写入oracle、GaussDB。Kafka的输出性能远比oracle、GaussDB写入性能高。

       Flink使用建议:

       Flink任务是依赖于yarn,建议使用单独的队列或者资源池,不跟其它的短期任务(例如:spark,MR任务等合用一个资源池)合并使用。

       Flink任务启动方式分为yarn-cluster和yarn-session两种启动方式,如果有多个Flink有界任务,建议使用yarn-session统一管控;如果是无界的流式任务使用yarn-cluster启动


相关文章

PostgreSQL 源码部署

PostgreSQL 源码部署

说明本篇文章介绍 PostgreSQL 单机源码编译部署的详细步骤。1. 准备工作1.1 源码包下载进入 PostgreSQL 官网下载页面  选择 Source 栏目: 接着就进入源码版本目录,选择...

更改默认StorageClass

为什么要更改默认StorageClass根据安装方式的不同,你的Kubernetes集群可以使用标记为默认值的现有StorageClass进行部署。然后,这个默认的StorageClass用于动态地为...

借助cwRsync工具迁移

借助cwRsync工具迁移

服务端安装服务端软件如下,会自动在系统内创建一个系统用户,用户名为:xxx  ,密码为:xxx查看系统用户,会发现自动创建了如下用户:修改配置文件:rsyncd.confuse chroot = fa...

Presto开发语句简介

Presto开发语句简介

根据presto中的结构配置,catalog表示连接,主要看presto中catalog文件夹下的配置,一般包含hive、mysql等,其中可以根据业务的不同设置多个配置文件。schema表示连接中的...

Ambari Hive 创建函数无权限

Ambari Hive 创建函数无权限

1、创建udf函数参考文档:https://blog.csdn.net/helloxiaozhe/article/details/102498567如果已经编写好,请使用自己的。如果没有请参考以上链接...

Python 装饰器

1、闭包自由变量:未在本地作用域中定义的变量。例如定义在内层函数外的外层函数的作用域中的变量。闭包:就是一个概念,出现在嵌套函数中,指的是内层函数引用到了外层函数的自由变量,就形成了闭包。很多语言都有...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。