Flume使用案例之实时读取本地文件到HDFS

楼高2年前 (2023-10-13)技术文章964

Flume实时读取本地文件到HDFS

1. 创建flume-hdfs.conf文件

# 1 agent

a2.sources = r2

a2.sinks = k2

a2.channels = c2

# 2 source

a2.sources.r2.type = exec

a2.sources.r2.command = tail -F /opt/Andy

a2.sources.r2.shell = /bin/bash -c

# 3 sink

a2.sinks.k2.type = hdfs

a2.sinks.k2.hdfs.path = hdfs://dtstack_hdfs:9000/flume/%Y%m%d/%H

#上传文件的前缀

a2.sinks.k2.hdfs.filePrefix = logs-

#是否按照时间滚动文件夹

a2.sinks.k2.hdfs.round = true

#多少时间单位创建一个新的文件夹

a2.sinks.k2.hdfs.roundValue = 1

#重新定义时间单位

a2.sinks.k2.hdfs.roundUnit = hour

#是否使用本地时间戳

a2.sinks.k2.hdfs.useLocalTimeStamp = true

#积攒多少个Event才flush到HDFS一次

a2.sinks.k2.hdfs.batchSize = 1000

#设置文件类型，可支持压缩

a2.sinks.k2.hdfs.fileType = DataStream

#多久生成一个新的文件

a2.sinks.k2.hdfs.rollInterval = 600

#设置每个文件的滚动大小

a2.sinks.k2.hdfs.rollSize = 134217700

#文件的滚动与Event数量无关

a2.sinks.k2.hdfs.rollCount = 0

#最小副本数

a2.sinks.k2.hdfs.minBlockReplicas = 1

# Use a channel which buffers events in memory

a2.channels.c2.type = memory

a2.channels.c2.capacity = 1000

a2.channels.c2.transactionCapacity = 100

# Bind the source and sink to the channel

a2.sources.r2.channels = c2

a2.sinks.k2.channel = c2

2. 执行监控配置

/opt/module/flume1.8.0/bin/flume-ng agent \

--conf /opt/module/flume1.8.0/conf/ \

--name a2 \

--conf-file /opt/module/flume1.8.0/jobconf/flume-hdfs.conf

返回列表

上一篇：Flume使用案例之监控端口数据

下一篇：Flume使用案例之实时读取目录到HDFS

Flink sql 集成hive metastore-测试

FQA1、如何不使用catalog命令，默认进入hive catalog在sql-client-defaults.yaml中添加以下配置2、如何使用mysql使用./bin/sql-client.sh...

Zabbix监控接入

Zabbix监控1、环境实验机器:118.31.158.83(zabbix server)172.17.6.11(zabbix proxy)172.17.6.11(zabbix agent)2、安装z...

Mac安装Hadoop文档-保姆级操作（二）

配置hadoop进入hadoop的目录：cd /opt/homebrew/Cellar/hadoop/3.3.6/libexec/etc/hadoop修改core-site.xml<config...

Linux_ACL权限、mask值

acl权限在什么情况下使用：当要给一个用户与文件的属主、属组、其他人权限都不同的时候使用。也就是说，这个用户对应于这个文件不属于三个身份中的任何一种，是属于第四种身份，那么我们就需要使用acl权限去给...

更改默认StorageClass

为什么要更改默认StorageClass根据安装方式的不同，你的Kubernetes集群可以使用标记为默认值的现有StorageClass进行部署。然后，这个默认的StorageClass用于动态地为...

PG的锁(三)

六、锁的维护6.1 锁相关参数deadlock_timeout（integer）：默认1s，表示pg数据库仅对锁超时大于1s的情况进行死锁检测。log_lock_waits : 默认关闭，若打开该参数...

Flume使用案例之实时读取本地文件到HDFS

相关文章

Flink sql 集成hive metastore-测试

Zabbix监控接入

Mac安装Hadoop文档-保姆级操作（二）

Linux_ACL权限、mask值

更改默认StorageClass

PG的锁(三)

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号

Flume使用案例之实时读取本地文件到HDFS

相关文章

Flink sql 集成hive metastore-测试

Zabbix监控接入

Mac安装Hadoop文档-保姆级操作（二）

Linux_ACL权限、mask值

更改默认StorageClass

PG的锁(三)

发表评论 取消回复

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?dcf8139ce75b768b71dccc5e589b983c"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号