
点亮⭐️
https://github.com/apache/
点击蓝字 关注我们
数仓的数据源是Kafka,因此离线数仓需要用Flume采集Kafka中的数据到HDFS中!
在实际项目中,不可能一直在Xshell中启动Flume任务,一是项目的Flume任务很多,二是一旦Xshell页面关闭,Flume任务就会停止,这样非常不方便,因此必须在后台启动Flume任务。
所以经过测试后,发现海豚调度器也可以启动Flume任务!




#!/bin/bashsource /etc/profile/usr/local/hurys/dc_env/flume/flume190/bin/flume-ng agent -n a1 -f /usr/local/hurys/dc_env/flume/flume190/conf/statistics.properties
注意:/usr/local/hurys/dc_env/flume/flume190/为Flume在Linux中的安装,根据自己安装路径进行调整


Flume采集Kafka数据成功写入到HDFS中,成功实现用海豚执行Flume任务的目的!
原文链接:https://blog.csdn.net/tiantang2renjian/article/details/136399112
END

用户案例

迁移实战

最新发版消息

加入社区
关注社区的方式有很多:
同样地,参与Apache DolphinScheduler 有非常多的参与贡献的方式,主要分为代码方式和非代码方式两种。
非代码方式包括:
完善文档、翻译文档;翻译技术性、实践性文章;投稿实践性、原理性文章;成为布道师;社区管理、答疑;会议分享;测试反馈;用户反馈等。
代码方式包括:
查找Bug;编写修复代码;开发新功能;提交代码贡献;参与代码审查等。


你的好友小海豚拍了拍你
并请你帮她点一下“分享”
