如何使用 Apache DolphinScheduler 调度执行 Flume 数据采集任务?

测试目的数仓的数据源是Kafka,因此离线数仓需要用Flume采集Kafka中的数据到HDFS中!
17792630047296f45544e1f15485d


点亮⭐️

https://github.com/apache/DolphinScheduler



点击蓝字 关注我们


测试目的

数仓的数据源是Kafka,因此离线数仓需要用Flume采集Kafka中的数据到HDFS中!

在实际项目中,不可能一直在Xshell中启动Flume任务,一是项目的Flume任务很多,二是一旦Xshell页面关闭,Flume任务就会停止,这样非常不方便,因此必须在后台启动Flume任务。

所以经过测试后,发现海豚调度器也可以启动Flume任务!

1779263005181db6a1799b76748a8

解决方案

Flume在Linux中的路径

17792630076133a10c78648c4f5bc

Flume任务文件在Linux中的位置以及任务文件名

1779263008178d6aeba0e63f3f912

在海豚中配置运行脚本

177926300884090a8f5b455d58689



#!/bin/bashsource /etc/profile/usr/local/hurys/dc_env/flume/flume190/bin/flume-ng agent -n a1 -f /usr/local/hurys/dc_env/flume/flume190/conf/statistics.properties

注意:/usr/local/hurys/dc_env/flume/flume190/为Flume在Linux中的安装,根据自己安装路径进行调整

海豚任务配置好后就可以启动海豚任务

1779263009368eb728d410d68d381

在HDFS对应文件夹中验证是否采集到数据

1779263009953e50d6d6ed9d15382

Flume采集Kafka数据成功写入到HDFS中,成功实现用海豚执行Flume任务的目的!

原文链接:https://blog.csdn.net/tiantang2renjian/article/details/136399112




END




17792630104673b0af496dea826c2



用户案例


DolphinScheduler Agent开源上线Cisco Webex天翼云Zoom网易邮箱 每日互动 惠生工程作业帮 博世智驾蔚来汽车 长城汽车集度长安汽车思科网讯食行生鲜联通医疗联想新网银行兴业证券唯品富邦消费金融 自如有赞伊利当贝大数据珍岛集团传智教育BigoYY直播 拈花云科太美医疗深圳某智能制造企业
17792630104673b0af496dea826c2



迁移实战


Azkaban Ooize(当贝迁移案例)airflow (有赞迁移案例)Air2phin(迁移工具)Airflow
17792630104673b0af496dea826c2



最新发版消息



Apache DolphinScheduler 3.4.1 发布,新增任务分发超时检测
17792630104673b0af496dea826c2



加入社区


关注社区的方式有很多:

  • GitHub: https://github.com/apache/dolphinscheduler
  • 官网:https://dolphinscheduler.apache.org/en-us
  • 订阅开发者邮件:dev@dolphinscheduler@apache.org(向邮箱发送任意内容,收到邮件后回复同意订阅即可)
  • X.com:@DolphinSchedule
  • YouTube:https://www.youtube.com/@apachedolphinscheduler
  • Slack:https://join.slack.com/t/asf-dolphinscheduler/shared_invite/zt-1cmrxsio1-nJHxRJa44jfkrNL_Nsy9Qg

同样地,参与Apache DolphinScheduler 有非常多的参与贡献的方式,主要分为代码方式和非代码方式两种。

非代码方式包括:

完善文档、翻译文档;翻译技术性、实践性文章;投稿实践性、原理性文章;成为布道师;社区管理、答疑;会议分享;测试反馈;用户反馈等。

‍代码方式包括:

查找Bug;编写修复代码;开发新功能;提交代码贡献;参与代码审查等。

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

社区汇总了以下适合新手的问题列表https://github.com/apache/dolphinscheduler/pulls?q=is%3Apr+is%3Aopen+label%3A%22first+time+contributor%22

优先级问题列表https://github.com/apache/dolphinscheduler/pulls?q=is%3Apr+is%3Aopen+label%3Apriority%3Ahigh

如何参与贡献链接https://dolphinscheduler.apache.org/zh-cn/docs/3.2.2/%E8%B4%A1%E7%8C%AE%E6%8C%87%E5%8D%97_menu/%E5%A6%82%E4%BD%95%E5%8F%82%E4%B8%8E_menu

如果你❤️小海豚,就来为我点亮Star吧!

https://github.com/apache/dolphinscheduler


1779263012329ce91bb9eaa4af790


1779263013438c202f47b6464bafe

你的好友小海豚拍了拍你

并请你帮她点一下“分享”