速戳!王学鹏的 Apache SeaTunnel Committer 养成记

宝子们,最近 Apache SeaTunnel 又注入了新力量!

https://github.com/apache/SeaTunnel

点击蓝字



关注我们

宝子们,最近 Apache SeaTunnel 又注入了新力量,迎来了几位超有能力、干劲十足的 Committer,王学鹏就是其中之一。

作为资深贡献者,王学鹏这次能当选 Committer 绝非偶然。长久以来,他在社区默默耕耘,点点滴滴的贡献大家都看在眼里。从初涉开源,到成为 Apache 基金会顶级项目的 Committer ,他心里肯定藏了不少故事,成长路上也有诸多感悟。

他究竟有着怎样的心路历程?又有哪些经验想分享给大家?快来围观社区对他的采访吧!

个人介绍

王学鹏海报

采访实录


Q

您参与开源有多长时间了?开源为什么吸引你?

A

2023年接触开源,开源吸引我的一点是,个人写的代码能被行业内使用,很有成就感。


Q

您从何时参与SeaTunnel开源贡献?契机是什么?

A

2023加入白鲸开源开始接触开源。


Q

如今获推选为SeaTunnel Committer,总结一下您为社区所做的贡献,包括代码和非代码贡献。


A

大的功能pr主要是围绕构建SeaTunnel的元数据相关。在跑SeaTunnel任务的时候编写任务配置,需要频繁手写数据源连接信息,遇到文件类型任务的还要手写字段映射,就把这两块做了一个SPI功能接口MetadataProvider,接口主要暴漏两个方法:

  • Map<String, Object> datasourceMap(String connectorIdentifier, String metaDataDatasourceId);

  • Optional tableSchema(String metaDataTableId);

之前我也有在用户群里有用户提到过,数据源的账户密码都在Nacos里,只允许读。像这种场景就可以实现自定义的元数据中心,来实现连接信息的保护。


Q

参与SeaTunnel项目这么久,相信您对于SeaTunnel项目和社区都有比较深的了解了。您认为SeaTunnel与其他竞品相比的不同点/优势是什么?不足之处是什么?SeaTunnel社区有哪些吸引您继续留下踊跃参与的地方?

A

SeaTunnel的优点有主要是引擎的选择很灵活,对于习惯使用Flink和Spark的团队来说,使用门槛很低。对于想轻量级实现数据同步来说,Zeta引擎是更好的选择。不足之处我觉得是web还有很大的优化空间。

SeaTunnel社区比较吸引我的一点是可以和社区里很多优秀的不同领域的小伙伴讨论实现方案,既能锻炼自己又能拓宽眼界。


Q

您是否针对SeaTunnel的不足之处进行过二次开发?是否已贡献给社区?开发方案是否可以介绍一下?

A

对SeaTunnel进行过二次开发,主要是在使用过程中发现了一些bug会在公司仓库修改一份,开源社区再提交一份。


Q

您还希望参与SeaTunnel社区能对您的个人成长提供什么样的支持?

A

其实只要主动参与社区的一些讨论,无论是issue的建立,或者是pr的提出,再或者是pr的review都会对本人有技术上的提升。


Q

您对社区Committer角色的理解是什么?Committer应该在社区中做什么/起到什么作用?

A

成为Committer,我觉得首先是要对代码质量进行把关,其次是协助社区的往好的方向发展,比如指导新人提pr。


Q

获推选Committer,您有什么感想/想对社区说的话,或对项目发展有什么建议?

A

首先很高兴能成为Committer,这代表着成为了Apache基金会的一员,身份很难得,同时也感谢社区小伙伴们的对我的指导和帮助。


Q

未来一段时间,您个人在社区有何计划以推动项目进一步发展?

A

我会接着在元数据方向持续贡献,后续获取会扩展到数据血缘方向。


Apache SeaTunnel

Apache SeaTunnel是一个云原生的多模态、高性能海量数据集成工具。北京时间 2023 年 6 月1 日,全球最大的开源软件基金会ApacheSoftware Foundation正式宣布SeaTunnel毕业成为Apache顶级项目。目前,SeaTunnel在GitHub上Star数量已达9k+,社区达到7000+人规模。SeaTunnel支持在云数据库、本地数据源、SaaS、大模型等170多种数据源之间进行数据实时和批量同步,支持CDC、DDL变更、整库同步等功能,更是可以和大模型打通,让大模型链接企业内部的数据。




同步Demo

MySQL→Doris | MySQLCDC | MySQL→Hive | HTTP → Doris  | HTTP → MySQL | MySQL→StarRocks|MySQL→Elasticsearch |Kafka→ClickHouse

新手入门

SeaTunnel 让数据集成变得 So easy!3 分钟入门指南
 0 到 1 快速入门 /初探/深入理解 
  分布式集群部署 | CDC数据同步管道 | Oracle-CDC
图片

最佳实践

中控技术天翼云多点OPPO | 清风马蜂窝孩子王哔哩哔哩唯品会众安保险兆原数通 | 亚信科技|映客|翼康济世|信也科技|华润置地|Shopee|京东科技|58同城|互联网银行|JPMorgan
图片

测试报告

SeaTunnel VS GLUE |  VS Airbyte |  VS DataX|SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比
图片

源码解析

Zeta引擎源码解析(一) |(二) |(三)| API 源码解析 |2.1.1源码解析|封装 Flink 连接数据库解析





仓库地址: 
https://github.com/apache/seatunnel
网址:
https://seatunnel.apache.org/
Apache SeaTunnel 下载地址:
https://seatunnel.apache.org/download
衷心欢迎更多人加入!
我们相信,在Community Over Code(社区大于代码)、「Open and Cooperation」(开放协作)、「Meritocracy」(精英管理)、以及「多样性与共识决策」等 The Apache Way 的指引下,我们将迎来更加多元化和包容的社区生态,共建开源精神带来的技术进步!
我们诚邀各位有志于让本土开源立足全球的伙伴加入 SeaTunnel 贡献者大家庭,一起共建开源!
提交问题和建议:
https://github.com/apache/seatunnel/issues
贡献代码:
https://github.com/apache/seatunnel/pulls
订阅社区开发邮件列表 : 
dev-subscribe@seatunnel.apache.org
开发邮件列表:
dev@seatunnel.apache.org
加入 Slack:
https://join.slack.com/t/apacheseatunnel/shared_invite/zt-3uouszk3m-PtLLNyZsJVqE5Gb6gn24mA
关注 X.com: 
https://x.com/ASFSeaTunnel