WhaleStudio白皮书和案例合集 | Part 1

本白皮书&案例合集由白鲸开源(以下简称“白鲸开源”)发起, Apache DolphinScheduler 社区和Apache SeaTunnel 社区参与撰写。通过与多个行业内的先锋企业进行密切的沟通与协作,我们共同挖掘并实证了 WhaleStudio 在DataOps 领域的先进应用。本文档的目的是让读者深刻洞悉 WhaleStudio 在数据操作技术上的独特之处,并理解其在现实业务中的关键作用。这些经过实际应用验证的高效实践不仅展现了WhaleStudio 平台的高效性和效益,同时也为其他企业在数字化转型旅程中提供了极具价值的经验和指南。




目录

引言 1

1.现代企业数据管理面临的挑战 3

2. 新一代dataops平台解决企业新数据时代“蜘蛛网”问题 4

3.如何基于WhaleStudio构建统一DataOps平台? 5

3.1 产品特色 5

3.2 产品架构 7

3.3 数据调度组件——白鲸调度(WhaleScheduler 8

3.4 数据集成组件——白鲸数据同步(WhaleTunnel) 9

4.案例合集 10

4.1 WhaleStudio案例合集 10

4.2 Apache DolphinScheduler案例合集: 30

4.3 Apache SeaTunnel案例合集: 37

5.白鲸开源 42

5.1 公司简介 42

5.2 公司愿景 42

5.3 了解更多 43



引言

本白皮书&案例合集由白鲸开源(以下简称“白鲸开源”)发起, Apache DolphinScheduler 社区和Apache SeaTunnel 社区参与撰写。通过与多个行业内的先锋企业进行密切的沟通与协作,我们共同挖掘并实证了 WhaleStudio 在DataOps 领域的先进应用。本文档的目的是让读者深刻洞悉 WhaleStudio 在数据操作技术上的独特之处,并理解其在现实业务中的关键作用。这些经过实际应用验证的高效实践不仅展现了WhaleStudio 平台的高效性和效益,同时也为其他企业在数字化转型旅程中提供了极具价值的经验和指南。

 WhaleStudio介绍

北京白鲸开源科技有限公司是一家开源原生的 DataOps 商业公司,由多个 Apache Foundation Member成立,80%员工都是 Apache Committer,运营着2 个全球 Apache 开源项目(DolphinScheduler和 SeaTunnel)。

在当今快速发展的软件市场中,北京白鲸开源科技有限公司利用开源矩阵方式打磨产品社区,并采用 OpenCore 模式进行商业化。WhaleStudio 是白鲸开源根据全球领先的DataOps理念打造的新一代数据集成调度工具,它由两大核心组件组成——白鲸调度(WhaleScheduler)与白鲸数据同步(WhaleTunnel),将调度开发组件与数据集成组件集成在一起提供给用户全球领先的完整解决方案,旨在帮助企业解决内部多数据源、多数据系统复杂的数据集成,持续开发、持续部署、数据捕获、数据打通等一系列问题,目前已在6000多家企业中得到实践和使用。

白鲸调度(WhaleScheduler)与白鲸数据同步(WhaleTunnel)分别基于Apache Software Foundation开源项目Apache DolphinScheduler和Apache SeaTunnel,拥有深厚的大数据工作流调度与数据同步集成技术积淀,以及广阔的开源用户基础。

 WhaleStudio部分客户: