Apache SeaTunnel 通过其高度可插拔的架构,能够轻松集成各种数据源。开发者无需关心不同数据源的实现细节,只需通过简单的配置即可实现海量数据的读写。下面,我们将这些 Source 连接器分为十大类别,逐一盘点。

关系型数据库是企业业务的核心。SeaTunnel 提供了对主流关系型数据库的广泛支持,无论是传统的商业数据库还是新兴的国产数据库,都能轻松接入。
JDBC: 通用的连接器,理论上支持所有提供 JDBC 驱动的数据库。
MySQL / PostgreSQL / Oracle / DB2: 针对主流数据库的专用优化连接器。
Kingbase (人大金仓): 支持国产数据库,满足信创需求。
OceanBase: 支持蚂蚁集团的分布式关系数据库。
Phoenix: 连接 HBase 之上的 SQL 层,实现对 HBase 的 SQL 查询。
面向分析场景的数据仓库和 OLAP 引擎是数据价值变现的关键。SeaTunnel 覆盖了业界几乎所有热门的分析型数据库。
ClickHouse / Doris / StarRocks: 极速 MPP 数据仓库的代表,是实时分析的首选。
Greenplum / MaxCompute (ODPS): 传统及云端大数据仓库的有力支持。
Snowflake / Redshift: 完美集成全球领先的云数据仓库。
Databend / Cloudberry: 支持新兴的云原生数据仓库。
对于非结构化、半结构化数据和搜索场景,SeaTunnel 同样游刃有余。
MongoDB: 面向文档的 NoSQL 数据库。
Elasticsearch / Easysearch: 主流的分布式搜索引擎。
HBase / Cassandra / Kudu: 面向列存储的分布式 NoSQL 数据库。
Neo4j: 领先的图数据库。
Redis / AmazonDynamoDB: 高性能的键值存储。
Milvus / OpenMldb: 面向 AI 和机器学习的向量/特征数据库。
数据湖和湖仓一体是现代数据架构的趋势。SeaTunnel 紧跟技术前沿,原生支持三大主流的开放表格式。
Iceberg: 开放的表格式,专为海量分析型数据集设计。
Hudi: 管理存储在分布式文件系统上的大型数据集。
Paimon: 面向流式数据湖的存储技术。
CDC 是实现数据实时同步和构建实时数仓的核心技术。SeaTunnel 提供了对多种数据库的 CDC 支持,让您轻松捕捉数据变化。
MySQL CDC: 通过 Binlog 实时捕获 MySQL 的增删改。
PostgreSQL CDC: 通过逻辑解码实时捕_PostgreSQL 变更。
SqlServer CDC / Oracle CDC: 支持主流商业数据库的实时变更捕获。
MongoDB CDC: 实时捕获 NoSQL 数据库的变更流。
OpenGauss CDC: 支持国产开源数据库的 CDC。
无论是本地文件还是云端对象存储,SeaTunnel 都能将其作为数据源,实现批量或增量的数据集成。
LocalFile / HdfsFile / FtpFile / SftpFile: 支持本地、HDFS 及 FTP/SFTP 文件系统。
S3File / OssFile / CosFile / ObsFile: 全面覆盖 AWS、阿里、腾讯、华为四大公有云对象存储。
OssJindoFile: 通过 Jindo SDK 高效访问阿里云 OSS。
作为流处理的入口,SeaTunnel 支持所有主流的消息队列系统。
Kafka / Pulsar: 云原生时代分布式消息流平台的首选。
RocketMQ / RabbitMQ: 广泛使用的企业级消息队列。
AmazonSQS: 支持 AWS 的简单队列服务。
在物联网 (IoT) 和监控场景中,时序数据库至关重要。SeaTunnel 能够无缝集成主流的时序数据库。
InfluxDB: 领先的开源时序数据库。
IoTDB: Apache 顶级项目,专为物联网设计的数据库。
TDengine: 高性能、分布式的物联网大数据平台。
现代企业依赖大量 SaaS 服务。SeaTunnel 提供了强大的 API 连接能力,能从各种应用中抽取数据。
Http / GraphQL: 通用的 API 连接器,可对接任何提供 HTTP 或 GraphQL 接口的服务。
Github / Gitlab / Jira: 研发管理工具数据抽取。
Notion / GoogleSheets: 办公协同工具数据集成。
Klaviyo / Lemlist 等: 针对特定营销和销售 SaaS 的连接器。
FakeSource: 用于生成模拟数据,是开发和测试流程中的好帮手。
Socket: 从网络套接字流中读取数据。
Prometheus: 从主流监控系统中拉取指标数据。
从上面的清单可以看出,Apache SeaTunnel 的连接器生态已经覆盖了数据领域的方方面面,从传统数据库到云原生数仓,从大数据平台到 SaaS 应用,真正做到了“连接一切”的愿景。
其强大的生态背后,是其高度可插拔的插件化设计和活跃的开源社区。这使得任何开发者都可以轻松地为 SeaTunnel 贡献新的连接器,从而让其生态系统能够持续、快速地发展和壮大。
对于数据从业者而言,一个拥有如此丰富连接器的工具,意味着更少的定制开发、更快的项目交付和更低的技术门槛。
还在等什么?快来探索 Apache SeaTunnel 的强大功能吧!
了解更多:
