架构师
其他
数据库
推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

基于 Apache SeaTunnel 实现超高性能数据同步

白鲸开源 联合创始人 Apache SeaTunnel PMC & Apache 孵化器导师

白鲸开源联合创始人、Apache DolphinScheduler PMC Chair & Apache SeaTunnel PPMC & Apache 基金会 Member & Apache 孵化器导师、Apache Local Community Beijing 成员,负责的 DolphinScheduler 于 2021 年 4 月 9 号正式成为 Apache 顶级项目,这是首个由国人主导并贡献到 Apache 基金会的大数据工作流领域的顶级项目。
作为 10 多年的开源贡献者及不遗余力的在中国推广 Apache 开源文化 ,负责世界级开源会议 ApacheCon Asia 的大数据论坛出品、Apache 路演中国 COSCon 大会的大数据论坛出品人,也多次在思否、CSDN、开源中国、Infoq、ArchSummit、GOTC、GIAC、51CTO 等组织的会议上分享开源之道。

作为 Apache 孵化器导师,也在帮助孵化微众主导的 Linkis 项目和百度主导的 HugeGraph,推广 Apache 成功之道,致力于让开源文化更好的在中国开发者群体传播。

白鲸开源联合创始人、Apache DolphinScheduler PMC Chair & Apache SeaTunnel PPMC & Apache 基金会 Member & Apache 孵化器导师、Apache Local Community Beijing 成员,负责的 DolphinScheduler 于 2021 年 4 月 9 号正式成为 Apache 顶级项目,这是首个由国人主导并贡献到 Apache 基金会的大数据工作流领域的顶级项目。 作为 10 多年的开源贡献者及不遗余力的在中国推广 Apache 开源文化 ,负责世界级开源会议 ApacheCon Asia 的大数据论坛出品、Apache 路演中国 COSCon 大会的大数据论坛出品人,也多次在思否、CSDN、开源中国、Infoq、ArchSummit、GOTC、GIAC、51CTO 等组织的会议上分享开源之道。 作为 Apache 孵化器导师,也在帮助孵化微众主导的 Linkis 项目和百度主导的 HugeGraph,推广 Apache 成功之道,致力于让开源文化更好的在中国开发者群体传播。

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

成为教练

课程简介

案例背景:
当今数据源多达几百种,来源不仅有关系型和非关系型数据库,还有 SAAS、日志及接口数据等,离线批量同步已不能满足业务需求,越多越多的业务要求实时同步,如何让这些数据源之间可以快速高效进行离线和实时同步,且做到数据一致性及完善的监控同时占用最少的资源,这是对数据集成的一个极大的挑战


解决思路:
研发数据集成同步专用引擎 Zeta 来解决海量数据(离线&实时)同步和转化的数据集成难题

成果:
利用 Apache SeaTunnel 数据同步管道,可以以尽可能简单的结构和较低的消耗完成数据同步,对于大规模的数据集成同步提供更优的表现。

目标收益

1、Apache SeaTunnel 功能与架构设计
2、为何研发 SeaTunnel 自己的同步引擎 Zeta、而不是选择基于 Spark/Flink?
3、用户使用案例及后续 Roadmap 等内容

培训对象

课程内容

案例方向


AI基础设施 / 搜索广告推荐 / 数据分析 / DataOps

案例背景


CDC(变更数据捕获)是数据集成同步的典型应用场景之一,过去业内的方案难以同时兼顾高吞吐、低消耗、易管理、Schema 演化等需求,只能在某一方面或者几方面做权衡取舍。
在本次分享,我将着重于讲解如何基于 Apapche SeaTunnel 构建 CDC 数据同步管道,以及引入一系列特性来解决上述问题。

收益


1. 了解 Apache SeaTunnel 在 CDC 场景的应用实践
2. 了解 Apache SeaTunnel CDC 的技术实现和最新的功能特性
3. 了解如何使用 Apache SeaTunnel 搭建 CDC 数据同步管道的案例

解决思路


引入 CDC 连接器,在 CDC 连接器内实现整库同步减少作业管理维护负担,实现多并行同步历史数据并切换到单并行增量阶段(无锁并行增量快照),加速同步过程。
同时支持断点续传在错误位置恢复减少重复消耗,再结合 Schema 演化自动推送结构变更到目标库,实现数据与结构的自动化一体变更。

结果


利用 Apache SeaTunnel CDC 数据同步管道,可以以尽可能简单的结构和较低的消耗完成数据同步,对于大规模的数据集成同步提供更优的表现。

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

预约体验票 我要分享

近期公开课推荐

近期公开课推荐

提交需求