Flume抽取SQL Server设计方案 - 代码天地

Flume抽取SQL Server设计方案

其他 2018-07-27 20:08:47 阅读次数: 0

一、需求

因项目需要对数据进行实时分析展示，需要实时收集关系性数据中的数据

二、设计方案

方案一

(1)为mysql创建 trigger

(2)通过创建是trigger去触发jave程序

(3)通过java程序去触发kettle.job实现数据的抽取同步。

总结：此方案设计复杂，繁琐。

方案二

(1)使用flume抽取sql server :board表中的数据，flume只能增量抽取，无法处理更新的数据

(2)为mysql创建 trigger,通过trigger将有变更的数据存到A表中

(3)使用flume抽取A表有更新的数据

(4)在Spark Streaming 中使用RDD对这两部分数据进行处理，使用filter得到真实的数据，进行相应的计算，实现实时的功能。

总结：实现起来简单，配置下flume就实现数据收集，程序开发也简单，所以最终采用的第二种方式，详细请查看后面的博文

《Flume抽取SQL Server设计方案具体实现》

猜你喜欢

转载自blog.csdn.net/fengfengchen95/article/details/80476522

Flume抽取SQL Server设计方案

Flume抽取SQL Server设计方案具体实现（二）触发器

两个sql设计方案的比较

权限的设计方案

token 的设计方案

接口设计方案

登录的设计方案

秒杀的活动设计方案

【lincese】lincese设计方案

svg展示设计方案

站内信设计方案

角色权限设计方案

Zigbee网关的设计方案

评价短信设计方案

软件设计方案

秒杀系统设计方案

WMS接口设计方案

网络层设计方案

日志收集设计方案

JsonWebToken(JWT)设计方案

错误编码设计方案

性能测试设计方案

权限系统设计方案

秒杀活动设计方案

Informatica抽取SQL Server数据库乱码

【设计】设计方案清晰输出

用户认证管理设计方案

全局唯一ID设计方案

扩展词库构建设计方案

系统中图片上传设计方案

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)