kafka是数据处理的未来？ - 代码天地

kafka是数据处理的未来？

其他 2018-05-10 05:31:05 阅读次数: 0

kafka能够通过kafka connect API实现流数据管道的构建，也就是ETL中的E和L，connect API利用了kafka的可扩展性，基于kafka的容错模型进行构建并且提供了一种统一的方式监控所有的连接器。

流处理转换可以通过Kafka Stream API来实现，这提供了ETL中的T，来自source的数据经过抽取后可以作为结构化的事件放到平台中，然后可以通过流处理进行任意的转换。

未来，有两种互相独立的实时处理场景：实时的MapReduce和事件驱动的微服务

1 实时的mapreduce适用于分析用例并且需要中心化的集群和自定义的打包，部署和监控。storm ，sparkstreaming，flink实现了这种模式

2 事件驱动的微服务方式，通过kafka streams API来实现，可以让任何用例都能访问流处理，这样只需添加一个嵌入式库到java应用中并搭建一个kafka集群即可

kafka 的log 方式，统一了批处理和流处理，log可以通过批处理的窗口方式进行消费，也能在每个元素抵达的时候进行检查以实现实时处理。

随着5G时代的来临，物联网的数据会暴涨，实时数据处理的需求将完全盖过批处理，所以，重点关注实时处理部分。

猜你喜欢

转载自blog.csdn.net/yyqq188/article/details/79398543

kafka是数据处理的未来？

为什么说Kafka才是数据处理的未来？

批处理ETL已死，Kafka才是数据处理的未来？

大数据-Kafka数据处理

Kafka之海量数据处理

Kafka在大数据处理中的应用

边缘计算的未来：提高数据处理效率，降低延迟

sparkStreaming与kafka集成进行数据处理

大数据处理框架之:Storm + Kafka + zookeeper 集群

浅析Kafka实时数据处理系统

实时日志数据处理——Kafka、Storm、ElasticSearch集成

使用Kafka Streams进行准实时ETL数据处理

分布式数据库PolonDB 云端发力未来数据处理需求

开创实时数据处理新未来：EMQ 流数据库 HStreamDB 正式开源！

流式计算中的多线程处理：如何使用Kafka实现高效的实时数据处理

（大数据实时动态数据处理）flume+kafka+strom;zookeeper+hadoop+hbase

从图森未来的数据处理平台，看Serverless 工作流应用场景

海量数据处理

Oracle——数据处理

数据处理

大数据处理

RocketMq数据处理

json数据处理

线程的数据处理

数据处理函数

pandas 数据处理

数据处理(转)

数据处理练习

R 数据处理

python数据处理

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)