Storm的理解 - 代码天地

Storm的理解

其他 2019-07-18 10:01:31 阅读次数: 0

1、Storm流式处理：

Storm vs. mapreduce

Storm：面向实时

缺点：吞吐能力差

优点：时效性好，毫秒级别，增量式处理

Mapreduce：面向批量

缺点：时效性差

优点：吞吐能力强，适合批处理

2、Storm：没有持久化功能——》快

可靠性：保证消息处理

本地模式

原语：spout和bolt

3、Storm基本概念：

1）Stream：数据流

2）Tuple：最基本的数据单元

3）Topology：网络拓扑

Grouping：Shuffle/Fields

4）Spout：消息生产者

可以对接很多类型的数据流

收集消息处理的ack、fail

5）Bolt：消息处理逻辑

过滤、访问外部服务、数据格式化、聚合、汇总。。。

可以发送多条流

4、常见模式：

（1）流式

（2）持续计算——机器学习迭代

（3）分布式RPC——独立服务

5、架构：

主：Nimbus：分配工作

如果挂掉：重启之后，像什么事情没有发生一样——无状态（快速失败fail-fast）

意味着你可以用kill -9来杀死Nimbus和Supervisor进程，然后再重启它们，就好像什么都没有发生过。这个设计使得Storm异常的稳定。

从：Supervisor：监控工作

快速失败fail-fast，监控Worker工作

Worker：工作进程

Task：线程

spout和bolt的线程都是task

executor进程，里面维护很多task，每次只会执行一个task

Zookeeper协调管理

　　　

　　

　　

　　

6、容错：

架构容错

数据容错：

（1）timeout

（2）ack机制：本质是一个特殊的task

猜你喜欢

转载自www.cnblogs.com/chen8023miss/p/11205211.html

Storm的理解

Storm深入理解

理解Storm Metrics

Storm快速理解

理解Storm并行度

理解Storm并发

理解Storm Topology的并发机制

storm源码之理解Storm中Worker、Executor、Task关系

【Storm总结-2】关于Storm 中Topology的并发度的理解

用实例理解Storm的Stream概念

理解Storm中的拓扑的并发度

理解 Storm 拓扑的并行度(parallelism)概念

深入理解Storm 之 TridentStrom

Storm

Apache Storm 编程入门基础（六）：Storm 并行处理的理解和配置

[storm]消息事务算法的一个理解

Storm入门（六）深入理解可靠性机制

用实例的方式去理解storm的并发度

单文件演示storm实时流式全内存计算的wordcount--可以很好理解storm的执行过程

Storm简介——初始Storm

Storm和Storm比较

Storm: monitor storm with supervisor

storm流程——storm

Storm入门--Storm编程

Storm storm简介(一)

数据处理神器storm的理解与思考 ——让你的数据化作行云流水

（转）理解storm 进程内消息流（很好的一篇文章）

理解storm的并行执行，workder,executor,task的关系以及调度算法

Storm简介

Storm demo

今日推荐

周排行

(BIND最佳实践)Linux运维最佳实践

makefile ifeq之坑: 1. syntax error near unexpected token 2. *** missing separator. Stop.

easyui datagrid操作栏内置图片按钮

SQLyog连接MySQL时出现的2058错误解决方法

linux音频开发

hashcode方法简析

SpringBoot中使用Transaction注解遇到的坑

逆战-CSS中子元素在父元素中的4种水平垂直居中方法

Expression.Blend.4 Chapter 图片和视频的使用

springMVC返回void值

每日归档

更多

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)