Storm中Trident框架详解

一、Storm Trident概述及特性

Trident是在storm基础上，一个以realtime 计算为目标的高度抽象。它在提供处理大吞吐量数据能力的同时，也提供了低延时分布式查询和有状态流式处理的能力。好比 Mapreduce框架的Pig，Trident是Storm提供的基于基本API开发的高级框架。Trident提供了 joins, aggregations, grouping, functions, 以及 filters等能力。

除此之外，Trident 还提供了一些专门的原语，从而在基于数据库或者其他存储的前提下来应付有状态的递增式处理。

Trident是完全容错的，拥有有且只有一次处理的语义，其实就是transactional的高级封装。这就让你可以很轻松的使用Trident来进行实时数据处理。Trident会把状态以某种形式保持起来，当有错误发生时，它会根据需要来恢复这些状态。

Trident封装了transactional事务类，所以我们不再需要学习Batch相关的基础API了，减轻了学习成本。

trident每次处理消息均以batch为单位，即一次处理多个元组

trident是storm的更高层次抽象，主要提供了3个方面的好处：