大数据的计算模式 - 代码天地

大数据的计算模式

其他 2020-03-09 11:17:31 阅读次数: 0

1. 批处理计算

批量处理无法实现实时计算，可以用Mapreduce和spark。

由于spark是将数据放在内存中计算的，而mapreduce数据在磁盘中，需要将数据从磁盘中读取到内存，算完后再释放回磁盘

因此spark可以实现接近准实时性和秒级的响应

2. 流计算

数据源源不断的放入系统中计算（时间序列的数据），数据特点：少，但是要求响应极快（ms级别）

例如：大型应用系统的故障分析障碍

需要源源不断的从日志中读取，并对日志分析，再做出判断

用啥解决：

storm可以实现

S4，Flume，DStream都可以进行流计算

spark可以

mapreduce是不可以的，他的响应一般是分钟级别的

3. 图计算（有边和结点）

社交网络的数据，谁和谁关系较好等

地理信息的数据，各个城市间的高铁分布等

可以用MApreduce计算，但是效率特别低

google公司开发了专门针对图计算的框架---pregel

Hama、power Graph等也可以进行图计算

4. 查询分析计算

企业中应用最多。对数据仓库中的数据，用sql语句进行查询分析

专门的计算实现：google公司的Dremel

hadoop生态圈的hive

猜你喜欢

转载自www.cnblogs.com/ivyharding/p/12447314.html

大数据的计算模式

大数据典型的计算模式

深入了解大数据计算模式

大数据计算模式有哪些

大数据计算：结构化大数据计算的理想模式

大数据关键技术、及计算模式介绍，以及大数据与云计算、物联网的关系

流式大数据计算实践（1）----Hadoop单机模式

数据的计算（大数据）

城市计算与大数据

大数据计算平台

大数据云计算

大数据计算框架

大数据与云计算

大数据计算引擎

大数据离线计算

Hadoop单机模式的分布式计算框架配置——大数据

云计算需要大数据，大数据需要云计算！

大数据和云计算

云计算与大数据课程×××？

大数据计算技术

云计算与大数据安全

大数据、云计算区别

大数据与云计算的关系

大数据拥抱云计算

大数据------MapReduce 计算流程

大数据计算框架概述

大数据计算系统概述

大数据商业模式

慕课笔记-数据科学导论-第八章大数据与云计算-云计算概念特点/分类/体系架构/大数据与云计算/应用/分布式计算/服务模式/主要技术

大数据数据挖掘与云计算-认识大数据

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)