大数据介绍-spark - 代码天地

大数据介绍-spark

其他 2020-04-24 23:57:30 阅读次数: 0

1、Hadoop

　　MapReduce，大数据计算框架,map将数据写入磁盘，然后分发到reduce。只适合处理对处理速度不敏感的大数据计算任务。基于磁盘，大量网络传输。处理过程太死板，必须shuffle

　　HDFS，大数据存储系统

　　Hive，SQL，大数据查询框架/计算框架

　　HBase，NOSQL，实时/准实时查询，存储查询系统

　　YARN，资源调度

客户端，J2EE开发的一些数据系统，包含HQL的shell脚本，

2、Spark，大数据计算框架。执行操作时，各种操作都在内存。比mapreduce和hive快几十倍。

　　HDFS,大数据离线计算和批处理

　　Hive，

　　Spark Core离线计算

扫描二维码关注公众号，回复： 11123477 查看本文章

　　Spark SQL交互式查询

　　Spark Stream实时流计算

　　Spark MLlib机器学习

　　Spark Graphx图计算

　　Spark RDD

　　Spark Engine

　　Yarn，Mesos，AWS

　　HDFS，S3，Cassandra

　　

3、storm

　　

猜你喜欢

转载自www.cnblogs.com/xiaofeiyang/p/12770745.html

大数据介绍-spark

大数据介绍

大数据介绍详情

工业大数据介绍

大数据介绍及大数据项目流程

大数据教程【01.01】--大数据介绍及开发环境

DKhadoop大数据处理平台监控数据介绍

云计算与大数据介绍（非原创）

大数据介绍和集群安装--hadoop

元数据介绍

MODIS数据介绍

POI数据介绍

NCEP数据介绍

运营商大数据，运营商大数据介绍

sql查询数据介绍

Landsat 8数据介绍

Fidder教程-数据介绍

ICESat数据介绍及下载

表结构数据介绍

遥感数据介绍—MODIS

MODIS数据介绍及下载

数据仓库元数据介绍

CRM产品主数据介绍

Landsat卫星数据介绍及下载方法

章节四： RASA 训练数据介绍

大数据项目之电商数仓、业务数据介绍、电商系统表结构

大数据项目之电商数仓、业务数据介绍、MySQL安装、更改MySQL密码策略

大数据12_Spark MLlib介绍

Hadoop与Spark等大数据框架介绍

大数据-Spark的介绍：前世今生

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)