Spark得整理 - 代码天地

Spark得整理

其他 2020-04-19 11:08:47 阅读次数: 0

Spark是使用Scala语言编写、基于内存运算的大数据计算框架。

以Spark core为核心，提供了Spark SQL、Spark Streaming、MLlib几大功能组件

中文文档：https://spark.apachecn.org/#/

github地址：https://github.com/apache/spark

Spark Core

Spark提供了多种资源调度框架，基于内存计算、提供了DAG的执行流程管理以及RDD的血缘关系来保证计算的快速和高容错性。RDD是Spark的核心概念

Spark SQL

SparkSQL基于Spark Core来优化sql查询，将sql的查询转为对应的RDD（DateFrame），并进行优化，简化了开发，提高了数据清洗的效率

Spark Streaming

SparkStreaming是基于SparkCore实现的流处理框架，通过微批的概念实现了流处理（DStream），可以将数据的延迟保证为最少500ms，是一个高吞吐高容错的流式处理框架。

发布了238 篇原创文章 · 获赞 429 · 访问量 25万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_45765882/article/details/105522676

Spark得整理

spark RDD 之间得依赖关系

Spark异常报错整理

spark 基本操作整理

Spark整理(1)

Spark DataFrame 学习整理

spark题目整理

Spark面试整理

spark相关资料整理

Spark 数据倾斜的整理

Spark TroubleShooting整理

马士兵语录（看了他的SSH视频整理而得）

Spark RDD常用算子整理

Spark学习之问题整理

Spark学习整理之一

Hive on Spark on YARN配置整理

Spark 之RDD算子的整理

spark基本概念整理

spark项目技术点整理

spark整理数据放入mysql

Spark笔记整理（三）：Spark WC开发与应用部署

Spark笔记整理（二）：RDD与spark核心概念名词

Spark笔记整理2——Spark架构及执行流程

Spark笔记整理之RDD转化DataFrame

Spark笔记整理1——RDD概述

Spark知识整理（未完待续）

Spark笔记整理（十二）：日志记录与监控

Spark学习(六)常用算子整理

Spark基础知识整理&入门

Spark面试题整理(更新中)

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)