Spark之RDD概念详解

其他 2021-03-31 21:22:39 阅读次数: 0

文章目录

概述
五大属性
WordCount中RDD的五大属性

概述

RDD(A Resilient Distributed Dataset)：弹性分布式数据集,是Spark中最基本的数据抽象,用来表示分布式集合,支持分布式操作。

诞生背景
没有RDD/Dataset之前做 Wordcount(大数据计算)可以使用：

原生集合：Java/Scala中的List但是只支持单机版!不支持分布式,如果要做分布式的计算需要做很多额外工作,例如线程/进程通信，容错，自动均衡等，麻烦，所有就诞生了解决这些问题的框架。

MapReduce效率低运行效率低开发效率低)–早就淘汰
所以需要有一个分布式的数据抽象,也就是用该抽象,可以表示分布式的集合,那么基于这个分布式集合进行操作,就可以很方便的完成分布式的Word Count!(该分布式集合底层应该将实现的细节封装好,提供简单易用的API)

五大属性

在RDD对象中，每个RDD都有五个主要的属性：

分区列表: A list of partitions
计算函数: A function for computing each split
依赖关系: A list of dependencies on other RDDs
分区器: Optionally, a Partitioner for key-value RDDs (e.g. to say that the RDD is hash-partitioned)
计算位置：Optionally, a list of preferred locations to compute each split on (e.g. block locations for
an HDFS file)

WordCount中RDD的五大属性

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/zh2475855601/article/details/115029506

Spark之RDD概念详解

Apache Spark之RDD详解（章节二）

Spark RDD的概念

Spark RDD核心详解

Spark RDD详解

Spark——RDD操作详解

spark的rdd详解1

spark RDD 详解

【Spark】RDD详解

SPARK-RDD 详解

Spark RDD 的详解

Spark Core RDD详解

[Spark学习] Spark RDD详解

十一、Spark核心概念RDD

Spark之RDD基础

spark学习之RDD

[Spark]-RDD之创建

spark之RDD

Spark RDD之Partition

Spark RDD之Partitioner

Spark RDD之Dependency

Spark之RDD的创建

SPARK总结之RDD

Spark之RDD本质

spark 之RDD操作

spark之RDD算子

Spark之RDD创建

Spark函数详解系列之RDD基本转换

Spark RDD API详解之：Map和Reduce

Spark函数详解系列之RDD基本转换+实例

今日推荐

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

内幕！smardaten无代码平台全方位测评，这些细节你绝对想不到！

idea安装及激活配置流程---2024旗舰版(需激活码)

Elastic 创始人：热爱开源，希望合作 OSI 创建新许可证

工业互联网标识解析体系开放开源下载服务中心发布

IDEA取消自动选择光标所在行

828华为云征文 | 使用Flexus X实例搭建Dubbo-Admin服务

Programmer&AI—AI辅助编程学习指南

【Linux】虚拟机安装 openEuler 24.03 X86_64

o1 发布后 Sam Altman 最新访谈：AI 发展不仅没有放缓，而且我们对未来几年已经胜券在握

AI芯片国产化率100%！运营商最大单集群智算中心投产

周排行

【后端】 Spring Cloud 服务间调用

Git 学习教程

Salesforce集成(三). 获取数据02_获取Object和Field信息

Oracle执行计划的稳定（使用MANUAL类型的SQL PROFILE）

js跨域请求之jsonp原理和运用

ios -解决view遮挡按钮问题

【PAT天梯赛】L2-003 月饼（25 分)（贪心思想）

hive 存储格式的生产应用

【Python实践-6】将不规范的英文名字，变为首字母大写，其他小写的规范名字

容器学习点点滴滴（二）

每日归档

更多

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)

2024-09-24(0)