大数据之Spark单词统计 - 代码天地

大数据之Spark单词统计

其他 2020-05-26 21:58:11 阅读次数: 0

题目三：使用Spark Core 统计文件中以spark开头的单词中，每个单词出现的次数（共计30分）

spark-core hadoop linux java spark-sql
storm html css vue spark
spring springboot struts
spark-hive
mapreduce hbase flume kafka
storm html css vue spark javascript
spring springboot struts
spark-hive php

1）创建spark项目，读取以上内容文件生成RDD（5分）
2）将文章内容进行切分成字符串（5分）
3）过滤出spark开头的字符串（5分）

4）对过滤出的字符串进行相应的运算处理（5分）

5）将处理结果进行累加（5分）

import org.apache.spark.{SparkConf, SparkContext}

object Test3 {
System.setProperty("hadoop.home.dir", "D:\\Studyingimportant\\hadoop-2.9.2");
def main(args: Array[String]): Unit = {
val conf = new SparkConf().setMaster("local[2]").setAppName("sort")
val sc = new SparkContext(conf)

sc.textFile("D:\\\\words.txt")
.flatMap(line => line.split(" "))
.filter(word => word.startsWith("spark"))
.map(word => (word,1))
.reduceByKey((x,y) => x+y)
.foreach(println)
}
}

猜你喜欢

转载自www.cnblogs.com/whyuan/p/12968858.html

大数据之Spark单词统计

大数据之简单统计单词的案例在本地eclipse运行

大数据开发之Spark篇----过滤脏数据并统计

大数据实时计算Spark学习笔记（1）—— Spak单词统计

大数据阶段划分及案例单词统计

大数据学习——mapreduce程序单词统计

大数据之spark

spark wordcount 单词统计

Spark实战：单词统计

大数据学习之spark

大数据基础之Spark

大数据技术之Spark

大数据09--MapReduce习题~统计单词数量

Spark Streaming 统计单词的例子

大数据入门——scala两种单词统计方法代码详解和运行结果分析（idea运行和spark集群运行）

Spark入门（三）--Spark经典的单词统计

Spark 大数据中文分词统计（一）开发环境搭建

大数据之Spark安装篇

大数据之Spark初识篇

大数据之Spark性能优化

大数据平台运维之Spark

大数据学习之SPARK计算天下

[大数据之Spark]——快速入门

大数据技术之Spark SQL

大数据技术之Spark基础解析

大数据之统计学基础

Spark Streaming小程序试验-《单词统计》

【JAVA语言之spark单词统计】

spark 单词统计开发及提交（scala版本）

spark单词统计开发（java版）

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)