SparkStreaming实时计算单词统计 - 代码天地

SparkStreaming实时计算单词统计

编程语言 2018-07-27 02:05:47 阅读次数: 0

注意:先开启程序之后再将要统计的文本文档放入input目录下

import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}

object WordCountByHDFS {
  def main(args: Array[String]): Unit = {
    val conf=new SparkConf().setAppName("WordCountByHDFS").setMaster("local[2]")
    /**
      * 第一个参数是SparkConf对象
      * 第二个参数是每批数据的时间间隔
      */
    val ssc=new StreamingContext(conf,Seconds(3))

    //此时用到textFileStream()方法，需要HDFS文件的路径。
    val lines=ssc.textFileStream("E:\\input")

    val result=lines.flatMap(_.split(",")).map(word=>(word,1)).reduceByKey(_+_)

    result.print() //在控制台输出内容

    ssc.start() //启动，开始接收并处理实时流数据
    ssc.awaitTermination() //等待程序停止
    ssc.stop()
  }
}

猜你喜欢

转载自blog.csdn.net/CSDN_Hzx/article/details/81192773

SparkStreaming实时计算单词统计

SparkStreaming 实时计算广告点击流量实时统计需求技术方案数据库设计

大数据实时计算Spark学习笔记（1）—— Spak单词统计

大数据实时计算框架：SparkStreaming

SparkStreaming（伪实时计算框架）介绍，使用

Java版SparkStreaming读取Kafka实现实时的单词统计

Spark streaming 实时计算框架基本练习----词频统计

史上最简单的spark教程第十八章-SparkStreaming实时计算核心概念(一)

实时计算框架

实时计算

离线计算与实时计算

SparkStreaming实时单词统计WordCont,netcat-win32工具使用

SparkStreaming简介 - 与第一个Spark实时计算程序，使用netcat来写数据 - wordcount

实时计算系统---Storm

JStorm 实时计算对比

Storm 实时计算系统

实时计算与SparkSteaming的对比

spark笔记-实时计算

实时计算神器：binlog

大数据的实时计算与离线数据统计整理学习

hadoop离线计算与 storm实时计算

121.Spark大型电商项目-广告点击流量实时统计-对实时计算程序进行性能调优

Storm实时计算之Stream Grouping

spark streaming准实时计算demo

Spark Streaming实时计算学习

实时计算上传文件的进度

实时计算应用场景

Spark Streaming实时计算框架介绍

Apache Strom 实时计算系统

实时计算的消息不丢失机制

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)