Spark Streaming--1 文件默认数据源 - 代码天地

Spark Streaming--1 文件默认数据源

其他 2019-01-05 00:11:19 阅读次数: 0

版权声明：未经同意，不得转载。 https://blog.csdn.net/qq_36235275/article/details/82501521

文件数据流：能够读取所有HDFS API兼容的文件系统文件，通过fileStream方法进行读取
Spark Streaming 将会监控 dataDirectory 目录并不断处理移动进来的文件，记住目前不支持嵌套目录。

文件需要有相同的数据格式
文件进入 dataDirectory的方式需要通过移动或者重命名来实现。
一旦文件移动进目录，则不能再修改，即便修改了也不会读取新数据。
如果文件比较简单，则可以使用 streamingContext.textFileStream(dataDirectory)方法来读取文件。文件流不需要接收器，不需要单独分配CPU核。

## 导入相应的jar包
scala> import org.apache.spark.streaming._
## 创建StreamingContext操作对象
scala> val ssc = new StreamingContext(sc,Seconds(5))
scala> val lines = ssc.textFileStream("hdfs://master:9000/spark/data")
scala> val wordCount = lines.flatMap(_.split("\t")).map(x=>(x,1)).reduceByKey(_+_)
scala> wordCount.print
scala> ssc.start

[root@master ~]# hadoop fs -rm -r ./data1 /spark/data1 //上传数据至该目录

猜你喜欢

转载自blog.csdn.net/qq_36235275/article/details/82501521

Spark Streaming--1 文件默认数据源

spark streaming运行kafka数据源

spark streaming使用数据源方式插入mysql数据

Spark Streaming使用Kafka作为数据源

Spark Streaming--2 自定义数据源

Spark Streaming 自定义数据源之 WordCount

spark streaming kafka数据源的准备工作

Spark Streaming快速入门系列(3) | Kafka 数据源

Spark Streaming（二十六）DStream基本数据源、高级数据源

kafka（六）：与spark streaming对接，spark streaming接收kafka数据源

Spark SQL数据源：Parquet文件

Spark 数据源

spark数据源

Spark SQL 笔记(9)—— 外部数据源(1) parquet

Spark Streaming篇1：Spark Streaming 把数据写到hbase，并拼接rowkey

SpringBoot - 数据源（1） - 使用默认数据源

spark streaming 文件系统

Spark Streaming概述（1）

大数据-Spark Streaming

Spark Streaming笔记整理（二）：案例、SSC、数据源与自定义Receiver

Spark Streaming详解以及自定义数据源详解

Spark Streaming 快速入门系列(3) | DStream中如何创建数据源

Spark Streaming快速入门系列(2) | RDD队列+自定义数据源

Spark（六十一）：在Spark2.4 Structured Streaming中Dataset是如何执行加载数据源的？

Spark Streaming: 实时流式数据处理机制(1)

spark -外部数据源

Spark SQL数据源

IMF传奇行动第86课：Spark Streaming第五课：Spark Streaming数据源Flume实际案例分享

[1] - spark-streaming概述

1. Spark Streaming概述

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)