SparkStreaming读取Kafka数据 - 代码天地

SparkStreaming读取Kafka数据

其他 2018-09-14 06:36:32 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/GUANYAQI1996/article/details/78663057

package kafka

import org.apache.spark.SparkConf
import org.apache.spark.streaming.kafka010.KafkaUtils
import org.apache.spark.streaming.{Duration, StreamingContext}
import org.apache.spark.streaming.kafka010.LocationStrategies.PreferConsistent
import org.apache.spark.streaming.kafka010.ConsumerStrategies.Subscribe
/*记得添加依赖

<dependency>
  <groupId>org.apache.spark</groupId>
  <artifactId>spark-streaming-kafka-0-10_2.11</artifactId>
  <version>2.2.0</version>
</dependency>*/

object KafkaSparkStreaming {
  val conf=new SparkConf().setMaster("local[*]").setAppName("data from kafka")
  val ssc=new StreamingContext(conf,Duration(5))

  def main(args: Array[String]): Unit = {
    //kafka的配置参数
    val kafkaParams = Map(
      "bootstrap.servers" -> "master:9092,master:9093",
      ("key.deserializer" -> "org.apache.kafka.common.serialization.StringDeserializer"),
      "value.deserializer" -> "org.apache.kafka.common.serialization.StringDeserializer",
      "group.id" -> "kafkaTest",
      "enable.auto.commit" -> "false"
    )

    val topics = Set("spark")//创建topic
    val kafkaDstream = KafkaUtils.createDirectStream[String, String](
      ssc,
      PreferConsistent,//本地策略
      Subscribe[String, String](topics, kafkaParams)//消费策略
    ).map(x=>x.value())
      .flatMap(_.split("\\s"))
      .map((_,1))
      .reduceByKey(_+_)
      .print()
    
    ssc.start()
    ssc.awaitTermination()
  }
}

猜你喜欢

转载自blog.csdn.net/GUANYAQI1996/article/details/78663057

SparkStreaming读取Kafka数据

SparkStreaming读取kafka数据的方式

SparkStreaming与kafka通过直连方式读取数据

sparkStreaming读取kafka数据的2种方式

SparkStreaming 读取Kafka createDirectStreaming

SparkStreaming读取kafka数据的两种方式

SparkStreaming《三》读取kafka数据，增量保存在Mysql里

SparkStreaming消费kafka数据

SparkStreaming读取Socket数据

SparkStreaming -Kafka数据源

读取kafka数据通过SparkStreaming处理，数据零丢失--使用jdbc存储offset

Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十一）定制一个arvo格式文件发送到kafka的topic，通过sparkstreaming读取kafka的数据

kafka SparkStreaming

SparkStreaming读取Kafka对接Flume抽取到的数据库数据并保存到HBase中，Hive映射HBase进行查询

SparkStreaming通过Kafka获取数据（Receiver方式）

SparkStreaming 解析Kafka JSON格式数据

sparkstreaming对接kafka出现的数据积压问题

SparkStreaming消费kafka中数据的方式

Java版SparkStreaming读取Kafka实现实时的单词统计

SparkStreaming入门：通过socket读取流数据

大数据11_Kafka知识以及kafka与sparkstreaming结合

【Kafka】《Kafka权威指南》——从Kafka读取数据

flume 读取kafka 数据

大数据实时阶段----【Spark04之sparkStreaming整合flume、sparkStreaming整合kafka (★★★★★)】

【sparkStreaming】kafka作为数据源的生产和消费

sparkstreaming + kafka如何保证数据不丢失、不重复

sparkStreaming与kafka集成进行数据处理

大数据学习之路96-SparkStreaming整合Kafka

SparkStreaming消费Kafka数据kafkaRDD转DataSet的小问题

sparkStreaming-获取kafka数据并按批次累加

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)