SparkStreaming学习札记3-2020-2-14--SparkStreaming实时流处理项目实战 - 代码天地

SparkStreaming学习札记3-2020-2-14--SparkStreaming实时流处理项目实战

其他 2020-03-15 16:43:47 阅读次数: 0

第11章 Spark Streaming整合Flume&Kafka打造通用流处理基础

1.日志到flume环节

编写flume配置文件streaming.conf后

进入flume目录

cd /home/hadoop/app/apache-flume-1.6.0-cdh5.7.0-bin/conf

启动

flume-ng agent --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/streaming.conf --name agent1 -Dflume.root.logger=INFO,console

2.flume到Kafka环节

进入zookeeper目录

cd /home/hadoop/app/zookeeper-3.4.5-cdh5.7.0/bin/

扫描二维码关注公众号，回复： 9835838 查看本文章

启动zookeeper

./zkServer.sh start

启动Kafka

进入目录

cd /home/hadoop/app/kafka_2.11-0.9.0.0/bin

./kafka-server-start.sh -daemon /home/hadoop/app/kafka_2.11-0.9.0.0/config/server.properties

查看有哪些topic

./kafka-topics.sh --list --zookeeper hadoop000:2181

创建topic

./kafka-topics.sh --create --zookeeper hadoop000:2181 --replication-factor 1 --partitions 1 --topic streamingtopic

启动flume

flume-ng agent --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/streaming2.conf --name agent1 -Dflume.root.logger=INFO,console

3.kafka到Spark Streaming环节

生产：

./kafka-console-producer.sh --broker-list localhost:9090 --topic kafka_streaming_topic

消费监控：

./kafka-console-consumer.sh --zookeeper hadoop000:2181 --topic kafka_streaming_topic

发布了22 篇原创文章 · 获赞 0 · 访问量 451

私信关注

猜你喜欢

转载自blog.csdn.net/qq_36956082/article/details/104307423

SparkStreaming学习札记3-2020-2-14--SparkStreaming实时流处理项目实战

SparkStreaming学习札记2-2020-2-13--SparkStreaming实时流处理项目实战

SparkStreaming学习札记5-2020-2-17--SparkStreaming实时流处理项目实战

SparkStreaming学习札记5-2020-2-16--SparkStreaming实时流处理项目实战

SparkStreaming学习札记4-2020-2-15--SparkStreaming实时流处理项目实战

SparkStreaming学习札记1-2020-2-11--SparkStreaming实时流处理项目实战

spark之sparkStreaming实时流处理

sparkStreaming实时处理

sparkstreaming整合kafka实时流处理的pom文件模板

SparkStreaming 数据实时处理

SparkStreaming_Flume_Poll 流处理

基于Hadoop生态SparkStreaming的大数据实时流处理平台的搭建

SparkStreaming

大数据学习——SparkStreaming整合Kafka完成网站点击流实时统计

SparkStreaming项目实战（二）环境搭建

sparkStreaming+kafka+redis小项目实战

基于Kafka+SparkStreaming+HBase实时点击流案例

SparkStreaming系列（一）SparkStreaming工作原理及流程操作---揭开实时流的本质--如何操作实时流数据

SparkStreaming的实战案例

电影推荐系统项目 SparkStreaming实时消费Kafka数据(十一)

在sparkStreaming实时存储时的问题

Spark Streaming实时流处理项目实战

Spark Streaming实时流处理项目实战

SparkStreaming的WordCount学习

SparkStreaming学习示例

sparkStreaming kafka学习笔记

SparkStreaming学习笔记

SparkStreaming与kafka入门学习

SparkStreaming 学习笔记

SparkStreaming（三）离散流（DStream）

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)