1. 项目概述 - 代码天地

1. 项目概述

其他 2019-05-08 14:41:37 阅读次数: 0

1. 项目背景

本项目是一个基于日志的大数据实战项目。主要功能是通过Python 脚本产生模拟登陆日志，使用Flume收集信息，上传到kafaka，通过Spark Streaming 消费kafka的数据，存入HBase中。

后续在HBase的数据上，进行可视化的开发。

项目的整体架构如下图所示：

项目架构

2. 模块简介

Flume

Apache Flume 是一个分布式日志收集系統。本项目中主要使用Flume监控日志文件，并把数据发送至Kafka。
Kafka

kafka是一个按照分布式事务日志架构的大规模发布/订阅消息队列。本项目中的主要作用是作为Flume 和 SparkStreaming的中转站。
Spark Streamig

分布式实时处理框架。本项目中的主要作用是消费Kafka中的日志数据，完成数据格式的转换，并存入HBase中。
HBase

HBase是一个开源的非关系型分布式数据库（NoSQL）。本项目中主要用于存储处理后的数据。
Spring Boot

读取数据，为可视化提供数据接口。
Echarts

完成数据的可视化展示。

3. 环境版本

Flume

apache-flume-1.9.0
Kafka

kafka_2.11-2.1.1
Spark

spark-2.4.0-bin-2.6.0-cdh5.7.0

猜你喜欢

转载自blog.csdn.net/huatangzhithree/article/details/88718261

1. 项目概述

SpringMVC 1.概述

1. LVS概述

JPA 1.概述

1.概述

HAProxy—— 1.概述

1. 异常概述

1. VBA概述

1. 项目介绍

1. 项目综述

1.创建项目

1.项目优化

1.并发编程概述

Spring的学习____1.概述

1. Spark Streaming概述

1.设计模式概述

1.目标检测概述

1. 机器学习概述

1.机器学习概述

1. Java 语言概述

1.网络爬虫概述

1.创建SpringMVC项目

1.搭建项目环境

Django项目概述（1）

1.构建SOAP WebServices——概述

1. 统计学概述

1. 根文件系统概述

1. Java对象持久化概述

JFinal源码解析：1.概述

1. java缓存-多级缓存概述

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)