Flume框架（基础） - 代码天地

Flume框架（基础）

其他 2019-03-18 03:32:34 阅读次数: 0

一、Flume在集群中扮演的角色

Flume、Kafka用来实时进行数据收集，Spark、Storm用来实时处理数据，impala用来实时查询。

二、Flume框架简介

1、Flume提供一个分布式的，可靠的，对大数据量的日志进行高效收集、聚集、移动的服务，Flume只能在Unix环境下运行。

2、Flume基于流式架构，容错性强，也很灵活简单，主要用于在线实时分析。

3、角色

1）Source

用于采集数据，Source是产生数据流的地方，同时Source会将产生的数据流传输到Channel，这个有点类似于Java IO部分的Channel

2）Channel

用于桥接Sources和Sinks，类似于一个队列。

3）Sink

从Channel收集数据，将数据写到目标源（可以是下一个Source，也可以是HDFS或者HBase）

4、传输单元

Flume数据传输的基本单元，以事件的形式将数据从源头送至目的地

5、传输过程

source监控某个文件，文件产生新的数据，拿到该数据后，将数据封装在一个Event中，并put到channel后commit提交，channel队列先进先出，sink去channel队列中拉取数据，然后写入到hdfs或者HBase中

三、安装配置FLume

配置Java的环境变量 flume-env.sh

四、Flume帮助命令

$ bin/flume-ng

猜你喜欢

转载自blog.csdn.net/qq_40310148/article/details/87870465

Flume框架（基础）

Flume框架

flume 框架

flume基础

采集框架Flume

日志采集框架Flume

Flume日志收集框架

Flume基础学习笔记

flume基础教程

flume基础（三）

flume基础（二）

flume基础（一）

flume 1.8.0 开发基础

Flume基础配置

Flume 基础知识

Flume基础知识

Flume基础学习

1 flume基础入门

Flume基础学习实践

Flume学习（一）Flume的基础介绍

Flume学习之路（一）Flume的基础介绍

【Flume】Flume基础之安装与使用

【Flume】（二）Flume 定义和基础架构

Flume基础（三）：Flume 监控之 Ganglia

Flume日志采集框架的使用

Flume日志采集框架（1）

Flume日志采集框架学习

三十六、Flume框架介绍

Flume+kafka+storm基础

flume简介及安装 Flume学习之路（一）Flume的基础介绍 Flume学习之路（二）Flume的Source类型 Flume学习之路（三）Flume的配置方式

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)