大数据：Flume架构笔录 - 代码天地

大数据：Flume架构笔录

其他 2020-03-05 16:53:01 阅读次数: 0

从大数据采集到数据存储—Flume 采集框架：分布式

数据源（模拟）----数据采集（Flume）—数据存储（HDFS：分布式文件系统）

Flume架构
数据采集：从一端到另一端

文件

Source (输入) -----> Channel( 事件的缓存)( 相当于水管)—> Slink( 输出)

HDFSf分布式文件系统）

Flume代码
#1.定义agent :a2（整体架构相加）
a2.sources=r2
a2.slinks=k2
a2.channel=c2

#2.定义Source 输入（文件—》exec）命令（tail -f）监控
a2.sources.r2.type=exec
a2.sources.r2.command=tail -f /opt/Andy
a2.source.r2.shell=/bin/bash -c

#3.定义Slink 输出（类型—》hdfs）
a2.slinks.k2.type=hdfs
a2.slinks.k2.hdfs.path=hdfs://bigtail:9000/flum/%t%m%d%H

#4.定义Channel (缓存—》内存 |磁盘 )
a2.channel.c2.type=memory
a2.channel.c2.capacity=1000 容量
a2.channel.c2.transactionCapacity=100 批量

#5.双向链接（链接Source 与Slink）
a2.sources.r2.channels=c2
a2.slinks.k2.channel=c2

大数据
1）离线开发–》Hadoop、Flume、Hive、HBase、sqoop、Azkaban
2）实时开发–》Spark Flink
3）项目—》推荐 | 用户画像

发布了99 篇原创文章 · 获赞 40 · 访问量 16万+

私信关注

猜你喜欢

转载自blog.csdn.net/jihong10102006/article/details/103517435

大数据：Flume架构笔录

【大数据之Flume】一、Flume定义及组成架构

架构笔录

大数据系列之日志采集Flume（一）Flume简介，架构组成与工作流程，安装

17-ETL工具、大数据架构、Flume介绍、Flume组件介绍

大数据之Flume

大数据----flume

大数据flume汇总

大数据(七) - Flume

大数据013——Flume

大数据（一）flume

大数据之Flume:Flume进阶

大数据之Flume:Flume概述

大数据之Flume:Flume拓扑结构

【大数据Flume系列】Flume 整合 Kafka

【大数据之Flume】二、Flume入门

大数据-Flume整合Kafka

大数据运维Flume

大数据技术之Flume

入门大数据---Flume的搭建

Hadoop大数据学习--Flume

大数据平台——flume开发

大数据组件学习-Flume

大数据架构：flume-ng+Kafka+Storm+HDFS 实时系统组合

HDFS+Spark(Hive On Spark)+Flume/Shell架构进行大数据分析

大数据之路Week08_day02 (Flume架构介绍和安装)

【大数据之Flume】八、Flume 数据流监控

大数据之flume（一） --- Flume介绍，Source、Channel、Sink，安装flume，配置和使用flume

[大数据] 搜索日志数据采集系统 flume+hbase+kafka架构（数据搜狗实验室）

19、大数据之Flume和Flume的安装部署

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)