python利用大数据和管道分析操作系统日志 - 代码天地

python利用大数据和管道分析操作系统日志

编程语言 2018-05-10 04:07:01 阅读次数: 1

一代码

map代码

import os
import re
import time
def Map(sourceFile):
    if not os.path.exists(sourceFile):
        print(sourceFile, ' does not exist.')
        return    
    pattern = re.compile(r'[0-9]{1,2}/[0-9]{1,2}/[0-9]{4}')
    result = {}
    with open(sourceFile, 'r') as srcFile:
        for dataLine in srcFile:
            r = pattern.findall(dataLine)
            if r:
                print(r[0], ',', 1)
if __name__ == '__main__':
    Map('test.txt')

reduce代码

import os
import sys
def Reduce(targetFile):
    result = {}
    for line in sys.stdin:
        riqi, shuliang = line.strip().split(',')
        result[riqi] = result.get(riqi, 0)+1
    with open(targetFile, 'w') as fp:
        for k,v in result.items():
            fp.write(k + ':' + str(v) + '\n')
if __name__ == '__main__':
    Reduce('result.txt')

二运行结果

在命令行中运行下面的语句：

E:\python\python可以这样学\第11章大数据处理\code>python Hadoop_Map.py test.txt | python Hadoop_Reduce.py

07/10/2013 :4635

07/11/2013 :1

07/16/2013 :51

08/15/2013 :3958

10/09/2013 :733

12/11/2013 :564

02/12/2014 :4102

05/14/2014 :737

猜你喜欢

转载自cakin24.iteye.com/blog/2384913

python利用大数据和管道分析操作系统日志

python大数据分析操作系统日志

Python实现的大数据分析操作系统日志功能示例

利用Python进行数据分析——文件和操作系统

Linux操作系统日志分析-详解

大数据日志分析系统背景及架构

操作系统之进程通信——管道

springboot 利用aop实现系统日志和操作日志记录

【操作系统】日志管理

LAXCUS大数据操作系统节点挂掉后的处理

CDH大数据平台优化---操作系统优化

大数据Hadoop入门02——Linux操作系统概述

Python文件和操作系统基础

【Linux操作系统系列】日志和计划任务

3、操作系统——进程间通信（1）（无名管道（PIPE）和有名管道（FIFO））

Linux进程间通信(管道通信和共享存储区)---操作系统篇

操作系统实验二：线程和管道通信实验

重学操作系统----07 | 进程、重定向和管道指令：xargs 指令的作用是？

电商平台日志分析系统（大数据）

电商平台日志分析系统（大数据）下

python 操作系统

【操作系统原理】使用管道完成进程间通信（匿名管道pipe、命名管道fifo）

京东举办首届大数据峰会打造智能零售大数据“操作系统”

利用python实现OPT、FIFO、LRU、LFU、简单的和改进的CLOCK共六种页面置换算法，并对六种算法的过程和关系进行分析（操作系统课程设计）

boren -学习利用python分析大数据并画图

deqin -利用python进行疫情大数据分析

大数据学习——日志分析

Windows应急响应和系统加固(7)——Windows操作系统日志分析

操作系统文档分析

Ubuntu操作系统漏洞扫描和分析

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)