python编写脚本读取文件夹下的所有数据并从中提取关键字数据 - 代码天地

python编写脚本读取文件夹下的所有数据并从中提取关键字数据

其他 2021-01-28 05:15:14 阅读次数: 0

报错1：

UnicodeDecodeError: 'mbcs' codec can't decode byte 0xfc in position 3094: No mapping for the Unicode character exists in the target code page.
# 原因：
# 编码不对

1.需求场景
\capture_info文件夹下有这么多文件，需要所有文本中提取出ip字段
在这里插入图片描述

2.代码示例

def test_data2():
    # 1.从文件中读取数据
    # 2.从文件中去提取ip
    path = file_path  # 文件夹目录 将路径设置为变量参数
    files = os.listdir(path)  # 得到文件夹下的所有文件名称
    txt_list = []  # 定义空列表来存储

    for file in files:  # 遍历文件夹
        position = path + '\\' + file  # 构造绝对路径，"\\"，其中一个'\'为转义符
        print(position)
        with open(position, mode='r', encoding='utf-8') as f:  # 打开文件 #注意编码格式
            date = f.read()  # 读取文件
            txt_list.append(date)  # 添加到数组中
    txt_list = ','.join(txt_list)  # 转化为非数组类型
    # print(type(txt_list))
    # print(txt_list)

    # 提取ip
    ips = re.findall(r"@ijiami_ip:(.+?)@jvm_stack_start", txt_list)
    print(ips)   # 返回一个数组

    # 统计ip出现次数
    ip_num = Counter(ips)
    print(ip_num)

    # 将结果输出到一个txt中
    mylog = open('E:\\mycode\\result_num1.txt', mode='a', encoding='utf-8')
    print(ip_num, file=mylog)
    print(domain_num, file=mylog)
    print('\n')
    mylog.close()
# 运行结果：
Counter({
    
    '113.96.232.29:80': 31, '39.103.130.125:443': 2, '110.185.186.35:443': 2, '203.209.230.17:443': 1, '42.120.158.121:80': 1........

猜你喜欢

转载自blog.csdn.net/u014150715/article/details/109468762

python编写脚本读取文件夹下的所有数据并从中提取关键字数据

python读取文件夹下所有文件并进行内容提取

Python—提取文件夹下所有文件

读取文件中的所有数据

Python读取文件夹下所有csv文件并将数据按文件名写入字典

python 读取文件夹下所有文件名

【代码 | 数据读取】多层文件夹下jpg提取汇总

python读取文件夹下所有图片

python中，读取文件夹下的所有图片

C#读取文件夹下所有指定类型，并返回相应类型数据

python批量修改指定文件夹下所有文件指定位置的数据

JAVA android 获取assets文件夹中的properties文件并从中获取数据

Linux下C/C++读取文件夹下所有文件数据到一个文件中

java读取xlsx文件的所有数据

fstream读取文件所有数据(tellg()\seekg())

【Matlab】如何读取文件夹下所有txt数据进行处理并以txt结果更名输出

QT 读取文件夹下所有文件

java读取某个文件夹下的所有文件

Matlab 读取文件夹下所有文件(*.mat *.txt等)

c++读取文件夹下所有文件

读取指定文件夹下所有文件名

opencv读取文件夹下所有文件

Linux C 读取文件夹下所有文件

实现读取文件夹下所有文件

hadoop javaapi读取文件夹下的数据

python脚本——根据某文件夹下所有文件名实现文件的复制

python 读取文件夹下的所有文件并处理重新分类写入

读取文件夹下所有文件路径（python和matlab）

shell脚本遍历文件夹下所有文件

shell脚本-获取文件夹下所有文件

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)