用Python遍历文件夹下所有电子字典文件（不包括子文件夹）提取单词到一个文件 - 代码天地

用Python遍历文件夹下所有电子字典文件（不包括子文件夹）提取单词到一个文件

其他 2018-10-06 23:28:47 阅读次数: 0

经过若干天的尝试，最后凝炼出了这么一段代码，集几天研究之成果，可谓费尽心机。里面用到的成果包括：

1.with open...as

2.处理有乱码的文本

于是赶紧先写下来，做个阶段性成果。

import re
import os.path

p=re.compile(r"\b[a-z]{2,40}\s?\r\n")#单词（2-40个字母以内）单词后回车前可能有0或者1个空格，所以用了“\s?”
filedir=r"B"
filenames=os.listdir(filedir)
with open("allwords.txt","w") as f:
    for filename in filenames:
        filepath=filedir+"\\"+filename
        with open(filepath,"rb") as fr: #只能用“rb”，以二进制形式打开
            str=fr.read().decode("gbk","ignore")#解码，必须加上"ignore"，这里有大坑。
            words=re.findall(p,str)
            for word in words:
                f.write(word)

猜你喜欢

转载自blog.csdn.net/acflair/article/details/82919482

用Python遍历文件夹下所有电子字典文件（不包括子文件夹）提取单词到一个文件

Python计算一个文件夹下所有文件数量（包括子文件夹下的文件）

PHP遍历一个文件夹下所有文件和子文件夹的函数

php 能够遍历一个文件夹下的所有文件和子文件夹的函数

Python 实现把一个文件夹下所有的文件名和绝对路径（包括子文件夹）存入execl表格

批处理：把某个文件夹下的所有子文件夹内的文件拷贝到一个文件夹下

python删除某个文件夹下所有文件，包括子文件夹，实现文件夹内容清空。

BAT快速批量合并所有子文件夹下的txt文件到一个文件夹（文件夹txt内容合并）

python移动文件夹下所有文件到另一个文件夹

利用Python对一个文件夹下的所有子文件夹重命名代码

php 遍历一个文件夹下的所有文件和子文件

os.walk 将文件夹下的所有文件包括文件夹，保留原有的目录层级的复制在另外一个文件夹下

【面试题】写一个函数，能够遍历一个文件夹下的所有文件和子文件夹

写一个函数，能够遍历一个文件夹下的所有文件和子文件夹

写一个函数,PHP遍历一个文件夹下所有文件和子文件夹的函数D:\phpstudy\WWW\test

遍历一个文件夹下所有的文件和子文件夹、删除文件等os.walk

把一个盘下的文件夹(包括子文件夹)下的所有文件拷贝到另外一个盘(C#)

遍历一个文件夹,打印出该文件夹下所有的py文件

java 文件夹下所有文件快速拷贝到另外一个文件夹

java:把一个文件夹中的所有文件复制到指定文件夹下

BAT 遍历文件夹和子文件夹下所有文件

PHP遍历文件夹下的所有子文件夹及文件

Linux将一个文件夹或文件夹下的所有内容复制到另一个文件夹

用python遍历一个图片文件夹，并输出所有路径到一个 txt 文件 python 文件操作之open,read,write

复制当前目录所有文件夹及其子文件夹下的*.jpg文件到store文件夹下

python_统计文件夹下的所有文件夹数目、统计文件夹下所有文件数目、遍历文件夹下的文件

c# 删除一个文件夹下的所有空文件夹

【用python将文件夹下面的文件夹里面的文件全部提取出来，并且放到一个新的文件夹】

复制文件夹中的所有文件夹与文件到另一个文件夹

关于一个文件夹下的所有文件及文件夹复制到另外一个文件夹，用java -jar 方法打开的总结

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)