需求:给你一个指定的文件夹路径,让你得到该路径下的所有文件,在这里我是用递归去实现的。
方法1:递归操作,代码可读性强,但是效率太慢
直接上代码:
import os
def list_dir(text_list,dir_path):
dir_files = os.listdir(dir_path) # 得到该文件夹下所有的文件
for file in dir_files:
file_path = os.path.join(dir_path, file) # 路径拼接成绝对路径
if os.path.isfile(file_path): # 如果是文件,就打印这个文件路径
if file_path.endswith(".txt"):
text_list.append(file_path)
if os.path.isdir(file_path): # 如果目录,就递归子目录
list_dir(text_list,file_path)
return text_list
if __name__ == '__main__':
all_txt = []
thesaurus_path = r"C:\Users\Lenovo\Desktop\AiShu\AiShuWork\腾讯手机采集41人标注\腾讯采集35人-文本"
text_list = list_dir(all_txt,thesaurus_path)
for text in text_list:
print(text)
运行结果:
C:\Users\Lenovo\Desktop\AiShu\AiShuWork\腾讯手机采集41人标注\腾讯采集35人-文本\TX_35ren_cj_CH_1_1105\SPK0014.txt
C:\Users\Lenovo\Desktop\AiShu\AiShuWork\腾讯手机采集41人标注\腾讯采集35人-文本\TX_35ren_cj_CH_1_1105\SPK0015.txt
C:\Users\Lenovo\Desktop\AiShu\AiShuWork\腾讯手机采集41人标注\腾讯采集35人-文本\TX_35ren_cj_CH_1_1105\SPK0016.txt
C:\Users\Lenovo\Desktop\AiShu\AiShuWork\腾讯手机采集41人标注\腾讯采集35人-文本\TX_35ren_cj_CH_1_1105\SPK0017.txt
C:\Users\Lenovo\Desktop\AiShu\AiShuWork\腾讯手机采集41人标注\腾讯采集35人-文本\TX_35ren_cj_CH_1_1105\SPK0018.txt
C:\Users\Lenovo\Desktop\AiShu\AiShuWork\腾讯手机采集41人标注\腾讯采集35人-文本\TX_35ren_cj_CH_1_1105\SPK0019.txt
C:\Users\Lenovo\Desktop\AiShu\AiShuWork\腾讯手机采集41人标注\腾讯采集35人-文本\TX_35ren_cj_CH_1_1105\SPK0020.txt
方法2:使用os.walk()方法,速度快(推荐使用)
上代码:
import os
#遍历所有文件夹下的文件
def walk_files(path,endpoint=None):
file_list = []
for root,dirs,files in os.walk(path):
for file in files:
file_path = os.path.join(root,file)
if file_path.endswith(endpoint):
file_list.append(file_path)
return file_list
if __name__ == '__main__':
wav_path = r"文件夹路径"
text_list = walk_files(wav_path, endpoint=".txt")
print(text_list)