在弄了四天之后终于实现了我的目的,想想挺简单的事情,哎
要处理的.txt如下,举例:文件夹lululu下面包含两个子文件夹,每个子文件夹里包含若干个.txt,每个.txt里有几个特征,我要做的是批量读取这些文本文档,并将这些txt写入到一个新的txt里,并且在每类特征后加入类标签,以便后续处理。
代码如下:
import glob import os import tensorflow as tf import numpy as np path='../../datasets/lululu' f ='../../datasets/file1.txt' def read_writeFile(path,f): cate=[path+'/'+x for x in os.listdir(path)] f2 = open(f, 'a+') for idx,folder in enumerate(cate): for im in glob.glob(folder+'/*.jpg.txt'): f1 = open(im, 'r') for eachLine in f1: f2.write(eachLine) f2.write(' '+str(idx+1)+'\n') f1.close() read_writeFile(path,f)
最后得到的.txt 如下。