关于排版txt文件的小程序

关于排版txt文件的小程序

因为需要,下载了一个txt文件,但排版实在是太乱,用新学的python进行一番整理,现把代码分享如下:

#coding=gbk
filename = '西游记——白话文版.txt' 
line1="    "
with open(filename,'r',encoding='UTF-8') as file_object: 
	lines = file_object.readlines() 
for line in lines:  #lines[0:10]:
	line=line.strip()
	#print(line.strip())
	if len(line)==0:
		pass
	else:
		if line[-1:]=="。" or line[-1:]=="”" :
			line=line+"\n    "
			#print (line[-4:-1],"***",line[-4:-1],"***")
		if line[0]=="”": 
			if line1[-4:-1]=="    "[-4:-1]:
				line1=line1[:-5]+"”\n    "
				
			else:
				line1=line1+"”"
			line=line[1:]
		line1=line1+line
#print(line1)


filename1 = '西游记——白话文版1.txt' 
with open(filename1,'w',encoding='UTF-8') as file_object: 
	file_object.write(line1) 
# for line in lines: 
	# print(line.rstrip())



总体上是这样判断,如果行尾有。” 这两个字符,认为是一行的结尾。加换行,加行首空格。
如果行首有”字符,则认为要把”连接到上一行。

几个注意的地方:
1、行首、行尾的判断要分别进行,缩进要注意是判断哪个的。
2、字符串的截取要准确,但没弄明白,加了"\n “的字符串,截取后四个为” “的怎么也不认,没有办法,弄个” "[-4:-1],这样可以了。
3、文件的读写格式。

发布了7 篇原创文章 · 获赞 0 · 访问量 221

猜你喜欢

转载自blog.csdn.net/weixin_45903952/article/details/104070683