原来爬出来的文章没有换行,在每个段落后增加\n,结果出来两个\n,因为字符换行的不同,需要使用\r\n来在windows下显示,比如:
title=html.xpath('//h1/text()')[0]
contents=html.xpath('//*[@id="content"]/text()')
content=''
for i in contents:
content=content+i.strip()+'\r\n'
save_novel(title,content)
实际结果如下:
但由于离京都的距离太过遥远,所以真正留下来的官员并不多,勉强能算得上的,应该是城西那家院子里的老太太。
听说老太太是京城里司南伯爵的母亲,选择来这里养老。城里的居民们都知道司南伯爵似乎很受皇帝陛下的赏识,一直没有依照法例外派,而是留在京城的财政部里做事,所以大都对那个院子表示了足够的礼貌和敬畏。
但小孩子是不懂这些的。