python file tell()函数在windows与mac上的差异

一、file tell( )方法

tell( )方法返回文件的游位置,即文件指当前位置。

二、遇到的问题

在使用中发现:同样的.txt文件内容和.py文件,在Mac上和windows上运行的结果不同,即tell( )返回的结果不一致

测试文件内容如下: 

good evening!
ryroad2
12

测试代码如下:

with open("file.txt", "r", encoding="utf-8") as fp:
    print(fp.tell())
    print(fp.readline())
    print(fp.tell())
    print(fp.readline())
    print(fp.tell())

在windows上运行结果如下:

在mac上运行结果如下:

三、问题的原因

为了弄清楚为什么tell( )方法在windows与mac上返回的结果不一致,我们分别在windows和mac上运行如下代码:

import os
os.linesep
len(os.linesep)

windows运行结果:

mac运行结果:

Tips:os.linesep返回当前平台使用的行终止符。如上图所示,Windows使用'\r\n'Mac使用'\n'官网解释为“The string used to separate (or, rather, terminate) lines on the current platform. ”

综上所述,tell( )方法在windowsmac上返回的果不一致的原因是:

在windows平台上,文件第一行“good evening!"其实等于"good evening!\r\n",共15个字符,而tell( )是从0开始计算的,所以在读取完第一行后,游标指向文件第二行的首个字符"r",所以返回15。

在mac平台上,文件第一行“good evening!"其实等于"good evening!\n",共14个字符,所以返回14。

四、展内容

微软的自带记事本程序notepad.exe会给UTF-8编码的文件头加入三个隐藏的字节(即BOM)。就是为了让编辑器不去猜测文件本身是ASCII码还是UTF-8。

所以会出现以下情况:

tell()返回18,由正常的15+3BOM节组成。可使用notepad++编辑,将文件保存为utf-8 without BOM,即可解决此问题。

 

猜你喜欢

转载自blog.csdn.net/qq_22895113/article/details/81747067