windows记事本另存为utf-8编码会在文件开头加上EF BB BF三个字节.即BOM
我在linux下从文本文件读取utf8转为GBK时,发现第一行转换永远错误,从第二行开始则全部成功.
所以希望如果不确定文本文件是否为windows记事本编辑,需要在程序中加上判断文件头三个字节的逻辑,避免bug.
如果需要编辑utf8编码的文件,建议使用其他软件.
windows记事本另存为utf-8编码会在文件开头加上EF BB BF三个字节.即BOM
我在linux下从文本文件读取utf8转为GBK时,发现第一行转换永远错误,从第二行开始则全部成功.
所以希望如果不确定文本文件是否为windows记事本编辑,需要在程序中加上判断文件头三个字节的逻辑,避免bug.
如果需要编辑utf8编码的文件,建议使用其他软件.