windows 记事本utf8编码BOM头问题

windows记事本另存为utf-8编码会在文件开头加上EF BB BF三个字节.即BOM

我在linux下从文本文件读取utf8转为GBK时,发现第一行转换永远错误,从第二行开始则全部成功.

所以希望如果不确定文本文件是否为windows记事本编辑,需要在程序中加上判断文件头三个字节的逻辑,避免bug.

如果需要编辑utf8编码的文件,建议使用其他软件.

猜你喜欢

转载自my.oschina.net/u/257448/blog/1550394