版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/meiqi0538/article/details/87989471
程序背景
编码一直是程序员困扰的问题,如何使用python将gbk编码的文件转为utf8编码?其实也不难,主要使用python中的一个包(自带):codecs。相对于其他编程语言来说,这个是相当便捷的,当然你也可以使用记事板,notepad++受动修改编码。废话不多说,下面就是代码实现。
代码实现
import os
import codecs
import sys
def main(file1, file2 ):
"""将gbk编码的文件转为utf8编码的文件
:param file1: gbk编码的文件
:param file2: utf8编码的文件
:return:
"""
# 读取原文
with open(file1, "r", encoding="gbk") as f:
results = f.readlines()
# 开始遍历读取结果,并写到新的文件中
with codecs.open(file2, "w", encoding="utf-8") as f:
for result in results:
f.write(result)
print("转码成功!转码后文件为:", file2)
if __name__ == '__main__':
param = sys.argv # 获取控制台
if len(param) == 3:
src_file = param[1]
dest_file = param[2]
elif len(param) == 1:
src_file = "1998-01-2003版-带音.txt"
dest_file = "utf8_1998-01-2003版-带音.txt"
else:
print("文件无效")
sys.exit()
main(src_file, dest_file)
原文及个人博客
其原文为:【python】将gbk编码的文件转为Unicode编码
原文在发表在我个人的博客网站上,该博客网站是基于node.js + hexo + md + github等技术完成。