字符编码与解码:
Unicode 默认都占两个字符,用ASCII码英文占一个字节,ASCII码不能存中文
Unicode 存放英文会浪费空间
utf-8 存放时因为是一个字节,中文三个字节
unicode -------->通过编码 encode 转换为其他编码
其他编码 ————> 解码decode 为 unicode
1 a = "时间煮雨" 2 print(a) 3 print(a.encode("utf-8")) 4 print(a.encode("utf-8").decode("utf-8")) 5 print(a.encode("utf-8").decode("utf-8").encode("gbk")) 6 print(a.encode("utf-8").decode("utf-8").encode("gbk").decode("gbk")) 7 8 9 ''' 10 时间煮雨 11 b'\xe6\x97\xb6\xe9\x97\xb4\xe7\x85\xae\xe9\x9b\xa8' 12 时间煮雨 13 b'\xca\xb1\xbc\xe4\xd6\xf3\xd3\xea' 14 时间煮雨 15 '''
python 3中系统默认编码是Unicode,并且使用encode编码后会变成 bytes类型,python3文件编码是utf-8 但python 3 中信息是unicode编码
可以通过-*- coding:gbk -*- 修改文件编码