Python乱码解决以及sys编码格式

1. Python中文乱码解决

① 错误:SyntaxError: Non-ASCII character '\xe9' in file

② 解决:加上# -*- coding: utf-8 -*-,代码如下:

# -*- coding: utf-8 -*-
print '中文乱码'

2. 修改系统模块(sys)的编码格式

2.1. 方式一:

# -*- coding: utf-8 -*-
#导入系统模块库
import sys
#重新加载系统环境,必须初始化,否则无法设置字符集
reload(sys)
#初始化运行环境为UTF-8,否则姓名中文输出报错
sys.setdefaultencoding('utf-8')
#输出系统编码格式
print sys.getdefaultencoding()

那么为什么要重新加载,而直接引用过来则不能调用该函数呢?

因为setdefaultencoding函数在被系统调用后被删除了,所以通过import引用进来时其实已经没有了,

所以必须reload一次sys模块,这样setdefaultencoding才会为可用,才能在代码里修改解释器当前的字符编码。

在python安装目录的Lib文件夹下,有一个叫site.py的文件,

在里面可以找到main() --> setencoding()-->sys.setdefaultencoding(encoding),

因为这个site.py每次启动python解释器时会自动加载,

所以main函数每次都会被执行,setdefaultencoding函数一出来就已经被删除了

源码如下:

2.2. 方式二

① 可以在Python安装目录下的Lib/site-packages目录中,新建一个sitecustomize.py文件(建在这里,每次启动Python的时候设置将自动生效),内容如下:

import sys

sys.setdefaultencoding('utf-8') #set default encoding to utf-8

② 再直接执行以下代码

# -*- coding: utf-8 -*-
#导入系统模块库
import sys
#输出系统编码格式
print sys.getdefaultencoding()

备注:第二部分修改系统模块的编码格式的一系列设置并不是必需的,只在文件头加上# -*- coding: utf-8 -*-,不对sys进行setdefaultencoding 也不会出现乱码情况,只是为了更加熟悉sys模块。


--------------------- 
作者:May_mm 
来源:CSDN 
原文:https://blog.csdn.net/May_mm/article/details/78266561 
版权声明:本文为博主原创文章,转载请附上博文链接!

猜你喜欢

转载自blog.csdn.net/yetugeng/article/details/84836722