Unicode类型是作为编码的基础类型,而gb2312,gdk,utf-8属于更高层次的类型
decode和encode是他们之间的转化函数
大致的过程如下
decode encode
str --> str(Unicode) --> str
decode()方法语法:
str.decode(encoding=‘UTF-8’,errors=‘strict’)
参数:
encoding – 要使用的编码,如"UTF-8"。
errors – 设置不同错误的处理方案。默认为 ‘strict’,意为编码错误引起一个UnicodeError。 其他可能得值有 ‘ignore’, ‘replace’, ‘xmlcharrefreplace’, ‘backslashreplace’ 以及通过 codecs.register_error() 注册的任何值。
返回值
该方法返回解码后的字符串。
encode()方法语法:
str.encode(encoding=‘UTF-8’,errors=‘strict’)
参数
encoding – 要使用的编码,如"UTF-8"。
errors – 设置不同错误的处理方案。默认为 ‘strict’,意为编码错误引起一个UnicodeError。 其他可能得值有 ‘ignore’, ‘replace’, ‘xmlcharrefreplace’, ‘backslashreplace’ 以及通过 codecs.register_error() 注册的任何值。
返回值
该方法返回编码后的字符串。