小知识:
python2在编译安装时,可以通过参数 --enable-unicode=ucs2 或 --enable-unicode=ucs4 分别用于指定使用2个字节、4个字节表示一个unicode字符;python3无法进行选择,默认使用ucs4。
查看当前python中表示unicode字符串时占用的空间:
import sys print(sys.maxunicode) # 如果值是 65535,则表示使用ucs2标准,即:2个字节表示 # 如果值是1114111,则表示使用ucs4标准,即:4个字节表示
print(sys.maxunicode)