四.字符编码

有引号引起来的是字符串 没有字符串的是变量

字符编码

支持中文的第一张表就叫 GB2312

1980年 gb2312 6700+汉字 1995年 gbk1.0 20000汉字 2000年 gb18030 27000汉字

最后联合国弄了个Unicode 万国码 适用于所有国家和地区的编码

2**16=65535 存一个字节,统一占用两个字符

UTF-8=unicode 的扩展集,可变长的字符编码集 西欧国家两个字节,东亚地区三个字节

assic-->gb2312-->gbk1.0-->gb18030

assic-->unicode-->utf-8/utf-16

python2.x默认编码ASSIC python3.x默认编码Unicode

unicode是向下兼容根本2312,gbk

#!-*- coding:utf-8 -*-或者写#coding:utf-8 在Python2.x 下写中文时

msg= u"我爱北京天安门?"

猜你喜欢

转载自www.cnblogs.com/101206-T/p/9426310.html