版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_23013309/article/details/89875731
字符编码
在计算机中只能处理0和1的这两个数字的数字串,为了能使用计算机处理非数字问题。科学家设计出了字符编码,它是字符映射在计算机中的数字串,不同的编码方式其数字串的长度不一样,长度越长能被编码的字符越多。
ASCII
这是由美国人设计的编码方案,它有7位,可以编码全部的美国相关字符
GBK, ISO, Unicode, UTF-8, ...
随着计算机在全世界的普及,ASCII编码已不能满足需求,因此各国出现了自己的本土编码方案,好把自己国家的文字字符使用计算机来处理,但全世界的编码方案太多不利用相关软件,文档的移植,因此出现了Unicode编码,Unicode编码容纳了各种编码方案
各种编码有如下包含关系
ASCII<GBK,ISO,UTF-8...<Unicode
各种编码都是兼容ASCII码的
两个概念
1.存储编码
2.显示编码(你要使用的编码)
如果存储编码与要显示的编码不一致时,就需要转码,否则就会显示出乱码!!!
扫描二维码关注公众号,回复:
6154834 查看本文章
这是乱码出现的根本原因
在python3中的存储编码是Unicode
如果要使用其他编码时的转换关系如下