python进阶学习笔记:字符编码

标题字符编码

字符编码的前世今身

	 1.字符集概述:
	 	 一套文字符号及其编码的描述。
	 2.几个基本概念:
	 	 ❤位:计算机的最小单位 二进制中的一位, 用二进制的0/1表示。
	 	 ❤字节:八位组成一个字节。
	 	 ❤字符集:我们肉眼可见的文字与符号。
	 	 ❤编码:将字符转换成计算机可识别的0/1代码。
	 	 ❤解码:将计算机表示的0/1编码转换成肉眼可见的字符。
	 3.字符编码的起源;ASCII
	 4.字符编码的发展:百家争鸣
	 5.字符编码的现状:大一统的天下		 

Python中的字符编码:
☆☆☆解码方式和编码方式要相同,如果不同就会出现乱码,甚至于出现报错。

	 1.Python的字符串:
	 	 Python3的字符串默认支持多语言
	 	 对于单个字符的编码,Python提供了:(用的相对较少)
	 	 	①.ord()函数获取字符的整数表示------- 一次只接受一个字符
	 	 	②.chr()函数把编码转换为对应的字符----- 一次只接受一个字符,gbk是有范围的。
	 2.bytes和str
	 	str:一个字符对应若干个字节。
	 	如果要在网络上传输,或者保存到磁盘上,就需要把str变为以字节为单位的bytes。
	 	①.以Unicode表示的str通过encode()方法可以编码为指定的bytes
	 	②.从网络或磁盘上读取了字节流,读到的数据就是bytes,要把bytes变为str,就要用decode()方法
	 3.数据库查询操作
	 4.数据库更新操作
	 5.删除操作
print(ord('戏'))
print(ord('洗'))
print(ord('%'))
print(chr(25103))
print(chr(27927))
print(chr(37))

a = 'bc'
print(a.encode('ascii'))
b = '寻陈'
print(b.encode('gbk'))
print(b.encode('utf8'))
d = b'\xd1\xb0\xb3\xc2'
c = b'\xe5\xaf\xbb\xe9\x99\x88'
print(d.decode('gbk'))
print(c.decode('utf8'))

25103
27927
37
戏
洗
%
b'bc'
b'\xd1\xb0\xb3\xc2'
b'\xe5\xaf\xbb\xe9\x99\x88'
寻陈
寻陈
发布了35 篇原创文章 · 获赞 4 · 访问量 934

猜你喜欢

转载自blog.csdn.net/qq_44891948/article/details/99450990