字符集编码简单介绍

字符集编码

1. ASCII

image-20221026210843484

ASCII:美国信息交换标准代码,包括了英文、符号等。

标准ASCII使用1个字节存储一个字符,首尾是0,总共可表示128个字符。

2. GBK

GBK:汉字内码扩展规范、国标

汉字编码字符集包括了2万多个汉字等字符,GBK中一个中文字符编码成两个字节的形式存储。

注意:GBK兼容了ASCII字符集。

GBK规定:汉字的第一个字节的第一位必须是1

image-20221026211345739

3. UTF-8

Unicode字符集(统一码,也叫万国码)

  • Unicode是国际组织制定的,可以容纳世界上所有文字、符号的字符集。

UTF-32:用4个字节表示一个字符。缺点:占存储空间,通信效率变低。

UTF-8

  • 是Unicode字符集的一种编码方案,共分四个长度区:1个字节,2个字节,3个字节,4个字节

  • 英文字符、数字等只占1个字节(兼容标准ASCII编码),汉字字符占用3个字节。

image-20221026212131089

image-20221026212204798

重点:

image-20221026212258029

image-20221026212318452

猜你喜欢

转载自blog.csdn.net/m0_52781902/article/details/127541154