编码是为了在数据传输的过程中节省数据存储空间,可以节省带宽,加快传输速度。
UTF-8:英文一个字节,中文3个字节。它可以使用1~4个字节表示一个符号
GBK:英文两个字节,中文2个字节。
UTF-8 是 Unicode 的实现方式之一。
我们已经知道,英文字母只用一个字节表示就够了,如果 Unicode 统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有二到三个字节是0
,这对于存储来说是极大的浪费,文本文件的大小会因此大出二三倍,这是无法接受的。
编码是为了在数据传输的过程中节省数据存储空间,可以节省带宽,加快传输速度。
UTF-8:英文一个字节,中文3个字节。它可以使用1~4个字节表示一个符号
GBK:英文两个字节,中文2个字节。
UTF-8 是 Unicode 的实现方式之一。
我们已经知道,英文字母只用一个字节表示就够了,如果 Unicode 统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有二到三个字节是0
,这对于存储来说是极大的浪费,文本文件的大小会因此大出二三倍,这是无法接受的。