搞清楚字符编码5-万国码[1]

万国码的基本知识点

  • 万国码是由国际标准组织统一码联盟共同制定的.
  • 万国码有两个版本,第一个版本的最大编码长度是2个字节,第二个版本的最大编码长度是4个字节.

万国码的实现

  • 万国码的实现分为两个层次:理论编码实际存储编码
    • 理论编码就是抛开计算机不管,通过数据计算得出的编码.
    • 实际存储编码就是实际在计算机中存储的编码.
  • 理论编码实际存储编码并不相同,这也是万国码比其他编码难理解的原因之一.
  • 万国码的理论编码方案有ucs2ucs4两种。
    • ucs2就是第一版万国码
    • ucs4就是第二版万国码
    • 这两种方案目前都在使用,且ucs4兼容ucs2
  • 实际存储编码方案
    • ucs2ucs-2utf-8
    • ucs4utf-8utf-16utf-32

猜你喜欢

转载自blog.csdn.net/Sacredness/article/details/90643366