特殊字符和Unicode

特殊字符
>    >
<    &lt;
&    &amp;
"    &quot;
'    &apos;


实例:
1.<record time="3分28秒">
2.<record time="3'28"">
3.<record time="3'28&quot;">
4.<record time='3&apos;28"">

Unicode——世界上所有文字的编码
    www.unicode.org
    ISO10646UCS
    16位编码 66536

UTF-8、UTF-16
XMl规定所有的Parser必须支持UTF-8/UTF-16
0x00-0xFF = iso-8859-1

Unihan(统汉字——中日韩文字)

1Unit=2Bytes


Unicode之UTF-8
汉字位于第三部分
Office内码、java...
UTF-8网络传送、字数计算

特点:
1.汉字膨胀
2.西文不变

猜你喜欢

转载自1124117571.iteye.com/blog/2289301