根基简介
Unicode:一种合计机字符编码。也称“不同码”“万国码”“Unicode码”
Unicode惟独一个字符集,中、日、韩的三种翰墨占用了Unicode中0x3000到0x9FFF的部份 Unicode当初普遍接管的是UCS-2,它用两个字节来编码一个字符, 好比汉字"经"的编码是0x7ECF,留意字符编码艰深用十六进制来 展现,为了与十进制分说,十六进制以0x收尾,0x7ECF转换成十进制 便是32463,UCS-2用两个字节来编码字符,两个字节便是16位二进制, 2的16次方即是65536,以是UCS-2至多能编码65536个字符。 编码从0到127的字符与ASCII编码的字符同样,好比字母"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编码是0x61,十进制也是97,对于汉字的编码,事实上Unicode对于汉字反对于不奈何样好,这也是没措施的, 简体以及繁体总共有六七万个汉字,而UCS-2至多能展现65536个,才六万 多个,以是Unicode只能清扫一些简直不用的汉字,幸好罕用的简体汉字也不外七千多个,为了能展现所有汉字,Unicode也有UCS-4尺度,便是用 4个字节来编码字符。