unicode和utf8编码

兼容问题由于ASCII存在字符含量过少的缺陷,所以不但我国自己搞出了国际码。其他国家也都设计出了符合自己国情的字符集但是这就带来了问题各个字符集之间不兼容怎么办?UnicodeUnicode 4个字节32位真正有效范围: 0x0 – 0x 10ffff约十进制:1114112 个字符unicode相


GB2312原文到GB2312机内码

GB2312原文到GB2312机内码ANSCII汉字编码国家标准区位码01-09区 为特殊字符区10-15区 为自定义区16-87区 为汉字编码区兼容演变:1. 区位码标准中没有定义控制字符 解决方案: 将整个区位码向后移动32位(具体表现为每一字节都加上0x20)得到GB2312原码(


进制和内存

数据宽度因为计算机受硬件制约,数据都是有长度限制的(数据宽度),超过最多宽度的数据会被丢弃计算机中常见的数据宽度:位(BIT) -> 一个0或1字节(BYTE) =8位 范围 0-> FF字(Word) = 16位 0->FFFF双字(DoubleWord) = 32位 0-FFF