包含标签 计算机编码 articles

unicode和utf8编码

兼容问题 由于ASCII存在字符含量过少的缺陷,所以不但我国自己搞出了国际码。其他国家也都设计出了符合自己国情的字符集 但是这就带来了问题 各个字符集之间不兼容怎么办? Unicode Unicode 4个字节32位 真正有效范围: 0x0 – 0x 10ffff 约十进制:1114112 个字符 unicode相当于 “区位码”(也就是电脑中运行……

Continue reading

GB2312原文到GB2312机内码

GB2312原文到GB2312机内码 ANSCII 汉字编码国家标准 区位码 01-09区 为特殊字符区 10-15区 为自定义区 16-87区 为汉字编码区 兼容演变: 1. 区位码标准中没有定义控制字符 解决方案: 将整个区位码向后移动32位(具体表现为每一字节都加上0x20)得到GB2312原码(国标码) 2. 原版A……

Continue reading

进制和内存

数据宽度 因为计算机受硬件制约,数据都是有长度限制的(数据宽度),超过最多宽度的数据会被丢弃 计算机中常见的数据宽度: 位(BIT) -> 一个0或1 字节(BYTE) =8位 范围 0-> FF 字(Word) = 16位 0->FFFF 双字(DoubleWord) = 32位 0-FFFFFFFF 超过范围的数会被丢弃 有符号数和无符号数 有符号数还是……

Continue reading