汉字的编码 1.汉字信息的交换码 汉字信息交换码简称交换码,也叫国标码。规定了7 445个字符编码,其中有682个非汉字图形符和6763个汉字的代码。有一级常用字3 755个,二级常用字3 008个。两个字节存储一个国标码。国标码的编码范围?121 H一7E7EH。区位码和国标码之间的转换方法是将一个汉字的十进制区号和十进制位号分别转换成十六进制数,然后再分别加上20H,就成为此汉字的国标码: 汉字国标码=区号(十六进制数)+20H位号(十六进制数)+ 20H 而得到汉字的国标码之后,我们就可以使用以下公式计算汉字的机内码: 汉字机内码=汉字国标码+8080H 2.汉字偷入码 汉字输人码也叫外码,都是由键盘上的字符和数字组成的。目前流行的编码方案有全拼输人法、双拼输入法、自然码输人法和五笔输人法等。 3.汉字内码 汉字内码是在计算机内部对汉字进行存储、处理的汉字代码,它应能满足存储、处理和传输的要求。一个汉字输人计算机后就转换为内码。内码需要两个字节存储,每个字节以最高位置‘1”作为内码的标识。 4.汉字字型码 汉字字型码也叫字模或汉字输出码。在计算机中,8个二进制位组成一个字节,它是度量空间的基本单可见一个16 x 16点阵的字型码需要16 x 16/8=32字节存储空间。 汉字字型通常分为通用型和精密型两类。 5.汉字地址码 汉字地址码是指汉字库中存储汉字字型信息的逻辑地址码。它与汉字内码有着简单的对应关系,以简化内码到地址码的转换。 6.各种汉字代码之间的关系 汉字的输人、处理和输出的过程,实际上是汉字的各种代码之间的转换过程。如图1- 1表示了这些汉字代码在汉字信息处理系统中的位置及它们之间的关系.
相关资料
|