易码技术论坛

 找回密码
 加入易码
搜索
查看: 174948|回复: 8

[半个灌水]汉字的编码

[复制链接]
发表于 2005-1-12 16:22:00 | 显示全部楼层
好乱阿~这个东西技术性很强啊
发表于 2005-1-12 20:25:00 | 显示全部楼层
勉强看懂~
发表于 2005-1-12 20:44:00 | 显示全部楼层
可以到维基百科里 查查"中文信息处理"
http://zh.wikipedia.org/wiki/%E4%B8%AD%E6%96%87%E4%BF%A1%E6%81%AF%E5%A4%84%E7%90%86
发表于 2005-1-12 20:48:00 | 显示全部楼层
GB2312维基百科,自由的百科全书GB2312GB2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集--基本集》,由中国国家标准总局发布,1981年5月1日实施。GB2312编码通行于大陆;新加坡等地也采用此编码。几乎所有的中文系统和国际化的软件都支持GB2312。
GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄罗斯语西里尔字母在内的682个全形字符。
GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖99.75%的使用频率。
对于人名、古汉语等方面出现的罕用字,GB2312不能处理,这导致了后来GBK及GB18030汉字字符集的出现。
[编辑]
分区表示GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。
01-09区为特殊符号。 16-55区为一级汉字,按拼音排序。 56-87区为二级汉字,按部首/笔画排序。 10-15区及88-94区则未有编码。
举例来说,“啊”字是GB2312之中的第一个汉字,它的区位码就是1601。
[编辑]字节结构在使用GB2312的程序中,通常采用EUC储存方法,以便兼容于ASCII。
每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”,第二个字节称为“低位字节”。
“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。
例如“啊”字在大多数程序中,会以0xB0A1储存。(与区位码对比:0xB0=0xA0+16,0xA1=0xA0+1)。
[编辑]参见后续国家字符集标准:GBK、GB18030 同一时期的繁体字标准:Big5、国家标准中文交换码(CNS 11643)、CCCII、香港增补字符集(HKSCS) Unicode

来自“http://zh.wikipedia.org/wiki/GB2312”页面分类: 中文信息处理 | 字符集
发表于 2005-1-13 14:07:00 | 显示全部楼层
这还算灌水啊。。。。。

那我发的那个就可是0.25个灌水了!!!

2912_424_1253.rar

85 KB, 下载次数: 211

发表于 2005-1-13 19:07:00 | 显示全部楼层
通俗一点说,应该会比较方便大家理解:
高考或者其他一些正规考试的报考表,都得填上自己姓名的编号,这个编号就是区位码。
把这个编号前两位和后两位分开,然后分别加上160,就是对应的汉字在计算机里的GB编码。
例如:区位码 1234 转成 机器码就是 B2C4
发表于 2005-1-13 20:42:00 | 显示全部楼层
我们考GBK编码
 楼主| 发表于 2005-1-14 23:35:00 | 显示全部楼层
嘿嘿
我1错别字多
2我语文真 d不好
有劳大家浪费脑细胞拉^_^
 楼主| 发表于 2005-1-11 22:17:50 | 显示全部楼层 |阅读模式
一个汉字在计算机中占用2字节

这大家都知道

汉字的编码:中国统一使用普通话编码即国标码:GB2312-80

在计算机中存储的是机器码:M-CODE

在我门考试中常提到的是:区位码

区位码分两个部分:区码和位码

机器码和GB2312有两部分:第一字节和第二字节(具体名称记不住了)

他们之间有简单的关系:

我门设他们的编码第一位为A第二位为B

那么:

A机器码=A国标码+128=A区位码+160

B机器码=B国标码+128=B区位码+160

这样我们就可以在WQX上编一个显示区位码的程序

因为对编程没什么用,但有跟大家的考试挂上点勾(大家考试一般都添卡吧!要是万一忘记了自己姓名的区位码,可以用这个方法来查一下),所以算半个灌水


[此贴子已经被作者于2005-1-11 22:23:29编辑过]

您需要登录后才可以回帖 登录 | 加入易码

本版积分规则

Archiver|手机版|小黑屋|EMAX Studio

GMT+8, 2024-3-29 14:57 , Processed in 0.012191 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表