汉字区位码是采用一种科学可行的办法,为每个汉字编一个的代码,以便计算机辨认、接收和处理。
计算机中汉字区位码 汉字区位码是什么进制
计算机中汉字区位码 汉字区位码是什么进制
相关介绍:
所谓汉字编码,就是采用一种科学可行的办法,为每个汉字编一个的代码,以便计算机辨认、接收和处理。在此介绍的是《标准信息交换汉字编码》。这种编码经过加工整理一律以汉语拼音的字母为序,音节相同的字以使用频率为序,其查找方法与一般汉语字典的汉字拼音音节索引查找法相同。
为了使每一个汉字有一个全国统一的代码,1980年,我国颁布了个汉字编码的标准: GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。
由于国标码是四位十六进制,为了便于交流,大家常用的是四位十进制的区位码。所有的国标汉字与符号组成一个94×94的矩阵。在此方阵中,每一行称为一个"区",每一列称为一个"位",因此,这个方阵实际上组成了一个有94个区(区号分别为1到94)、每个区内有94个位(位号分别为1到94)的汉字字符集。
一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的"区位码"。在汉字的区位码中,高两位为区号,低两位为位号。 在区位码中,01-09区为682个特殊字符,16~87区为汉字区,包含6763个汉字 。
其中16-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。
所以,当我们需要n个任意汉字时,我们不必建一个全部汉字表,而是利用区位码实现常用汉字的提取。
汉字区位码是为每个汉字编一个的代码,以便计算机辨认、接收和处理。
码=区位码+2020H,汉字机内码=码+8080H。首先将区位码转换成码,然后将码加上8080H,即得机内码。
汉字区位码在上世纪七八十年代起到了很大的作用,解决了六千多个汉字在DOS作系统的汉字输入问题。现在,特别是2013年8月19日颁布实施8105个通用规范汉字之后,便不再被人们使用。
相关信息
为了使每一个汉字有一个全国统一的代码,1980年,我国颁布了个汉字编码的标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。由于国标码是四位十六进制,为了便于交流,大家常用的是四位十进制的区位码。
区位码与国标码转换步骤如下:
1、区码与位码分别转换成十六进制数表示。
2、区位码的十六进制表示+2020H=国标码。
以具字为例,具字的区位码为:3063。
1、将30转换成16进制表示为:1E,63转换成16进制表示为:3F,区位码十六进制数表示为:1E3FH。
2、1E3FH+2020H=3E5FH。
所以具字的国标码为:3E5FH。
具体说明
通常,在DOS下的各汉字系统中,同时按Alt键和F1键即可调用区位码输入方法。而在Windows中常用Ctrl+空格键和Ctrl+Shift键调出区位码。
如“2901”代表“健”字,“4582”代表“万”字,“8150”代表“楮”字,这些都是汉字,用区位码还可以很轻松地输入特殊符号,比如,“0189”代表“※”(符号),“0528”代表“ゼ”(日本语),“0711”代表“Й”(俄文),“0949”代表“┭”(制表符)。
已知汉字“中”的区位码是5448,则其国标码是:5650H
区位码转国标码分为两步:①分别将区号、位号转换成十六进制数;②分别将区号、位号各+20H(区位码+2020H=国标码)。本题中区号54转换成十六进制为36,位号48转换成十六进制为30。分别+20H,即得5650H。
汉字“中”的区位码是 5448。
“中”的国标码是 5650H。
“中”的机内码是 D6D0H。
----------------------
总结:
区位码,十进制的,这是最基本的编码。
国标码 = 区位码 + 2020H ;这是标准,但是不好用。
机内码 = 国标码 + 8080H ;这才是在计算机中实用的编码。
= 区位码 + A0A0H 。
以上计算,都要用十六进制进行。
机内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。
输入码是指用户从键盘上键入汉字时所使用的汉字编码。如输入码:区位码等,拼音编码:全拼、双拼、自然码等,字形编码:五笔、表形码等。
处理码是英文信息处理的标准编码,是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。
字形码是点阵代码的一种。是为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,得到的相应的点阵代码。
区位码是一个四位的十进制数,每个区位码都对应着一个的汉字或符号,它的前两位叫做区码,后两位叫做位码。
扩展资料:
由于历史、地区原因,有时一种文字会出现多种编码方案,特别是汉字。由于不同于系统内码的字符不能在该系统中正常显示,必须要进行字符的内码转换,即将非系统内码的字符转换为系统可以识别的内码字符。
在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列), 在区位码汉字输入方法中,汉字编码无重码。
在熟练掌握汉字的区位码后,录入汉字的速度是很快的,但若想记忆住全部区位码是相当困难的,常使用于录入特殊符号,如制表符、希腊字母等。
汉字区位码分别用十进制的区号和位号范围是区位码的区号是1-94,位号是1-94。一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的"区位码"。在汉字的区位码中,高两位为区号,低两位为位号。
在区位码中,01-09区为682个特殊字符,16~87区为汉字区,包含6763个汉字 。其中16-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。
所谓汉字编码,就是采用一种科学可行的办法,为每个汉字编一个的代码,以便计算机辨认、接收和处理。在此介绍的是《标准信息交换汉字编码》。
这种编码经过加工整理一律以汉语拼音的字母为序,音节相同的字以使用频率为序,其查找方法与一般汉语字典的汉字拼音音节索引查找法相同。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 836084111@qq.com 举报,一经查实,本站将立刻删除。