如何给一个汉字编码?

作者&投稿:拱斩 (若有异议请与网页底部的电邮联系)
汉字的记忆编码怎么弄~

记忆的能力对任何人来讲,都是一件非常重要的事情,特别是对于孩子、对于学生来讲,他们有更多更直接的记忆需求。为了更好的记忆,我们每个人都应该也都可以掌握一套属于自己的记忆编码,让记忆变成一件简单的事情。

以汉字“王”来举例:
拼音输入法通过输入码wang搜索码表找到"王"的Unicode编码,显示在候选栏中,输入法运行在内存中,候选栏也是,输入法调用操作系统的字符显示程序,按照编码根据系统字体的调用顺序选择对应的字体。
在矢量字体中找到王的字形,再以图形编码的形式输出到显卡,再由显卡把整个屏幕的图像以点阵形式传到显示器,字也就显示在屏幕上了。

介绍
编码是信息从一种形式或格式转换为另一种形式的过程,也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。
编码在电子计算机、电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码,是编码的逆过程。

1.汉字信息的编码知识
⑴国标码:是指我国1981年公布的“中华人民共和国国家标准信息交换汉字编码”,代号为“GB2312-80”。由连续的两个字节组成。

2.机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码

3.输入码: 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。

4.字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。

编码的转换举例

汉字 区位码 16进制 国标码 机内码

文 4636 2E24H 4E44H CEC4H

“文”的区位码为4636,区码和位码分别用16进制表示即为“2E24H”, 0010 1110 0010 0100

转换成国标码“4E44H”,0100 1110 0100 0100

机内码为“CEC4H”, 1100 1110 1100 0100

回答时间:2006-09-12 11:50:48

计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,每个字节用七位码(高位为0),;国家标准将汉字和图形符号排列在一个94行94列的二维代码表中,;每两个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码,;如“保”字在二维代码表中处于17区第3位,区位码即为“1703 ”。

国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码有一个相对位置差的代码,;再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。如:“保”�字的国标码为3123H,它是经过下面的转换得到的:1703D->1103H->+20H->3123H。

国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如“保”�字,国标码为31H和23H,而西文字符“1”和“#”的SCII也为31H和23H,现假如内存中有两个字节为31H和23H,;这到底是一个汉字�,还是两个西文字符“1”;和“#”?于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,;汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,如:由上面我们知道,“保”字的国标码为3123H,前字节为00110001B,后字节为00100011B,高位改1为10110001B和10100011B 即为B1A3H,因此,�字的机内码就是B1A3H;。

仅仅一个汉字,就不用编码了。
两个的话,你可以用一位二进制来编码。
四个,就得用两位了。
八个,就得用三位了。

如何给一个汉字编码?
答:1. GB2312编码:GB2312是中国国家强制标准,包含了6763个常用汉字和非汉字字符。这是一个双字节编码,即每个汉字由两个字节表示。例如,汉字“中”在GB2312中的编码是D6D0(十六进制)。2. Unicode编码:Unicode是一个全球性的字符编码标准,旨在统一全世界各种语言的字符编码。Unicode为每个...

如何将汉字编码?
答:(2)汉字的内部码 汉字的内部码又称汉字内码或汉字机内码。机器接收到外码后,要转换成内码进行存储、运算和传送。用二个字节表示汉字的内码。为了和西文符号区分,内码的最高位设为“1”。内码通常用汉字在车库中的物理位置表示,可以是汉字在字库中的序号,也可以是字库中的存储位置。(3)汉字交换...

如何给一个汉字编码?
答:计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,每个字节用七位码...

用java怎么生成一个汉字的GB2312编码和UTF-8编码?
答:回答:如果你是接收到的这个汉字:String name = new String(request.getParameter("name").getBytes("ISO-8859-1"), "GB2312");String name = new String(request.getParameter("name").getBytes("ISO-8859-1"), "UTF-8");

汉字是怎么进行编码?
答:1、外码(输入码)外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择。2、交换码(国标码...

汉字是用什么方法编码的?
答:音码是根据汉语拼音来输入汉字,比如百度拼音、搜狗拼音等等;形码是根据字形、部首来输入,比如五笔字型、表形码等等;音形码就是结合字形和拼音来输入;因此选形码,答案选B;A音码;C音形码;D区位码均为错误选项;

汉字是如何编码的?
答:文字有(1)西文字符编码。在计算机中,西文采用ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)码表示。ASCII码包括大小写英文字母、标点符号、阿拉伯数字、数学符号、控制字符等共128个字符,一个ASCII码占一个字节,用7位二进制数编码组成。(2)汉字编码。汉字编码包括:汉字...

汉字的编码方式有哪几种?
答:二级汉字3008个,图形符号682个,共7445个。一个汉字对应一个区位码,由四位数字组成,前两位数字为区码(0~94),后两位数字为位码(0~94)。机内码是指汉字在计算机中的编码 汉字的机内码占两个字节,分别称为机内码的高位与低位;机内码高位=区码+A0H 机内码低位=位码+A0H。

计算机中,汉字的编码过程是怎么样的?
答:也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码,是编码的逆过程。

中文字符编码的方式有哪些?
答:GB2312-80 10100001~11111110 161~254 (1~94)此标准的汉字编码表有94行、94列,其行号称为区号,列号称为位号。双字节中,用 高字节表示区号,低字节表示位号。非汉字图形符号置于第1~11区,一级汉字3755个且于第16~55区,二级汉字3008个置于第56~87区。每个图形字符的汉字交换码,...