查看: 6133|回复: 24

[密码学习] 反切码

简洁模式
发表于 2021-12-26 22:09:57 | 2021-12-26 22:20编辑 | 发自安卓客户端 | 显示全部楼层
本发明涉及汉字编码领域,特别是顺应汉字的形与音拆字取码的反切码汉字编码法。
在计算机汉字输入方面,目前广泛应用的“五笔字形”,其在使用过程中有以下缺陷一是不按汉字构成拆分,不符合传统拆字习惯,有些拆分不符合笔顺规范。如“爸”,本应一分为二,拆为“父巴”,却一分为三,拆为“八乂巴”。“革”字本应一分为三拆为“廿口十”,却一分为二拆为“廿”加一个自造字根(革字的下部)。“犭”本是一传统部首,却人为地取前二笔为一自造字根。“回”本应先写“冂”,次写“口”,最后封笔写“一”,却拆为“口口”,在语文教学中,这叫倒笔。这种拆分既违背传统拆字习惯,也不利于语文教学和维护祖国语言文字的纯洁;二是使用键盘输入字根时,既不管字根本来的读音,又人为地为键盘字母另行定义,如将“王五一”三个不同音的字均赋予G键名,致使原本互不一致的大量字根(约193个)读名与键盘字母名称之间求同译转,增加了记忆的难度;三是编码规则较繁,不易掌握,难学易忘。
另外有一类和英文键名挂钩的编码,将汉字部件的形态与英文字母形态求同,如“命”,取码为“AOP”。这种编码也与人们认字习惯相背离。
最近面世的一码输入法,是一种顺应汉字的形与音拆字取码的汉字编码,如“香”读xiāng,拆为XHR(xiāng禾日),但一般人对不知读音的字(如“缂”)无法定码。
本发明的目的之一是克服上述缺陷,为广泛的人群提供一种符合人们认字习惯、规则简单、操作方便、易学易记的汉字输入法。
在辞书检索方面,现在的辞书,大多是按读音归类排序,按部首检索。其弊端是按读音归类,造成了多音字的肢解,更主要的是不知读音的字不能查找。按部首检索,查一个字得先判断属哪一部(有些字判断部属较难),再数部首笔画数找到部首,再数字的笔画数找到那个字,然后才是依据页码翻页。
一码输入法的汉字编码,由于凭借汉字读音取码,不能用于辞书检索。
本发明的目的之二是用本编码作辞书检索,直接翻页,一步到位,可以避免现在的辞书在翻页前通常的繁琐查找过程。
本发明的目的是按下述技术方案实现的顺形拆分;顺音取码;字、词编码长度不大于四码,不足四码者,用二次分解法和反切法截取识别码补位以分离同码字。
本发明和现有技术相比具有以下优点一是顺应汉字构成拆分汉字,符合传统拆字习惯,适应语文教学,有利于祖国语言文字的纯洁。
二是按汉字部件读音取码,利用计算机键盘英文字母键位作汉语拼音字母键位,不人为地为键盘字母另行定义,使文字输入工作操作简易,避免了原本互不一致的大量字根读名与键盘字母名称之间求同译转,没有记忆的负担。
三是用独创的二次分解法、反切法拆分取码,使规则简单,易学易记。
四是本编码用于辞书检索,汉字查找可以直接翻页,一步到位。
下面结合实施例对本发明作进一步说明本发明是一种顺应汉字的形与音拆分取码的汉字编码法,包括顺形拆分;顺音定码;字、词编码长度不大于四码,不足四码者,用二次分解法和反切法截取识别码补位以分离同码字。
上述二次分解法是先作第一级分解,将两件字与三件字分解成部件,或将两字词、三字词词条分解成单字,取主码后,再作第二级分解,将部件或词条里的单字拆分以便截取识别码。
两件字以偏旁部件或笔画部件为前件的两件字,先作第一级分解,将字分解成两个部件取主码后,再作第二级分解,拆分后件,用单件反切法,先取后件之首,然后反取后件之尾作识别码;以成字部件为前件的两件字,先作第一级分解,将汉字分解出两个部件取主码后,再作第二级分解,前后两件分别切分,用两件反切法,前件取首,后件取尾,截取识别码。
三件字先作第一级分解,将字分解成三个部件取主码后,再作第二级分解,将第三件拆分,取第三件之末件作为识别码。
两字词先将词条作第一级分解,按两字读音的音首第一个字母定主码,然后再作第二级分解,将两字切分,用两字前后反切法补上识别码。
三字词先将词条作第一级分解,按三字读音的音首第一个字母定主码,然后再作第二级分解,将第三字切分取最后一件定为识别码。
上述反切法是一种对两件字或两字词切分反取的方法。
前件为偏旁部件或笔画部件的两件字,先作第一级分解,将字分解成两个部件取主码后,再作第二级分解,拆分后件,用单件反切法,先取后件之首,然后反取后件之尾作识别码;前件为成字部件的两件字,先作第一级分解,将字分解出两个部件取主码后,再作第二级分解,前后两件分别切分,用两件反切法,前件取首,后件取尾,截取识别码,两字词第一次按词条两个字的读音取主码后,再将两字分别作第二次拆分,然后用前字取首、后字取尾的两字反切法截取识别码。
实施例一.顺形拆分1.按汉字构成拆分汉字由三种部件构成现成汉字;偏旁部首;基本笔画。本方案基本顺应汉字构成拆分。顶,形声字,从页丁声,本方案拆为。‘丁页’(两个成字部件)。信,会意字,从人从言。本方案拆为‘亻言’(一个偏旁部件,一个成字部件)。人,象形字,象侧面站立的人形,象人的手臂与腿,本方案拆为‘丿ㄟ’(两个笔画部件)。
2.按汉字书写笔顺拆分。如“式”字,不拆为“弋工”二字,应按书写顺序拆为“一工 ”;“脊”字,起笔应按国家规定的笔顺规范先写“人”字的两边,拆为 人月”。“丑”,拆为“刀二”,不拆为 ”。
3.随字取形部件取形以印刷体规范汉字为准。如“周”字,是“冂土口”,而不是“冂吉”。“或”字第五画是挑,不是横。“舍”,是“人干口”,而不是“人舌”。
有的笔画在不同字里会发生不同变化,则根据不同变化随字取形。如“乂”(yi),在“父”字里“乂”拆为“丿ㄟ”,而在“风”字里则应取为“丿丶”。
本编码视传统的变形体为相似形,并约定一些形体为相似形。如“看”字,“丿”起,起始件为“手”,应拆分为“手目”。“拜”字,应拆分为“手三十”。 是“卜”的相似形。歪尾 等同“羊”。 承袭辞书传统,视作“小”的同一部首。将“亲杀茶”等字的末件视作“木”;将“木”字的后三笔约定为“小”。
以上详见附录二、三的有关相似形的说明。附录中未列又不属基本保持原貌的传统变形体者,均不作相似形处理。如“斤”字,最后一笔无钩,是“丿丿一丨”,不是“丿丿丁”。“邦”,应拆分为“三丿阝”,而不是“丰”和“阝”;“寿”字则是“三丿寸”,不是“丰寸”。“判”则拆为“半”和“刂”。
4.取大不取小部件容量取大“三”,应拆分为“一二”两件,不拆分为“一一一”三件。“鸿”,拆为“江鸟”;不拆作“氵工鸟”三个部件。“典”,拆为“冂共”;不拆作‘冂廿一八’四件。
部件级别取大汉字由三种部件构成现成汉字;偏旁部首;基本笔画。依次排比级别,成字部件最大,偏旁部件次之,再次是笔画部件。夂,拆取为“丿又”,不取为“クㄟ”。
5.中分取整如“巫”,拆为“一丨从一”;“坐”,拆为“从土”;“乖”,拆为“千北”“小”字的两边,视作“八”字被中分,“小”拆作 八”。取整时应注意笔形结构,如“乘”字腰中的两边合起来是一个“北”字,而收尾的紧密靠连的“丿ㄟ”两笔不同于两笔离散而有间隔的“八”,故“乘”字应拆作“乖丿ㄟ”,不是“乖八”。
6.上下结构靠上不靠下
“克”字中的“口”应上靠,拆为“古儿”,不拆成“十兄”;“天”字,拆为“二人”,不拆为“一大”。
7.左右结构靠后不靠前“拆”,拆为“扌斥”,不拆为“折丶”;“树”拆为“木对”,不拆为“权寸”。“湖”拆为“氵胡”,不拆为“沽、月”。“彬”拆为“木、杉”,不拆为“林、彡”。
8.取常不取偏构字部件取简体字、正体字,不取繁体字、异体字。繁体部件字、异体部件字应拆零分解。如“覆”字的下部“復”为“复”的繁体字,故“復”应拆零成“彳、复”两个部件取码;“葱”,取“卄匆心”,不取“卄忽”,“忽”是“匆”的异体字。
构字部件不取古字如“番”,取“丿米田”,不取“采田”。“采”(biàn)为“辨”的古字,现在不用。“释”,取作“丿米又丨”。
成字部件取现代汉语通常用字(范围基本以GB2312的6763个汉字为准),不取生僻字。生僻字拆零分解,如“菌”字,拆为“艹冂禾一”,不拆为“艹囷”。“囷”(qūn)是生僻字,古指谷仓。“搋”,拆为“扌丿丿虎”,不拆为“扌虒”。“虒”(读sī)字是生僻字。二.顺音定码按所取部件的普通话的读音,取音首第一个字母为该部件的代码,多音的表音部件则随字定音。扁,常读biǎn,又读piān(扁舟),在‘蝙’字里取biǎn,代码为‘B’;在‘篇’字里则取piān,代码为‘P’。
“句”,一读jù,一读gōu(人名句践读gōu),‘够’取码为‘GD’(句多),‘佝偻’的‘佝’(gōu)取码为‘RG’(亻句)。
对于全部读音均与本字读音不一致或无关联的多音偏旁部件,采用常读音定码。‘耀’(yào)字的右件‘翟’,现在用于姓氏读zhái,为常读音,古代指称长尾野鸡读dí。在现代语音里,此两读的声、韵均与‘耀’(yào)的读音无关。则‘耀’字取码为‘GZ’(光翟)。番,常读音为‘fān’,另在地名‘番禺’里读‘pān’。在‘播’字里‘番’作部件取常读音‘fǎn’定码。
有些字其部件为多音件,本字也为多音字,如‘栎’,称树读lì,地名栎阳读yuè,则‘栎’既取为‘ML’,也取为‘MV’;以应用广泛的树名音为正码。三.取码方法1.拆分汉字,取部件读音的第一个字母为代码。分BD(八刀)。祁SE(礻阝)。八PN(丿ㄟ)。
2.取码以四码为限,超过四码者,取前三码和最后一码。永DZZN(丶フㄟ)。
3.两件字用二次分解法和反切法截取识别码以分离同码字。
两件字分为三类第一类,以偏旁部件(附录二的55件)或笔画部件(共8件)为前件的两件字,先作第一级分解,将字分解成两个部件取主码后,再作第二级分解,拆分后件,用单件反切法,先切取后件之首,然后反取后件之尾作识别码。如篁‘ZH·BW’(_皇·白王);簧‘ZH·CB’(_黄·艹八);篌‘ZH·RS’(_侯·亻矢);乏‘PZ·DN’(丿之·丶ㄟ)。
第二类,以成字部件为前件的两件字,先作第一级分解,将汉字分解出两个部件取主码后,再作第二级分解,前后两件分别切分,用两件反切法,前件取首,后件取尾,截取识别码。如别‘LD·KG’(另刂·口 第三类,两件字中后件若为不能拆分的单笔画部件(‘一丨丶乙’等),省略识别码。如‘钆’,取码为‘JZ’(钅乚);‘钇’,取码为‘JZ’(钅乙);‘丸’,取码为‘JD’(九丶);‘斥’,取码为‘JD’(斤丶)。
用于计算机汉字输入,第三码取该字读音的第一个字母为识别码,第四码取i补位,如‘钆’(gá),取码为‘JZGI’(钅乚·gáI);‘钇’(yǐ),取码为‘JZYI’(钅乙·yǐI);‘丸’,取码为‘JDWI’(九、·wánI);‘斥’,取码为‘JDCI’(斤、·chìI)4.三件字也作二次分解,将第三件拆分,取第三件之末件作为识别码。如莺‘CMN H’(卄冖鸟一)。荦‘CMN·S’(卄冖牛·丨)。
三件字的第三件若为不能拆分的单笔画部件,省略识别码。如及‘PZN’(丿ㄋㄟ)。用于计算机汉字输入,第四码取该字读音的第一个字母为识别码。如及‘PZNJ’(丿ㄋㄟ·jí)5.单笔画的一件字(只“一乙”两字,此两字实际上是两个笔画部件),取其笔画读音定码,用于计算机汉字输入,再加补三个i作补位码一HⅢ。乙ZⅢ。
6.词语两字词先分别按两字读音的音首第一个字母定主码,再将两字切分用两字反切法补上识别码。如“中国”取码为“ZG·KH”(中国·口一)。
三字词先分别按三字读音的音首第一个字母定主码,再将第三字切分取最后一件定为识别码。如“新气象”取码为“XQX·N”(新气象·ㄟ)。
四字词分别按四字读音的音首第一个字母定码。如“欣欣向荣”取码为“XXXR”。
四字以上的词,取前三字和最后一字各自读音的音首第一个字母为编码。如“西部大开发”取码为“XBDF”。四.转换与借位本编码用于计算机汉字键盘输入,将键盘中的英文字母键位转换为汉语拼音字母键位使用。
其中英文字母键名V、U、I、O在本编码中作为“借位代码”,用于计算机汉字输入借‘V’为含有‘ǖ’音的‘yu、yun、yue、yun’四音的代码。‘雷’,输入码为‘VT·HT’。‘玩’,输入码为‘WV·HE’。‘朋’,输入码为‘VV·JE’。‘动’,输入码为‘VL·EP’。借“U”键位为“氵”的代码,如“江”字,输入码为“UG·HH”;借“I”键位为“乡”的代码,如“编”字,输入码为“IB·HC”;借“O”键位为“扌”的代码,如“打”字,输入码为“OD·HG”。五.部件笔画部件。共有横竖撇捺点折钩挑(一丨丿ㄟ丶乙 )八件,按其读音的音首第一个字母分别取字母H、S、P、N、D、Z、G、T,用于计算机键盘汉字输入,相应地定在键位H、S、P、N、D、Z、G、T上。其识别与使用详见附表一。
偏旁部件共55件,按其读音分别定码,即定码为B的是勹、 冫、广;定码为C的是卄、巛、束、镸;定码为D的是刂、 定码为E的是阝;定码为G的是变形艮;定码为H的是灬、巟、 定码为J的是冂、卩、丬、巠或 段、钅;定码为K的是凵;定码为L的是变形良;定码为M的是一、宀、冃;定码为P的是疋或 ;定码为Q的是巧;定码为R的是亻;定码为S的是厶、彡、彐、纟、糸、_、 扌、饣、氵、礻;定码为T的是乇;定码为W的是攵;定码为X的是 _、忄;定码为Y的是乂、尢、 、讠、衤;定码为Z的是廴、辶、 。其识别与使用详见附表成字部件。成字部件取字范围基本以GB2312的6763个汉字为准。部分成字部件及其相似形的识别与使用详见附表三。六.附表附表一
笔画部件的名称代码及说明部件 名称读音 代码 说明与例字一横héng H 作汉字称yī,作组字部件一律称héng不称yī一(H),三(HE),下(HB)。
丨竖shù S丿撇piě P 从右上方向左下方运行提笔而收的,无论长短都称‘撇’匕飞学北步(下左为短撇,拆为‘止丨 丿’)。
ㄟ捺nà N 人之辶。
丶点diǎn D‘习’字第三笔为‘挑’,‘飞’字第二笔为‘撇’,‘北’字左下为‘挑’,右上为‘撇’,均不视作‘点’。
乙折zhé Z 指称一切带转折的笔画,包括_ㄥ ㄋ乚 等。另 此形顺依一般称法,称‘折’不称‘横钩’。甲乙的‘乙’作汉字单用时称yǐ,作组字部件时,称为zhé,代码为Z乙(Z),钇(JZ),钆(JZ)。
钩gōu G 包括竖左钩、竖右钩 和斜钩丁以弋。不包括带转折的钩,如‘_’ 等。
挑tiǎoT 例北刁习兆。
附表二偏旁部件的名称代码及说明部件名称读音代码说明与例字勹 包字框bāo B 例字包匍。
八字形bā B 包括在一切部位被中分的横排而写的两笔。例字丫兰益半卷豆小办亦业夹伞善(羊 一口)潦。
冫 冰字旁bīn B 只限于左右结构的左偏旁冰冻冷决冯。‘寒习飞斗枣’中的两笔不划入‘冰字旁’。有些字的左旁两笔并不是‘冰’,本方案只重形,不重源,为了统一,在左者一律称作冰字旁。
在其它部位者,不论属‘冰’不属‘冰’,一律不划入‘冰字旁’。
疒病字头bìngB艹草头形chǎoC 在上(艹草)在中(卄垂)在下(廾弄),一律约定称为‘草’。正例莽葬共开弄弊戒。相似形甘(廿二),其(廿三八)。
巛 三拐川chuān C 例字巡甾(zāi)巢邋(lā)鬣(liè)朿 刺字旁cì C 例字棘刺枣策。‘朿’本非偏旁部件,因不是现代通常用字,故纳入偏旁部件。
镸 变形长cháng C 例字套肆髟刂立刀旁dāoD只限于左右结构的右偏旁。‘师坚而介’这类字的两竖(有的是撇与竖)不划入‘刂’,而按两个笔画部件取码。‘氘’,不取作‘气刂’,而取作‘气丿丨’。
ク斜刀dāo D例字危刍急负争色龟免奂象詹久夕。只限于笔顺相同的部件,不用于‘万方敖’等字,这些字里的‘ク’笔顺是先折后撇。‘欠’字开头两笔不视作‘ク’。
阝双耳旁ěr E在左在右统称为‘双耳旁’。
变形艮 gèn G例字即既爵灬四点火huǒH例字然煮煎熬焉燕。‘燕’字四点本不是‘火’,本方案重形不重源,约定‘灬、’的代码一律为‘H’。
巟偏旁巟huāng H例字荒慌谎。
虎字头hǔH例字虎虐滹璩冂偏旁冂jiǒng J例字迥炯同贝巾见丹册冉(冂丨二)而身敝曲典裔商骨日曰月。
卩 节字底jiē J例字节疖即爷命印卫卯卸卿却叩。‘卩’本为符节的‘节’,不称单耳旁。在‘报服赧’等字里的相似形,也视作‘卩’。
丬 将字旁jiāng J经字旁jīngJ 叚 假字旁jiǎ J假葭瘕遐瑕暇霞钅 金字旁J凵 偏旁凵kǎn K读kǎn。例字凼凶。
变形良 liáng L例字郎朗。
冖 幂字头mìM 冖是幂的古字。例字幂冥蒙农冗孛鹤荣爱舜亭帝带学常堂党裳棠嚏带沉骨。
宀 宝盖宀miǎnM取古音读为miǎn。
冃 冒字头mào M‘冒’字的上件‘冃’,从冂从二,不是‘曰’。‘冒’字应拆分为‘冃目’。‘冕’,上件‘冃’,不是‘曰’。‘冕’字应拆分为‘冃免’。例字冒冕勖帽瑁。
疋() 异体匹pǐ P称脚读shū。读yǎ时,古同‘雅’。又为‘匹’(pǐ)的异体字。本方案纳入偏旁部件,取音为pǐ楚胥疏。
犭犬字旁quǎn Q例字狗猫狼猝狺(yín)独狮。
亻单人旁rénR ‘在存’两字的第二三两笔作‘亻’字件取码,‘在’拆为‘一亻土’。‘存’则拆为‘一仔’。‘段’字起首两笔不视作‘亻’。
厶私字旁sī S 私幺公雄。
彐横山shān S 例字当刍急寻灵帚录雪彗艮侵殷。包括下列字里中横出头的相似形事尹肃隶聿争妻秉兼捷慧。
彡三撇旁shān S 例字杉钐衫须。
纟绞丝旁sī S 练细。
糸丝字旁sī S 读sī时,古为‘丝’字繁体(糸糸)的省写,‘纟’本作‘糸’。
另读mì,细丝。本方案取音为sī紊素。
生字主体shēS 例字生青隹(亻丶一 ng
氺变形水shuǐ S泰滕求。
扌提手旁 S饣食字旁 S氵三点水 S礻示字旁 S攵偏旁文wénW 小字形xiǎo X例字少光肖当尚党尝赏东(七小)乐(丿_小)尔曾雀木未耒束柬秉敝。‘不’字‘一’下三笔的笔顺与‘小’字不同,不能视作‘小’。
_兴字头xīng X例字兴学_变形心xīnX恭慕忝隳。
忄竖心旁 X乂偏旁乂yìY正例刈义艾杀父凶风冈赵爽。相似形例字史吏更。‘乂’,本为汉字,并非偏旁部件,因不是现代通常用字,故纳入偏旁部件。
尢尤字主体yóu Y例字尤(尢、)龙(尢丿、)。
秃尾羊yáng Y例字羔羲。
讠言字旁 Y衤衣字旁 Y廴建之旁zhī Z例字建延廷。
辶走之旁zhīZ走之旁建之旁,代码同为‘z’。
爪字形zhǎo Z采受。
_竹字旁 Z以上55个为本编码的全部偏旁部件,它们均属不能单独成字的部件。不在此55件之列的其它偏旁部件,如“匚 攵 ”等,均拆零处理。“彳(chì)豸(zhì)髟(biāo)”是次常用汉字,不是偏旁部件。
附表三部分成字部件及相似形部件字 读音代码 说明二 èr E两横画作‘二’字取码时,应以上短下长为准,否则不能当作‘二’字取形。‘王’,前两横上长下短,不能与‘丨’画合成取作‘干’ 应拆分为‘一土’。‘戋’(上短下长),取为‘二し丿。‘气’(上长下短),取为‘丿一一乙’。‘韦’(上长下短),取为‘一一 丨。‘垂’,为‘千卄一一’。‘重’为‘丿一申二’。
七 qiQ相似形车东切长。‘切’,左旁本为‘七’(从刀七声),现规范为‘一し ’,本方案视作‘七’的相似形取码。‘长’的第二三两笔也相应地视作‘七’,‘长’取为‘丿七ㄟ’。
bǔ B卜字形上贞占卢卣卓桌睿。
几 jǐ S例凡朵风凹(几冂一)。
比字左旁biB比字左旁视作‘匕’的相似形比顷(只此二字)。‘化’、‘叱’、
‘龀’(chèn)字的右部为撇出头,不视之为‘匕’。
木mù M木的相似形杀亲茶。木字竖笔无钩,‘杀亲茶’此三字的有钩的末件视作木的相似形。
罒sì S四字形(不视作‘目’)黑柬(一罒小)罗罹署罩。‘曾’为‘丷冂小一日’。
井jǐng J相似形例寒鞲。
曰yuè Y例字昌汩(gǔ)。约定只取‘昌’的下件‘汩’的右件从‘曰’(yuè),其它字的‘日’(rǐ)字形、‘曰’(yuè)字形,无论宽窄,作部件时,一律约定为‘日’(rì)。注意‘冒冕’两字上部不从‘曰’而从‘冃’(mào)。
月yuè Y相似形例且(月一)直(十月二)具(月二八)。斜月旁然炙。
变形止zhǐ Z例足走疋婕。
六字形liù L例字立交旁帝商摘滴冥毅子zǐ Z作偏旁的‘孑’,不读jié,代码一律为Z孩孤。
册cèC册字形扁嗣龠。
yáng Y歪尾羊羞差着。
1.一种顺应汉字的形与音拆分取码的汉字编码法,其特征是顺形拆分;顺音定码;字、词编码长度不大于四码,不足四码者,用二次分解法和反切法截取识别码补位以分离同码字。
2.如权利要求1所述的汉字编码法,其特征在于二次分解法是先作第一级分解,将两件字与三件字分解成部件,或将两字词、三字词词条分解成单字,取主码后,再作第二级分解,将部件或词条里的单字拆分以便截取识别码,两件字以偏旁部件或笔画部件为前件的两件字,先作第一级分解,将字分解成两个部件取主码后,再作第二级分解,拆分后件,用单件反切法,先取后件之首,然后反取后件之尾作识别码;以成字部件为前件的两件字,先作第一级分解,将汉字分解出两个部件取主码后,再作第二级分解,前后两件分别切分,用两件反切法,前件取首,后件取尾,截取识别码,三件字先作第一级分解,将字分解成三个部件取主码后,再作第二级分解,将第三件拆分,取第三件之末件作为识别码,两字词先将词条作第一级分解,按两字读音的音首第一个字母定主码,然后再作第二级分解,将两字切分,用两字前后反切法补上识别码,三字词先将词条作第一级分解,按三字读音的音首第一个字母定主码,然后再作第二级分解,将第三字切分取最后一件定为识别码。
3.如权利要求1或2所述的汉字编码法,其特征在于反切法是一种对两件字或两字词切分反取的方法,前件为偏旁部件或笔画部件的两件字,先作第一级分解,将字分解成两个部件取主码后,再作第二级分解,拆分后件,用单件反切法,先取后件之首,然后反取后件之尾作识别码;前件为成字部件的两件字,先作第一级分解,将字分解出两个部件取主码后,再作第二级分解,前后两件分别切分,用两件反切法,前件取首,后件取尾,截取识别码,两字词先作第一级分解,将词拆成两个单字,按两个字的读音取主码后,再将两字分别作第二级拆分,然后用前字取首、后字取尾的两字反切法截取识别码。
4.如权利要求3所述的汉字编码法,其特征是笔画部件有“一、丨、丿、ㄟ、、、乙、 ”八件,按其读音的音首第一个字母分别取字母H、S、P、N、D、Z、G、T,用于计算机键盘汉字输入,相应地定在键位H、S、P、N、D、Z、G、T上。
5.如权利要求3所述的汉字编码法,其特征是偏旁部件有55件,按其读音分别定码,即定码为B的是勹、 冫、疒;定码为C的是卄、巛、束、 定码为D的是刂、 定码为E的是阝;定码为G的是变形艮;定码为H的是灬、巟 定码为J的是冂、卩、丬、 或 叚、钅;定码为K的是凵;定码为L的是变形良;定码为M的是冖、宀、冃;定码为P的是疋或 定码为Q的是犭;定码为R的是亻;定码为S的是厶、彡、彐、纟、糸、 水、扌、饣、氵、礻;定码为T的是乇;定码为W的是攵;定码为X的是 ツ、 忄;定码为Y的是乂、尢、 讠、衤;定码为Z的是廴、辶、 _、
6.如权利要求1所述的汉字编码法,其特征是顺形拆分包括依照规范笔顺、顺应汉字构成拆分,随字取形,部件容量取大不取小,部件级别取大不取小,上下结构靠上不靠下,左右结构靠后不靠前,中分取整,构字部件取常不取偏。
7.如权利要求1所述的汉字编码法,其特征在于顺音定码,按所取部件的普通话的读音,取音首第一个字母为该部件的代码,多音的表音部件则随字定音,对于全部读音均与本字读音不一致或无关联的多音偏旁部件,采用常读音定码。
本发明是一种顺应汉字的形与音拆字取码的汉字编码法,包括:顺形拆分;顺音取码;字、词编码长度不大于四码,不足四码者,用二次分解法和反切法截取识别码补位以分离同码字。本发明用于计算机汉字键盘输入,简单易学;用于辞书检索,可以直接翻页,一步到位。
1 | 发表于 2021-12-30 10:07:14 | 发自安卓客户端 | 显示全部楼层
有趣
2 | 发表于 2021-12-31 07:43:10 | 发自安卓客户端 | 显示全部楼层
汉语言小孩背不下去书了好不容易过来摸摸鱼,一看到反切,脑子下意识就是古代汉语
2 | 发表于 2021-12-31 08:52:34 | 发自安卓客户端 | 显示全部楼层
理科生直接好家伙
1 | 发表于 2022-1-4 21:12:53 | 发自安卓客户端 | 显示全部楼层
感谢分享
1 | 发表于 2022-1-4 23:30:46 | 发自安卓客户端 | 显示全部楼层
喵啊
| 发表于 2022-1-5 10:01:13 | 发自安卓客户端 | 显示全部楼层
感谢分享
| 发表于 2022-1-5 19:58:56 | 发自安卓客户端 | 显示全部楼层
感谢分享
| 发表于 2022-1-5 22:50:59 | 发自安卓客户端 | 显示全部楼层
感谢分享
| 发表于 2022-1-6 07:08:00 | 发自安卓客户端 | 显示全部楼层
学到了,不过好复杂
返回版块
123
尚未登录
您需要登录后才可以回帖 登录 | 加入学院