也谈生僻字的信息处理(2)
作者:佚名; 更新时间:2014-12-05
有全拼比较常用,而且,这些输入法所输入的汉字,包括了 GBK 繁体和 GBK 简体,数量非常大,所以造成两方面的不便:一是重码率高,选字非常麻烦;二是繁体简体同时出现,有些字不容易分辨繁简,同时如果不知道字的读音,也很难选择拼音输入法。
  现在已有软件研制商研制出能输入GBK字库的五笔字形输入法,如智能陈桥,对于熟悉五笔输入法者,比较便利。
  2、用Word插入符号的方法
  选“插入”菜单中的“符号”命令,在“字体”下拉列表中选“标准字体”(Word97是“宋体”),在“子集”中选“CJK统一汉字”(Word97是“部首及难检字”)。一般可在列表中找到所需的汉字。虽然该字库大致是按部首和笔画进行编排的,但查找起来还是相当麻烦。以前有万学仁先生编有《通用字符集部首表及区位码(16进制)》[1],有利于查找,如果没有该部首表,还有一种方法可以采用,先输入一个与所要输入的生僻字相同偏旁的汉字,并选中该汉字,然后用鼠标单击“插入”菜单中的“符号”项,此时会弹出“符号”对话框,再用左右方向箭进行逐个查找和挑选,就会很快找到该生僻字的。如果是一个独体字,则可以输入一个笔画相同的的独体字(也不作偏旁)。很快会在其附近找到该字。
  (二)GBK字集以外生僻字的输入
  1、使用Windows自带的“造字程序”
  该程序操作简单,使用方便,既可以用两个字重新拆分组合成一个新字;也可以选一个相近的字加以修改而造一个新字;还可以直接在编辑框中画出您所需要的字,比较便利的是前两种方法,其步骤如下。
  (l)取两个字中有用的部分,重新组合成一个新字。以“腘”字为例(为便于排版,没有选用GBK以外的字作为例字,下同),单击“开始”按钮,选“程序”、“附件”、“造字程序”,出现“造字程序”窗口。在弹出的“选定代码”窗口中确定所造的字的代码位置,比如AAA1后按“确定”按钮(如没有出现,则选“编辑”中的“选定代码”命令),此时在“造字”窗中出现“编辑”工作区。再选“编辑”菜单中的“调用”命令(在Windows2000、XP中则为“复制字符”命令),单击“字体”按钮,选择字体后,在“形状”框中输入参考字“腊”,按“确定”按钮。在“编辑”框中出现“腊”字。再选“窗口”中的“引用”命令(在Windows2000、XP中则为“参照”命令),一样选定字体,输入参考字“掴”,在“造字”窗中出现带有“掴”字的引用框。用“造字”窗左边的圈选工具圈选“编辑”框中的“昔”,按Del键。圈选“引用(参照)”框中的“国”,将它拖到编辑框中合适的位置,然后关闭“引用”框。再选“编辑”菜单中的“保存字符”命令,在对话框中按“确定”按钮。
此时该字已经建立,如文章中需要用到“腘”字只要将输入法切换至区位输入法,键入AAA1,即可出现“腘”字。
  如果要在以后能以平时的输入方法输入该字,那还要补上下一步操作;选“编辑”中的“输入法链接”命令,如为第一次输入,将弹出搜索对话框,在文件名输人框中以英数方式输入你常用的输入法,单击“打开”按钮,弹出是否要创建该文件的询问,单击“是”。如有多种输入方法,则依次键入不同的输入法文件名,完成后弹出输入外码对话框,输入该字的外码(如链接了多种输入法,则有不同输入法的外码)。按“注册”按钮。但要注意输入的外码必须符合该输入法的规定,计算机不承认你自行定义的外码。
  (2)用相近的字修改。以“臿”字为例:前边的步骤与前例相同,只是将参考字改为“插”。用上述的方法删除“插”字的提手旁后圈选“编辑”框中的“臿”,将它向左拖至框的中间,通过调整八个控制点来改变形状大小至满意。以后的操作与上例相同。
  该法的优点是:不管是否知道该字的读音,总能通过拆分组合的方法造出来。并且,当正确输入外码注册后,平时还能以习惯的输入方法输入该字。缺点在于如果需要将使用了该造字文件的文档拷贝到其它计算机中,还需要拷贝造字文件。
  (3)对于某些类似于图形的字,可以选用各种工具画出需要的字形。
  2、用Word组字
  Word2000的“格式”菜单中有“中文版式/双行合一”功能,工具栏上有“字符缩放”按钮,利用它们您可组合一些冷僻字。较之用其他方法要简便得多,操作方法如下:
  (l)对于左右型字体,以“嬿”字为例:输入“女”字后紧接着输入“燕”字;选中“女”字,单击“字符缩放”按钮,选择合适的比例(该字可选50%);选中“燕”字,单击“字符缩放”按钮,选择合适的比例(该字可选80%);同时选中“女”与“燕”,选“格式/字体”命令,单击“字符间距”标签,在“间距”框中选“紧缩”,再单击“确定”按钮即可。
  (2)对于上下型字体(以“斊”字为例):键入“文耳”两字,然后选中它,在“格式”工具栏上的“字号”框内选择合适的字号(通常输入“四号”字时可选“小五”号,输入“五号”字时可选“小六”号。但有时差距可能还要大一些);单击“字符缩放”按钮,选择合适的比例(该字可选200%);选“格式/中文版式/双行合一”命令,按“确定”按钮。
  采用上法输入冷僻字要使字型漂亮,对于左右型字关键在于输入合适的比例;上下型字则在于合适的比例及“大小”框中的数值,当然字号的大小也是十分重要。但此法对于结构复杂如包围型、半包围型、声(形)占一角型等的字则不适用。采用该法组成的字,还可以作为字符串检索。
  3、如果要经常运用到大量生僻字形,则可以选用已有的自造字字库进行插入。
  现在已经有大型的自造字字库出现,如由日本《今昔文字镜》研究所制作的《今昔文字镜》,包括24个TTF格式的矢量字库,共包括九万个汉字。其中收录日本《ISO10646字符集》汉字两万个,《大汉和字典》汉字五万个,其他四万个汉字包括:甲骨文、梵文、大陆、台、港汉字、水文、越南字喃、汉字偏旁和造字部件、日文假名、俄文、拉丁文等各种常用字母和符号。适用于WINDOWS95/98/NT为操作系统的各种文字处理应用软件。还提供了一个简单易用的检索应用软件。
  还有如北师大汉字与中文信息处理研究所研制的《说文小篆输入法》,能够输入所有小篆字形和《说文》所收古文、籀文等字形。
  其它还有一些古籍数字化机构与研究人员也造了各种各样的字库,只需要安装到字体中,就可以显示打印他们所造的字。此种字库,如能有统一的规范与标准就比较好交流使用。并且最好能有一个检索和输入字符的相应软件才可资重复利用。
  4、用字体制作软件制作自己的字库。现在已经有比较好用的字体制作软件,如Font Creator Program,如果能熟练使用,则可以自己量身定做自己的字体,优点在于可以随时补充修改。缺点在于自造字库千差万别,通用性差。

参考文献
[1]万学仁.谈谈非常用字的信息处理[J].内江师范学院学报,2001,(3).
核心期刊快速发表
Copyright@2000-2030 论文期刊网 Corporation All Rights Reserved.
《中华人民共和国信息产业部》备案号:ICP备07016076号;《公安部》备案号:33010402003207
本网站专业、正规提供职称论文发表和写作指导服务,并收录了海量免费论文和数百个经国家新闻出版总署审批过的具有国内统一CN刊号与国际标准ISSN刊号的合作期刊,供诸位正确选择和阅读参考,免费论文版权归原作者所有,谨防侵权。联系邮箱:256081@163.com