汉字动态生成的结构与风格模型
【图文】:
栗青生等汉字动态生成的结构与风格模型221图1汉字结构和风格的分解Fig.1DecompositionofChinesecharactersstructureandstyle生成不同的黑变体,隶书体可以生成隶变体),并且在生成变体的质量和数量上还需要很大的改进。2.2基于描述汉字的动态生成方法编码是复杂对象的简单表示,其主要目的是信息交换,缺乏对汉字字形的特征空间描述,因此编码汉字系统不适合汉字字形的动态组合和生成。为了解决这一问题,一些学者通过定义汉字的结构和生成规则,动态地生成汉字。为了与编码汉字的生成方法相区别,本文将此方法归结为基于描述汉字的动态生成方法。目前,主要的动态汉字生成方法有以下几种。1)基于汉字部件和笔画描述的动态组字方法。此方法针对表示信息的汉字数量巨大,汉字的机器组字、组词效率较低等问题,使用特殊标签表示汉字的不同部件和笔画,代表性的有香港浸会大学Candy等[7]提出的HanGlyph,以及美国加州大学伯克利分校Cook[8]提出的基于笔画和汉字部件的字形描述语言CDL(characterdescriptionlanguage)等。HanGlyph和CDL兼顾部件和笔画描述方法的组合,将汉字分为控制点、骨架和轮廓3个层次结构,将部件描述进一步细化成笔画描述。在CDL的基础上,Peebles[9]提出一种将字形和结构融合,进行综合描述的方法——SCML(structuralcharactermodelinglanguage)。以组字为目的的汉字部件和笔画的描述,绝大部分使用数字标签对汉字的结构进行标记,其目的是实现汉字智能输入和文档的智能识别,特点是在汉字整体结构描述的基础上,加入汉字笔画结构的描述,在笔画分解、识别和计算上优于用整字为单位的字词描述方案。2)以罕用字的表示为目的的汉字字形的笔段描述。笔段描述是将汉字部件描述继续细化的描述方法,笔段是笔画的?
北京大学学报(自然科学版)第53卷第2期2017年3月222图2汉字字形结构的抽象Fig.2Chinesecharacterstructureabstract图3笔画抽象过程Fig.3Processofstrokesabstract图4手写汉字笔画抽象Fig.4HandwrittenChinesecharactersstrokeabstract的字形服务,将不同字形抽象为相同或相似的结构,实现汉字结构和风格分离。如图2所示,3个不同字体的“江”字抽象为相同的结构。2)汉字笔画的抽象。汉字笔画的抽象是将一个完整的笔画抽象为一个或多个二元组的过程。以点笔画为例,抽象过程包括提取轮廓、确定轮廓特征点、特征点矢量化转换和笔画矢量提取等几个步骤,如图3所示。3)书写汉字的抽象。书写汉字是个性化汉字的最基本表现形式,在线书写汉字的抽象不仅要抽象汉字的书写特征,还要给出书写速度、运笔方向和方式等特征的抽象描述。因此,手写汉字的笔画可以抽象为落笔点、收笔点及行笔过程中特征点的集合{s,i1,i2,…,in,e},分析特征点的集合就可以抽象出若干笔元。图4为在撇笔画的特征点集合中,抽象出3个笔元的示意图。3.2汉字的风格汉字的风格是汉字书写和形成过程中表现出来的个体特色和特征的概括,结构相同的汉字可以有不同的风格。汉字风格主要通过笔画的风格以及偏旁、部首的风格来体现。1)汉字笔画和部件的风格。同一字体的标准字形或同一类型的笔画和部件在不同的汉字中可以有不同的风格表现,即使是标准的印刷字体,这一现象也很普遍。如图5所示,同属于一种笔画的“斜钩”和同一部件“曰”在不同汉字或不同偏旁部首中都存在细微的变化。2)汉字的风格。不同笔画和部件的组合构成不同的汉字风格。汉字的风格表示十分丰富,目前印刷汉字字体的不同主要是通过风格来体现。图6为微软美黑、琥珀、仿宋和楷书4种字体?
【作者单位】: 浙江传媒学院电子信息学院;北京大学计算机科学与技术研究所;武汉理工大学信息工程学院;
【基金】:国家自然科学基金(60973051) 河南省自然科学基金(162300410005) 河南省科技基础前沿研究项目(152300410089)资助
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 韩布新,陈一凡;汉字认知心理研究对机器自动识别汉字的启示[J];中文信息学报;1993年04期
2 徐祖哲;汉字信息化与传统文化的宏扬[J];信息系统工程;2000年02期
3 崔金明;;计算机辅助留学生汉字学习的设计理念[J];陕西教育(高教版);2013年03期
4 潘德孚 ,詹振权;汉字部件的研究[J];中文信息;1995年03期
5 周浩华;统一汉字库的研究[J];中文信息学报;1993年04期
6 陈晖;;多媒体环境下影响小学汉字学习的因素及对策探析[J];中小学电教;2006年08期
7 赵金铭!100083;汉字教学与学习的新思路——评《多媒体汉字字典》[J];语言教学与研究;2000年04期
8 王治阳;;T形汉字码输入法[J];计算机时代;2014年08期
9 罗纲,孙星明;汉字数学表达式开发平台的设计与实现[J];计算机工程与应用;2005年05期
10 张问银,孙星明,曾振柄,吴尽昭;汉字数学表达式的自动生成[J];计算机研究与发展;2004年05期
相关会议论文 前6条
1 李淑萍;;汉字部件暨词汇教材制作之构想[A];全国“大学语文”课程教材与教法研讨会论文集[C];2013年
2 王建勤;高立群;;欧美学生汉字形音意识发展的实验研究[A];对外汉语教学的全方位探索——对外汉语研究学术讨论会论文集[C];2004年
3 洪桂治;;浅谈汉字教材与对外汉字教学[A];第二届全国教育教材语言专题学术研讨会论文集[C];2008年
4 刘荣;刘娅莉;;欧美中高级汉语学习者汉字学习与汉语水平的提高[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
5 王道平;;关于两个汉字部件规范的一点思考[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
6 金如集;;汉字的数字编码输入研究[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
相关重要报纸文章 前10条
1 季洪光;《土生说字》妙解汉字内涵外延[N];科技日报;2009年
2 本报记者 雷茂盛;让电脑听懂我们说话[N];中国改革报;2008年
3 杜永道;六十年来我国颁布多项汉字标准[N];语言文字周报;2009年
4 计亚萍;“手脑并用”在“集中识字”教学中的运用[N];语言文字周报;2009年
5 王礼成;小学生识字探究[N];黔西南日报;2008年
6 作者系北京语言文化大学汉语学院教师 贾颖;集中识字与母语讲解[N];人民日报海外版;2001年
7 光明网记者 朱越 战钊;“汉字热”中热议汉字文化传承[N];光明日报;2013年
8 耿悦 饶星 忠一;曲万波和他的“汉宇通”[N];科技日报;2008年
9 彭勇;《土生说字》全卷本系列丛书面世[N];中国信息报;2009年
10 记者 鲍研;电脑时代,汉字要如何“破茧而出”?[N];北京科技报;2012年
相关博士学位论文 前7条
1 刘翔;汉字生成系统构建探索[D];西南大学;2011年
2 张英俊;对越汉字教学法研究[D];华中师范大学;2008年
3 刘靖年;汉字结构研究[D];吉林大学;2011年
4 梁添才;基于认知机理的汉字智能造字研究[D];华南理工大学;2008年
5 时璇;构形与认知[D];中央美术学院;2012年
6 胡智慧;汉字智能工具中的书写错误识别技术研究与应用[D];中国科学技术大学;2010年
7 卢建平;基于拓扑学和统计学的无字库汉字智能造字研究[D];华南理工大学;2010年
相关硕士学位论文 前10条
1 肖海涛;试论“元”汉字及其教学[D];湖南师范大学;2009年
2 马三思;老挝学生汉字学习难点探索[D];苏州大学;2012年
3 谢慧蓉;初级对外汉字教材对比分析[D];四川师范大学;2012年
4 和平海(DREYLING ANNA);俄罗斯学生汉字偏误调查报告[D];大连外国语大学;2013年
5 李萌萌;初级阶段汉语综合课教材汉字及其教学研究[D];河北大学;2015年
6 邸佩佩;键盘输入背景下高中生汉字手写教学策略研究[D];河北师范大学;2015年
7 梁英;渤海大学非洲籍留学生汉字教学方法研究[D];渤海大学;2015年
8 刘亚;欧美初级留学生汉字认知教学策略研究[D];四川师范大学;2015年
9 李雯洁;留学生汉字书写偏误与对外汉语教材汉字编排问题研究[D];四川师范大学;2015年
10 黄莹洁;非汉字文化圈预科留学生汉字部件使用偏误研究及教学对策[D];华中师范大学;2015年
,本文编号:2542976
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2542976.html