基于SSNet的汉字印刷字体生成
发布时间:2020-04-03 06:05
【摘要】:作为一种象形文字,汉字具有复杂的结构和语义,一套完整的汉字字符,需要专业字体设计人员花费两至三年的时间完成,人工和时间成本极高;同时,文化、媒体、商界等各个领域的用字需求急剧增长,与现有滞后的汉字生产技术形成了强烈的供需矛盾。字体生成技术,指通过某种先验知识或者算法模型,辅助字体设计或者生产的自动化,是缓解用字需求的重要解决途径。然而,现有的字体生成技术只能解决字体生产中的一个或若干个环节,无法完全自动化;即使是摆脱了人为监督的图像转换方法,也难以保持生成汉字的字型,违反了汉字设计的准确性和可读性的原则。针对现有图像转换方法存在的问题,本文提出了一种全新的方法SSNet(StructureSemantic Net),从源域字体到目标域字体转换的过程中,保持生成的目标字体的汉字结构和语义。此外,本文提出了一种面向汉字生成的双掩膜Hausdorff距离,将生成图像双掩膜得到文字区域和背景区域,某个区域中错误生成的像素的惩罚值,设置为其到另一区域的Hausdorff距离,针对不同的汉字给出不同的精确约束,稳定训练过程。SSNet由三个子网络组成,结构网络、语义网络和生成网络。结构网络和语义网络负责源域字体特征的提取,结构网络通过从汉字到五种笔画的转换,实现汉字特征基于笔画信息的解耦,得到结构特征;语义网络通过两阶段训练策略,在预训练阶段学习从多源域字体到不同辅助目标字体的转换,获得汉字语义提取能力,在训练阶段提供语义特征。生成网络中的解码器融合输入的结构特征、语义特征和嵌入风格向量,在像素级、特征级和图像级等三个粒度的损失下被约束,生成目标字体;生成网络中的层次Patch鉴别器在不同的特征尺度对生成图像进行鉴别,进一步促进生成汉字图像的质量。本文设计了多种实验,通过与现有的四种图像转换方法的对比,本方法的消融实验、在不同的实验规模、甚至扩展到书法生成的情况下,使用MSE、PSNR、SSIM和VIF四种不同维度的图像评估指标,在生成结果和不同评价指标上,呈现出SSNet在汉字印刷字体生成任务中的显著性能。实验表明,SSNet相比现有的汉字生成方法,不仅生成字型准确、清晰的汉字印刷字体,并且可以泛化到书法字体的生成;即使训练样本数量低至500至1000之间时,仍然保持生成高质量的汉字印刷字体。
【图文】:
(a) 字体在商品包装中的体现 (b) 字体在品牌商标的体现(c) 阿里巴巴联合汉字字库推出的“智能黑体”、腾讯公司推出的“腾讯字体”(TTTGB-Medium)图1-1 字体设计在各种领域的应用多媒体用字需求。数字时代促使信息大量产生,人们在信息洪流中的阅读需求急剧增加,对字体的可读性和美观性要求逐步提高;与此同时,文字的载体不再仅限于纸张,还有电视、电脑、平板电脑,与目前使用量最大的移动终端——手机,不同信息载体对字体的显示提出了不同的要求[6]。从字体设计及生产的角度看,一种能够适应多种媒体载体的字体需要耗费大量的设计成本和维护成本,因此,为不同的媒体载体设计不同的字体,成了一种更简单的解决方法。但是简单不意味着快捷,同种字体需要在不同载体上以不同的方式呈现,生产字体的人力和时间成本翻倍增长,进一步拉大字体供需差距。字体设计行业滞后。根据国家标准 GB 18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》显示
第二章 汉字印刷字体生成方法综述11图2-1 图像关键点:一般是笔画拐角处或笔画重叠处体的贝塞尔曲线,然后使用细化算法[26]提取字体骨干,并提取骨干的特征点;使用事先定义的规则,将现有的特征点进行变形,得到目标字体的特征点,在特征点调节的过程中,原有字体的轮廓并没有被抛弃,,而是随着特征点的变化而变化,所以特征点调整结束之后,便得到目标字体的汉字;Li 等人[27]使用图像特征点把现有字体的汉字分割出不同的线段,并用一定的规则组合出不同的汉字笔画,组成笔画数据库;然后对目标字体的汉字也进行相应的特征点提取,并且依据笔画数据库中的笔画模型,组成属于目标字体的笔画
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TS801.8;TP391.41;TP18
本文编号:2613032
【图文】:
(a) 字体在商品包装中的体现 (b) 字体在品牌商标的体现(c) 阿里巴巴联合汉字字库推出的“智能黑体”、腾讯公司推出的“腾讯字体”(TTTGB-Medium)图1-1 字体设计在各种领域的应用多媒体用字需求。数字时代促使信息大量产生,人们在信息洪流中的阅读需求急剧增加,对字体的可读性和美观性要求逐步提高;与此同时,文字的载体不再仅限于纸张,还有电视、电脑、平板电脑,与目前使用量最大的移动终端——手机,不同信息载体对字体的显示提出了不同的要求[6]。从字体设计及生产的角度看,一种能够适应多种媒体载体的字体需要耗费大量的设计成本和维护成本,因此,为不同的媒体载体设计不同的字体,成了一种更简单的解决方法。但是简单不意味着快捷,同种字体需要在不同载体上以不同的方式呈现,生产字体的人力和时间成本翻倍增长,进一步拉大字体供需差距。字体设计行业滞后。根据国家标准 GB 18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》显示
第二章 汉字印刷字体生成方法综述11图2-1 图像关键点:一般是笔画拐角处或笔画重叠处体的贝塞尔曲线,然后使用细化算法[26]提取字体骨干,并提取骨干的特征点;使用事先定义的规则,将现有的特征点进行变形,得到目标字体的特征点,在特征点调节的过程中,原有字体的轮廓并没有被抛弃,,而是随着特征点的变化而变化,所以特征点调整结束之后,便得到目标字体的汉字;Li 等人[27]使用图像特征点把现有字体的汉字分割出不同的线段,并用一定的规则组合出不同的汉字笔画,组成笔画数据库;然后对目标字体的汉字也进行相应的特征点提取,并且依据笔画数据库中的笔画模型,组成属于目标字体的笔画
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TS801.8;TP391.41;TP18
【参考文献】
相关期刊论文 前3条
1 邱楠;;论汉字字体设计的意象表现[J];西安工程大学学报;2014年05期
2 熊礼梅;包装中的字体设计[J];包装工程;2004年02期
3 马小虎,刘玉龙,潘志庚,石教英;曲线轮廓汉字自动生成及其变形方法[J];中文信息学报;1999年02期
相关硕士学位论文 前3条
1 金珑;以屏幕为载体的汉字字体设计研究[D];北京服装学院;2013年
2 李航;从汉字字体演变论数字化境遇中的汉字字体设计[D];苏州大学;2013年
3 周红旗;字体设计与中国书法艺术相关性研究[D];华东师范大学;2008年
本文编号:2613032
本文链接:https://www.wllwen.com/projectlw/qgylw/2613032.html