中文连续手写识别中若干问题研究
发布时间:2020-12-15 06:36
中文连续手写识别是利用计算机对输入的中文手写文本信息进行自动识别,提取出相应的文字内容。在随着以人工智能等为核心驱动力的第四次工业革命到来,手写识别在许多人机交互场景中都扮演着重要角色:如快递自动分发、智能阅卷、信息录入等等。特别地,我们国家人口众多且在世界上占据越来越重要的地位,研究中文这种特定的文字识别就显得尤为重要。然而相对于孤立字识别而言,连续文字识别隶属于序列求解问题的一种,如何进行有效建模本身就是研究的一个难点。自20世纪以来,研究者们便基于统计建模的方法提出了许多解决思路。这些方法按照是否需要对图片进行显示地预切分可以分为过切方法和非切分方法。一方面,准确地寻找分割点往往成为过切分方法的性能瓶颈;另一方面,受限于传统分类器的表征能力,不同方法的识别性能一直没有取得很大的进展。近年来,随着可利用的海量数据的获得以及深度学习技术的突飞猛进,无论对以预切分为代表的过切法还是对无显示分割的方法,连续手写识别的性能都有了极大的提升。尽管基于深度学习的已有方法相比传统方法获得了明显性能的改进,但是仍然有一些值得进一步研究的地方。第一是如何将传统序列模型与深度学习技术更有效结合来实现对...
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:104 页
【学位级别】:博士
【部分图文】:
图2.1基于过切分的连续手写中文文本识别流程图及中间结果示意图(Wang??etal.,?2011)??对应的求解的数学公式即:??
;第三,传统??GMM-HMM的方法分类器过弱,且对在特征选择、训练准则、语言模型等方面??的新进展没有全面涉及。??为了解决以上问题,本论文提出基于DNN-HMM的中文连续手写识别方法。??该方法中每一个孤立字符用一个HMM表征,因此文本行可以用级联的HMM??自然表示:??火月象??C-\?;二\??!?S1?:?<?S2?V,S3?)?:?S4?)?(?S5?;>?????SI?S2?S3?S4?S5?????SI?S2?S3?S4?S5?????■:细j们m??图3.1基于HMM的中文文本行建模??考虑到DNN,我们对式(3.1)进行进一步分解:??26??
第3章基于深度神经网络-隐马尔科夫模型的中文连续手写识别方法??DNN-HMM以及LM给出最终的识别结果。??训练阶段??f图片广、???*綱早取—.GMM-HMM?_/?GMM-?(??、样jJ?1酬疋¥?1最大似然训练?t?HMM?I/-???*?强制对齐?*???分中贞???1?^rnm卜厂序列训练I???*?重对齐?* ̄??CNN-HMM??/?CNN-?(??交叉熵训练?HMM?^?j??卜T??重对齐?????f ̄ ̄文本广、?语言模型 ̄_J?i五古模型??^?数据、j1?箚练?1?口口模??识别阶段?…—丨_—??r未知样本r?j——?特征提取?一?识别器?????v?V?y?丨?I?丨?识别结果????分?贞????图3.2?DNN-HMM训练-识别系统??我们在下面小章节逐一详细介绍流程图的各个部分。??3.?2.?1特征提取??由以上可以看出,对DNN的训练基于每一帧有监督的训练且不涉及HMM。??因此在训练DNN之前,需要先基于最大似然估计(Maximum?likelihood,?ML)进??行GMM-HMM训练且为每一帧赋予它所对应的状态级标注。由于GMM-HMM??建模能力相对较弱,如果直接用原始图像帧作为观测序列会因维数太高、区分??度低使得GMM-HMM无法很好拟合,导致性能较差。另一方面,手写文本行??通常文字分布非常不规则,为了提取到有效地区分性特征用于GMM-HMM建??模,我们结合前人的研宄,开发出图3.3所示的一套对离线中文文本行的特征??提取流程:??28??
【参考文献】:
期刊论文
[1]SCUT-IRAC最新手写体汉字图像样本库[J]. 金连文. 中文信息. 1998(01)
[2]手写体汉字识别中的一种新的特征提取方法——弹性网格方向分解特征[J]. 金连文,徐秉铮. 电路与系统学报. 1997(03)
[3]一种基于段化的手写汉字特征点提取方法及其实现[J]. 周昌乐,张雄伟. 电子学报. 1997(05)
[4]基于模糊方向线素特征的手写体汉字识别[J]. 马少平,夏莹,朱小燕. 清华大学学报(自然科学版). 1997(03)
本文编号:2917830
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:104 页
【学位级别】:博士
【部分图文】:
图2.1基于过切分的连续手写中文文本识别流程图及中间结果示意图(Wang??etal.,?2011)??对应的求解的数学公式即:??
;第三,传统??GMM-HMM的方法分类器过弱,且对在特征选择、训练准则、语言模型等方面??的新进展没有全面涉及。??为了解决以上问题,本论文提出基于DNN-HMM的中文连续手写识别方法。??该方法中每一个孤立字符用一个HMM表征,因此文本行可以用级联的HMM??自然表示:??火月象??C-\?;二\??!?S1?:?<?S2?V,S3?)?:?S4?)?(?S5?;>?????SI?S2?S3?S4?S5?????SI?S2?S3?S4?S5?????■:细j们m??图3.1基于HMM的中文文本行建模??考虑到DNN,我们对式(3.1)进行进一步分解:??26??
第3章基于深度神经网络-隐马尔科夫模型的中文连续手写识别方法??DNN-HMM以及LM给出最终的识别结果。??训练阶段??f图片广、???*綱早取—.GMM-HMM?_/?GMM-?(??、样jJ?1酬疋¥?1最大似然训练?t?HMM?I/-???*?强制对齐?*???分中贞???1?^rnm卜厂序列训练I???*?重对齐?* ̄??CNN-HMM??/?CNN-?(??交叉熵训练?HMM?^?j??卜T??重对齐?????f ̄ ̄文本广、?语言模型 ̄_J?i五古模型??^?数据、j1?箚练?1?口口模??识别阶段?…—丨_—??r未知样本r?j——?特征提取?一?识别器?????v?V?y?丨?I?丨?识别结果????分?贞????图3.2?DNN-HMM训练-识别系统??我们在下面小章节逐一详细介绍流程图的各个部分。??3.?2.?1特征提取??由以上可以看出,对DNN的训练基于每一帧有监督的训练且不涉及HMM。??因此在训练DNN之前,需要先基于最大似然估计(Maximum?likelihood,?ML)进??行GMM-HMM训练且为每一帧赋予它所对应的状态级标注。由于GMM-HMM??建模能力相对较弱,如果直接用原始图像帧作为观测序列会因维数太高、区分??度低使得GMM-HMM无法很好拟合,导致性能较差。另一方面,手写文本行??通常文字分布非常不规则,为了提取到有效地区分性特征用于GMM-HMM建??模,我们结合前人的研宄,开发出图3.3所示的一套对离线中文文本行的特征??提取流程:??28??
【参考文献】:
期刊论文
[1]SCUT-IRAC最新手写体汉字图像样本库[J]. 金连文. 中文信息. 1998(01)
[2]手写体汉字识别中的一种新的特征提取方法——弹性网格方向分解特征[J]. 金连文,徐秉铮. 电路与系统学报. 1997(03)
[3]一种基于段化的手写汉字特征点提取方法及其实现[J]. 周昌乐,张雄伟. 电子学报. 1997(05)
[4]基于模糊方向线素特征的手写体汉字识别[J]. 马少平,夏莹,朱小燕. 清华大学学报(自然科学版). 1997(03)
本文编号:2917830
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2917830.html