基于卷积神经网络的脱机手写汉字识别与目标检测研究
发布时间:2024-07-10 18:54
图像分类与检测属于计算机视觉领域重要的研究课题。本文首先研究图像分类问题,然后进一步深入研究图像目标检测。对于图像分类问题本文选择脱机手写汉字识别来进行研究。对于图像目标检测本文将分析现有的目标检测算法及其存在的不足,并对其进行改进。本文将基于深度学习中的卷积神经网络算法对脱机手写汉字识别和目标检测进行研究。主要研究内容如下:(1)由于传统脱机手写汉字识别的过程复杂、精度低;而常用卷积神经网络的特征信息提取不充分。因此,本文设计了网络模型CharacterNet。首先,通过多级堆叠的特征分组提取模块,提取图像的深层抽象特征信息,并进行特征信息之间的交流融合;然后,利用设计的下采样和通道扩增模块,在降低特征维度的同时保留图像重要信息。最后,将特征信息进行精炼和浓缩,来解决特征信息的重叠和冗余问题。本文使用包含3755个汉字的CASIA-HWDB(V1.1)数据集对模型进行训练和测试,实验结果验证了模型的有效性。(2)针对SSD目标检测算法平均检测精度低,尤其对小目标的检测问题经常出现漏检和误检的问题,本文基于VGG网络设计了多尺度融合的目标检测算法MFSSD。在算法中使用分步卷积拆分算法...
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
本文编号:4004577
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
图2-11AlexNet网络模型
燕山大学工学硕士学位论文-18-图2-11AlexNet网络模型(2)VGGNet网络继AlexNet网络之后,牛津大学工程系利用3×3大小的卷积核来增加卷积神经网络的深度,并提出VGGNet网络模型。VGGNet网络通过加深网络结构,所以提取的特征更加丰富和抽象。此外,网络最后....
图3-5特征分组示意图
燕山大学工学硕士学位论文-24-1133输入特征分组特征整合+输出特征整合特征整合特征整合特征整合特征整合特征整合特征整合特征整合5577553333111133333311图3-4改进网络模块2图3-5特征分组示意图虽然网络宽度的增加对提升网络性能有很大帮助,但是随着宽度增加无....
图3-13训练损失
燕山大学工学硕士学位论文-36-习率设置为一个固定的经验值,此时网络的训练会达到比较不错的效果,但是训练后期会出现平台期,甚至出现效果下降的问题。基于以上问题本文根据训练情况对学习率采取经验的手动调整,首先,将学习率设置为0.1来加快收敛速度;然后,当训练到40000步时将学习率....
图3-14训练准确率
燕山大学工学硕士学位论文-36-习率设置为一个固定的经验值,此时网络的训练会达到比较不错的效果,但是训练后期会出现平台期,甚至出现效果下降的问题。基于以上问题本文根据训练情况对学习率采取经验的手动调整,首先,将学习率设置为0.1来加快收敛速度;然后,当训练到40000步时将学习率....
本文编号:4004577
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/4004577.html