基于深度学习的盲文自动识别研究

发布时间：2020-06-12 07:35

【摘要】：盲文作为视障人群文字交流的工具,使数千万盲人的书写和阅读成为可能,盲文自动识别研究对盲人学校教师、盲文古籍管理人员和盲人监护人等具有十分重要的意义。目前已有的盲文识别方法需要严格的图像采集环境和仪器设备,实用性较差,而且识别过程需要一定的人工预处理操作,无法实现盲文自动识别。针对以上问题,本文对已有的研究工作进行总结,结合灰度投影积分法和深度学习方法对盲文图像的自动校正、自动分割和盲文识别几个部分分别进行了实验研究,构建基于深度学习的盲文自动识别系统。本文主要研究内容如下:首先,根据盲文字符中同一行或同一列盲方几何对正这一特点,本文提出一种基于灰度投影积分图的盲文校正方法,根据盲文灰度投影积分图与盲文偏转角度之间的规律,确定盲文偏转角度予以校正。实验表明,此方法成功实现盲文的偏转校正。其次,针对盲文所有盲点互不连通而无法使用一般文字分割方法这一问题,本文通过灰度投影积分图确定盲点位置,以灰度柱的固定规律寻找相邻盲方的中线做分割线,横竖分割线共同作用将所有盲文字符相互分离。使用此方法对大篇幅盲文字符进行分割时,取得了十分出色的效果。最后,针对传统盲文识别研究中手工定义特征点、识别率低等缺陷,结合在图像识别领域发挥巨大威力的深度学习技术,进行了基于深度神经网络的盲文识别研究。实验中利用caffe框架改进构建了多种不同结构的卷积神经网络,采用稀疏表示更强的PRe LU激活函数代替Re LU激活函数以避免网络训练时神经元“死亡”和梯度消失等问题;以Dropconnect代替一般Dropout,在防止训练过拟合的同时增强了网络的特征学习能力。用针对特征提取层、全连接层和数据集图像尺寸等因素设置了对比实验,通过各网络模型的识别准确率和运算速度对比,确定最佳网络模型。在实验数据集的制作中,充分考虑盲文识别的实际使用情况,在多种实际环境中采集盲文图像并进行噪声添加处理,以提高盲文识别系统的鲁棒性。实验结果表明,本文方法对盲文识别准确率超过99%,极大的提高了盲文识别系统的精度和实用性,对于相关仪器的研究和开发具有一定意义。
【图文】：

盲文,矩形框,黑色,霍夫变换

介盲文识别研究中设计了专用的纸介条长条状光源在同一水平面围成四边过固定在其顶部的图像采集设备进行盲文资料受光均匀，因为此装置中光少数几张盲文图片的采集，在其他状机作为盲文图像采集设备，这在一定程一般文字的特点，它是由多个盲点组成其中每个盲点与其他盲点不连通且相斜的连线上拥有数量最多的盲点，这就变换[42](Hough Transform)在校正盲文行的纸介盲文自动识别研究中，如图黑色矩形框的方法给定参照物，采用霍出倾斜角，进行图像倾斜校正。

二值图像,图像二值化,盲文

将这个最大值赋值给参数点指定的像素，这就使二值图像的高亮区域得到“粗化”或“增长”。图3.4 展示了利用大律法和“膨胀”形态学图像处理方法对盲文图像进行二值化处理的效果。图 3.4 图像二值化3.2.2 图像校正方法本文提出一种基于灰度投影积分图的方法来完成倾斜盲文图像的自动校正。此方法的作用原理为：若盲文图像中盲文方向不存在误差，即每一行盲文字符都呈水平排列时，将此盲文图像对水平方向和竖直方向分别进行灰度投影积分[45,46]，则盲文字符中同一行盲点的水平灰度投影会叠加在相同位置，形成一条细长的水平灰度柱，同一列盲点的竖直投影积分会形成一条细长的竖直灰度柱，一幅盲文图像的多行盲点和多列盲点的投影会得到多条细长的灰度柱。若盲文图像中盲文方向存在角度误差，，会使同一直线盲点的灰度投影落在更大范围内，其投影灰度柱长度变短，更集中于底部。在一定角度范围内，盲文方向偏转角度越大，其图像的灰度投影积分在底部的集中程度会越高。结合这一特点，将盲文图像旋转不同角度，分别做灰度投影积分图，通过比较偏转不同角度情况下投影积分灰
【学位授予单位】：昆明理工大学
【学位级别】：硕士
【学位授予年份】：2018
【分类号】：H126.2;TP183

【参考文献】