基于机器视觉的智能图书识别检测系统的设计
发布时间:2021-07-28 02:35
随着信息化社会的快速发展,民众在提升自身素质的同时对知识的渴求也与日俱增,图书馆便成为人们寻求知识的优先选择。图书馆中书籍数量及阅览人流量的增加,图书馆普遍采用开架阅览方式前提下,使用后书籍错序摆放是常见现象。将错序图书进行重新摆放成为图书馆日常必须面对的难题。传统的图书整理靠人工完成,耗时、浪费人力、易出错的缺点显而易见。随着机器视觉技术的发展和应用普及,智能技术的广泛应用及软硬件性能的不断提升,使基于机器视觉的错序图书自动识别和整理成为可能,本文研究目的是设计并实现基于机器视觉智能图书识别检测系统,以提高错序图书整理的自动化程度。本文围绕机器视觉在错序图书识别中的关键问题展开研究,针对图书边缘为直线的先验条件,采用边缘算子结合直线检测算法对图书图像进行书脊提取,基于Faster-RCNN的目标检测算法,对索书号区域进行定位提取,以达到提高索书号提取准确率的目的。并对提取得到的索书号区域中的字符分割技术进行研究,为了提高系统对字符分割的准确率,采用基于连通域分割算法对索书号进行分割。再将分割后的字符进行基于卷积神经网络的字符识别操作,识别出的索书号信息与系统数据库中预存图书顺序信息进...
【文章来源】:沈阳工业大学辽宁省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
智能图书识别检测系统工作流程
第2章相关理论与技术7图2.1Sobel算子矩阵模板Fig.2.1Sobeloperatormatrixtemplate2.2.2Canny算子边缘检测Canny算子广泛应用于各种视觉环境中的边缘检测并具有定位准确、错误率低、单边响应等优点。兼具实现过程简单和全部符合检测标准的优势,是边缘检测中广泛使用的算法之一。Canny边缘检测效果的准则包括信噪比准则、定位精度准则和单边缘响应准则3个。(1)信噪比准则。信噪比为图像边缘响应函数与噪声响应平方根之商,其值越高代表提取的边缘效果越好,表达式为:(2.2)式中,n0为高斯噪声的均方根;f(x)为范围大小为[]的滤波器脉冲响应;G(-x)为边缘函数。(2)定位精度准则。已定位的边缘要与真实边缘相近,即将被标记为边缘的点与真实边缘的中心点距离控制为最校Localization越大则定位精度越高,表达式为:(2.3)(3)单边缘响应准则。单一边缘点有且仅有一个,表达式为:21"")()()(2=++dxxfdxxffD(2.4)2.2.3Laplace算子边缘检测拉普拉斯算子是最简单的各向同性微分算子之一,具有旋转不变性。在拉普拉斯算子检测时,图像的噪声会产生很强的响应,可导致图像边缘检测错误现象发生。因此,使用拉普拉斯算子检测时有必要对图像去噪处理。++=dxxfndxxfxGSNR)()()(2-0--+,dxxfndxxfxGL)()()(nocalizatio2"0""++=
沈阳工业大学硕士学位论文8拉普拉斯算子是常用的二阶导数算子。平滑过的阶跃边缘二阶导数是一个在边缘点处过零的函数。函数f(x,y)的拉普拉斯算子公式为:(2.5)以点为中心的近似式为:(2.6)(2.7)将(2.6)和(2.7)两式合并为一个算子,用近似的拉普拉斯算子模板表示:(2.8)图2.2不同边缘检测算子处理后的效果图Fig.2.2EffectofdifferentedgedetectionoperatorsSobel边缘算子抗噪性好,计算量小,噪声低的图像边缘有较好的边缘检测检测效果,混合度高且噪声多的图像边缘定位精度不够高效果不理想。Laplace边缘算子对边缘敏感,可能有些是噪声的边缘,也被计算到边缘范围。图像边缘检测过程,使得噪声部分得到加强,易丢失边缘信息,边缘检测结果较容易出现不连续性。22222yfxff+=ji),()1,(),(2)1,(22++=jifjifjifxf),1(),(2),1(22jifjifjifyf++==0101410102
【参考文献】:
期刊论文
[1]基于Faster-RCNN的车牌检测[J]. 艾曼. 计算机与数字工程. 2020(01)
[2]基于Faster RCNN的车牌检测算法[J]. 秦丽娟,赵宇辉. 电子世界. 2019(24)
[3]物联网技术在智慧图书馆中的应用研究[J]. 郭晓柯. 无线互联科技. 2019(22)
[4]基于Faster RCNN的交通目标检测方法[J]. 张琦,丁新涛,王万军,周文. 皖西学院学报. 2019(05)
[5]基于混合神经网络的车牌字符识别技术[J]. 张长青,杨楠. 电子科技. 2019(09)
[6]卷积神经网络在手写字符识别中的应用[J]. 丁蒙,戴曙光,于恒. 软件导刊. 2020(01)
[7]卷积神经网络在车牌字符识别中的应用[J]. 童朝娣. 电子技术与软件工程. 2019(01)
[8]基于深度卷积网络的目标检测综述[J]. 吴帅,徐勇,赵东宁. 模式识别与人工智能. 2018(04)
[9]基于SSD卷积网络的视频目标检测研究[J]. 杨洁,陈明志,吴智秦,陈灵娜,林颖. 南华大学学报(自然科学版). 2018(01)
[10]基于卷积神经网络的自然背景字符识别[J]. 郁松,彭志文. 计算机应用与软件. 2017(12)
博士论文
[1]基于卷积神经网络的场景文本定位及多方向字符识别研究[D]. 朱安娜.华中科技大学 2016
硕士论文
[1]基于卷积神经网络的手写字符识别[D]. 王松.长安大学 2019
[2]自然场景下的车牌检测与识别算法研究[D]. 牛博雅.北京交通大学 2015
[3]基于OCR视频字符识别技术研究与实现[D]. 黄遥.北京交通大学 2014
[4]直线提取算法研究[D]. 王旭.国防科学技术大学 2013
[5]复杂背景下的快速车牌识别技术研究[D]. 查志强.南京理工大学 2013
[6]层次聚类算法的研究及应用[D]. 段明秀.中南大学 2009
本文编号:3307023
【文章来源】:沈阳工业大学辽宁省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
智能图书识别检测系统工作流程
第2章相关理论与技术7图2.1Sobel算子矩阵模板Fig.2.1Sobeloperatormatrixtemplate2.2.2Canny算子边缘检测Canny算子广泛应用于各种视觉环境中的边缘检测并具有定位准确、错误率低、单边响应等优点。兼具实现过程简单和全部符合检测标准的优势,是边缘检测中广泛使用的算法之一。Canny边缘检测效果的准则包括信噪比准则、定位精度准则和单边缘响应准则3个。(1)信噪比准则。信噪比为图像边缘响应函数与噪声响应平方根之商,其值越高代表提取的边缘效果越好,表达式为:(2.2)式中,n0为高斯噪声的均方根;f(x)为范围大小为[]的滤波器脉冲响应;G(-x)为边缘函数。(2)定位精度准则。已定位的边缘要与真实边缘相近,即将被标记为边缘的点与真实边缘的中心点距离控制为最校Localization越大则定位精度越高,表达式为:(2.3)(3)单边缘响应准则。单一边缘点有且仅有一个,表达式为:21"")()()(2=++dxxfdxxffD(2.4)2.2.3Laplace算子边缘检测拉普拉斯算子是最简单的各向同性微分算子之一,具有旋转不变性。在拉普拉斯算子检测时,图像的噪声会产生很强的响应,可导致图像边缘检测错误现象发生。因此,使用拉普拉斯算子检测时有必要对图像去噪处理。++=dxxfndxxfxGSNR)()()(2-0--+,dxxfndxxfxGL)()()(nocalizatio2"0""++=
沈阳工业大学硕士学位论文8拉普拉斯算子是常用的二阶导数算子。平滑过的阶跃边缘二阶导数是一个在边缘点处过零的函数。函数f(x,y)的拉普拉斯算子公式为:(2.5)以点为中心的近似式为:(2.6)(2.7)将(2.6)和(2.7)两式合并为一个算子,用近似的拉普拉斯算子模板表示:(2.8)图2.2不同边缘检测算子处理后的效果图Fig.2.2EffectofdifferentedgedetectionoperatorsSobel边缘算子抗噪性好,计算量小,噪声低的图像边缘有较好的边缘检测检测效果,混合度高且噪声多的图像边缘定位精度不够高效果不理想。Laplace边缘算子对边缘敏感,可能有些是噪声的边缘,也被计算到边缘范围。图像边缘检测过程,使得噪声部分得到加强,易丢失边缘信息,边缘检测结果较容易出现不连续性。22222yfxff+=ji),()1,(),(2)1,(22++=jifjifjifxf),1(),(2),1(22jifjifjifyf++==0101410102
【参考文献】:
期刊论文
[1]基于Faster-RCNN的车牌检测[J]. 艾曼. 计算机与数字工程. 2020(01)
[2]基于Faster RCNN的车牌检测算法[J]. 秦丽娟,赵宇辉. 电子世界. 2019(24)
[3]物联网技术在智慧图书馆中的应用研究[J]. 郭晓柯. 无线互联科技. 2019(22)
[4]基于Faster RCNN的交通目标检测方法[J]. 张琦,丁新涛,王万军,周文. 皖西学院学报. 2019(05)
[5]基于混合神经网络的车牌字符识别技术[J]. 张长青,杨楠. 电子科技. 2019(09)
[6]卷积神经网络在手写字符识别中的应用[J]. 丁蒙,戴曙光,于恒. 软件导刊. 2020(01)
[7]卷积神经网络在车牌字符识别中的应用[J]. 童朝娣. 电子技术与软件工程. 2019(01)
[8]基于深度卷积网络的目标检测综述[J]. 吴帅,徐勇,赵东宁. 模式识别与人工智能. 2018(04)
[9]基于SSD卷积网络的视频目标检测研究[J]. 杨洁,陈明志,吴智秦,陈灵娜,林颖. 南华大学学报(自然科学版). 2018(01)
[10]基于卷积神经网络的自然背景字符识别[J]. 郁松,彭志文. 计算机应用与软件. 2017(12)
博士论文
[1]基于卷积神经网络的场景文本定位及多方向字符识别研究[D]. 朱安娜.华中科技大学 2016
硕士论文
[1]基于卷积神经网络的手写字符识别[D]. 王松.长安大学 2019
[2]自然场景下的车牌检测与识别算法研究[D]. 牛博雅.北京交通大学 2015
[3]基于OCR视频字符识别技术研究与实现[D]. 黄遥.北京交通大学 2014
[4]直线提取算法研究[D]. 王旭.国防科学技术大学 2013
[5]复杂背景下的快速车牌识别技术研究[D]. 查志强.南京理工大学 2013
[6]层次聚类算法的研究及应用[D]. 段明秀.中南大学 2009
本文编号:3307023
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3307023.html