当前位置:主页 > 科技论文 > 自动化论文 >

扭曲粘连验证码识别算法研究

发布时间:2020-10-27 04:31
   验证码是用于区分移动终端是计算机还是人类的全自动程序,被广泛应用于国内外各大网站,它在一定程度上保障了互联网安全,防止计算机程序暴力破解、网络灌水等恶意事件的发生。为保证验证码的安全性和可靠性,验证码识别技术应运而生。目前,验证码形式丰富,常用的有文本验证码、拼图验证码、滑块验证码、图像验证码等,本文主要针对文本验证码的识别展开研究。本文在验证码识别算法研究的第一阶段与第二阶段采用基于字符分割的识别模式,第三阶段利用深度学习实现端到端的验证码识别。分别选取学校就业信息网、京东商城以及腾讯验证码进行识别,具体工作如下:(1)针对就业信息网验证码字符中间有阴影,使用单一的字符分割方法难以正确分割的问题,改进字符图像分割算法,提出一种自适应调整分割的方法。首先通过连通域标记法将具有连通性的字符分割出来,基于验证码先验知识,判断分割字符数是否正确,然后结合垂直投影分割法进行分割校正,最终实现验证码字符的准确分割,相比于颜色填充法与单一字符分割法,该方法可以在不增加算法复杂性的情况下,解决字符中间有阴影难以正确分割的问题。(2)针对传统图像分割方法对字符共用笔划验证码过度分割导致笔划断裂问题,提出改进滴水算法分割验证码。首先建立验证码细化图像特征点,对验证码特征进行聚类分析,在候选区域内确定水滴出发点,建立水滴滚动位置选择函数。初始水滴按照提取出的重叠字符骨架滚动,水滴到达骨架末端时将继续沿着骨架倾斜方向滴落,直到遇到字符粘连部分的边界,水滴走过的轨迹即为粘连字符切分路径。本文对共用笔划字符利用该方法进行分割,由试验结果表明,针对此类型验证码,改进算法相比于传统滴水算法与竖直切分法分割成功率更高。将分割获得的单个字符利用8层卷积神经网络进行预测识别,最终识别结果为4个字符序列,平均每张识别时间为0.46秒,识别正确率达到88%。(3)针对验证码存在扭曲、粘连、字符空心并且存在大面积阴影块噪声的问题,若使用先分割再识别的模式,识别结果将严重依赖预处理效果以及字符分割结果,所以对此类验证码的识别本文去掉了字符分割步骤,利用卷积神经网络实现验证码端到端识别。主要包括建立海量数据集,然后使用Keras框架建模,利用ImageNet预训练好的XCeption模型进行迁移学习,完成验证码字符的26分类,该模型对验证码的识别率达到75%,满足验证码破解的基本需求。
【学位单位】:西安电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP391.41;TP18
【部分图文】:

二值化图,坐标系,水滴,验证码


滴落规则若被分割验证码图片为I,是高宽分别为N、M的二值化图片,建立坐标系如图4.3[45]。 水滴当前位置为(xi, yi),T 为水滴滚动函数,则T (xi+1, yi+1) = f (xi, yi, Wi)23

投影直方图,算法,粘连字符,单个字符


第四章 改进滴水算法的粘连字符分割方法当水滴到达重叠笔画骨架末端后继续沿着骨架倾斜方向滴落,直到水滴到达字符粘连笔画的边界,改进滴水算法流程如图4.4。图4.4改进滴水算法4.2.1定义候选分割点(1)粘连字符区块的提取连通域分割法将二值化后验证码图像I(x,y) : {1,..., m} × {1,..., n} → {0, 1},初步分割为几个字符区块Ii(x, y)(i = 1, 2 . . . N )。如图4.5对字符块“Y”、“N4”、“3”作垂直投影。计算连通区块“Y”、“N4”、“3”的投影区域宽度Li(i = 1, 2 . . . N )。基于对大量京东商城粘连字符和单个字符的宽度统计,定义L为单个字符宽度阈值。比较单个字符块投影区域宽度与阈值L,如果宽度Li大于最大字符宽度L,则被认为图4.5连通域投影直方图是粘连字符块,否则将被视为单个字符。图4.5为连通域投影直方图。通过连通域分25

投影直方图,投影直方图,连通域,粘连字符


连通域投影直方图
【相似文献】

相关期刊论文 前10条

1 朱麟;;字符分割技术的研究与应用[J];科技展望;2016年34期

2 梁永贵;林江莉;陈科;;车牌图像中字符分割方法[J];微计算机信息;2009年34期

3 张玉林;张永华;;基于自组织映射神经网络的粘连字符分割[J];山东科技大学学报(自然科学版);2006年02期

4 顾弘;赵光宙;齐冬莲;孙赟;张建良;;车牌识别中先验知识的嵌入及字符分割方法[J];中国图象图形学报;2010年05期

5 马瑞;杨静宇;;一种利用灰度信息和二值信息的手写字符分割[J];计算机工程;2007年15期

6 赵海燕,白青海,裴志利;车牌字符分割前的颜色预处理[J];内蒙古民族大学学报(自然科学版);2004年02期

7 杨玉东;李莉;高云富;曲晓威;林琳;杨茜;白鹏辉;王瑜;;两种文本类型验证码字符分割提取方法[J];北华大学学报(自然科学版);2019年01期

8 周凤香;;一种新的表格字符分割算法的研究与实现[J];数字技术与应用;2016年03期

9 李文举;姜周恩;朱正强;崔晓松;;利用反馈的车牌字符分割算法[J];计算机应用与软件;2011年04期

10 王枚;王国宏;;基于伴生与互补颜色特征的车牌字符分割新方法[J];山东大学学报(工学版);2007年01期


相关博士学位论文 前5条

1 马瑞;非限制手写字符分割中相关技术与算法的研究[D];南京理工大学;2007年

2 李学勇;金属标牌压印凹凸字符的特征提取和识别方法研究[D];山东大学;2008年

3 陈为;基于变化方向光源的压印立体字符分割方法的研究[D];山东大学;2013年

4 陈振学;基于特征显著性的目标识别方法及其应用研究[D];华中科技大学;2007年

5 李波;基于图像分析的车辆识别与跟踪若干关键技术研究[D];华中科技大学;2011年


相关硕士学位论文 前10条

1 赵英彬;基于深度学习的车牌识别技术的研究与应用[D];东华大学;2019年

2 黄良俊;复杂环境下的车牌识别算法研究[D];合肥工业大学;2019年

3 翁祖辉;单指针与数字式仪表远程读数识别定位研究[D];电子科技大学;2019年

4 林惠;基于深度学习的芯片字符实时识别方法研究[D];华中科技大学;2019年

5 阳光;基于支持向量机和深度学习的车牌识别技术研究[D];成都理工大学;2019年

6 佘爽;对抗生成训练样本用于复杂环境下车牌端到端识别[D];广东工业大学;2019年

7 宋琦悦;扭曲粘连验证码识别算法研究[D];西安电子科技大学;2019年

8 程舟航;端到端文本验证码识别[D];西安电子科技大学;2019年

9 骆俊;复杂条件下车牌识别方法的研究与实现[D];西南石油大学;2018年

10 阿萨(Asad Khan);基于彩色图像检测的车牌自动分割与识别[D];北京邮电大学;2019年



本文编号:2858040

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2858040.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0a8e1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com