当前位置:主页 > 管理论文 > 移动网络论文 >

端到端文本验证码识别

发布时间:2020-03-22 01:26
【摘要】:验证码又称为全自动区分计算机和人类的图灵测试。目前,验证码在各类网站中,就是被用于区分恶意机器和合法人类用户的一层安全防御机制。网站中目前部署最多的验证码包括文本验证码、图像验证码,由于基于图像的验证码需要更大的带宽和更多的平台限制,所以文本验证码是目前验证码中部署应用最广泛的验证码。目前对于文本验证码的识别,大都还使用基于字符分割的识别算法,这种算法每识别一种验证码,就需要精心设计一个特定的分割算法,过程十分的繁琐,且不具备不同验证码之间的普适性。随着深度学习技术的逐渐成熟,问题就会产生:首先,是否存在一种算法,无需预处理和字符分割,就可以端到端的整体识别验证码,其次就是,该算法是否具有良好的通用性和高效性。本文对上述的两个问题进行了深入的研究和探讨,本文的主要研究工作分为以下两部分内容:(1)提出一个端到端单步识别验证码的通用算法。从最早期的简单无噪声的文本验证码相继被研究者们破解后,验证码形式就逐步的向复杂的、难以辨认的方向发展。验证码图像中包含了复杂的图片背景干扰、字符粘连、扭曲,字符与字符之间难以找到一个有效的分割方法,这些都会给整体识别验证码带来一定的困难,所以为了能够最终达到较高的通用性和高效性,本文结合深度卷积神经网络,提出一个整体识别验证码的算法,该算法只需将验证码原图作为输入,经过训练可以直接得到输出,免去了预处理的流程,这也是该算法最大的优势之一。(2)验证该算法的通用性和有效性。首先,在线上验证码上验证该算法。挑选谷歌、百度、Yandex、微软验证码,用该算法进行识别。同时还从全球网站点击量排名前50的网站中挑选出的8个网站,包括11种不同形式的验证码。对于线上验证码,破解率为79.0%到98.3%。其次,在模拟生成的验证码上评估本文提出的方法。本文设计了一个验证码的生成系统,并用该系统生成了多种复杂度高的验证码,其中包括组合所有抵御机制、中文大字符集、图像风格迁移、选择机制、双层机制的验证码等。识别准确率在3.31%到99.97%,识别速度在0.14秒内。实验结果表明该算法具有高效性和实时性。本文还提出了一个通用的模型,可以使用一个模型同时识别多种不同的验证码。最后,本文对未来文本验证码的设计上提供了新的方向和建议。
【图文】:

对比图,基本结构,对比图,权值


图2.2 CNN 和 RNN 的基本结构对比图经网络(RecurrentNeuralNetwork,RNN)是由 JeffreyElman 构与卷积神经网络(CNN)最大的区别在于,一个基础的 CNN将前一层的输出直接传入下一层。而 RNN 主要解决与时间序.2(b)所示,RNN 的基础结构比 CNN 多了一个循环,将该循环个在时间上也进行信息传递的神经网络,,随着时间的推移,入给 t 时刻,以此类推。介绍 RNN 的相关参数和公式。图 2.2(b)中的 U、V、W 分别指的权值、隐含层到输出层 o 的权值、隐含层自循环的权值。隐式(2-1): = ( + + ) f为激励函数,b 为偏置。输出层的计算方式如式(2-2)表示:

基本结构,激励函数,输入门


图2.3 LSTM 的基本结构可以从改变激励函数或改变 RNN,该函数取值是 0 或 1,这样避免hort Term Memory Network,LST记忆的问题。M 的基本结构包含了输入门、忘记(2-4)表示,主要负责控制该时刻的 是激励函数。 表示现在的记忆刻 xt决定的,通过 tanh 激活后, = ( [ , ] + ) = tanh ( [ , ] + )(2-6)表示,主要负责控制上一时刻
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP309;TP393.092

【相似文献】

相关期刊论文 前10条

1 朱麟;;字符分割技术的研究与应用[J];科技展望;2016年34期

2 梁永贵;林江莉;陈科;;车牌图像中字符分割方法[J];微计算机信息;2009年34期

3 张玉林;张永华;;基于自组织映射神经网络的粘连字符分割[J];山东科技大学学报(自然科学版);2006年02期

4 顾弘;赵光宙;齐冬莲;孙峗;张建良;;车牌识别中先验知识的嵌入及字符分割方法[J];中国图象图形学报;2010年05期

5 马瑞;杨静宇;;一种利用灰度信息和二值信息的手写字符分割[J];计算机工程;2007年15期

6 赵海燕,白青海,裴志利;车牌字符分割前的颜色预处理[J];内蒙古民族大学学报(自然科学版);2004年02期

7 杨玉东;李莉;高云富;曲晓威;林琳;杨茜;白鹏辉;王瑜;;两种文本类型验证码字符分割提取方法[J];北华大学学报(自然科学版);2019年01期

8 周凤香;;一种新的表格字符分割算法的研究与实现[J];数字技术与应用;2016年03期

9 李文举;姜周恩;朱正强;崔晓松;;利用反馈的车牌字符分割算法[J];计算机应用与软件;2011年04期

10 王枚;王国宏;;基于伴生与互补颜色特征的车牌字符分割新方法[J];山东大学学报(工学版);2007年01期

相关会议论文 前3条

1 李冬梅;牛长流;;运动车辆的牌照识别[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年

2 胡伟平;王日凤;;基于阈值分割与区域生长的车牌识别方法[A];广西计算机学会2015年学术年会论文集[C];2015年

3 杨焯砚;徐益君;张俊如;;车牌识别算法的研究和实现[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年

相关博士学位论文 前5条

1 马瑞;非限制手写字符分割中相关技术与算法的研究[D];南京理工大学;2007年

2 李学勇;金属标牌压印凹凸字符的特征提取和识别方法研究[D];山东大学;2008年

3 陈为;基于变化方向光源的压印立体字符分割方法的研究[D];山东大学;2013年

4 陈振学;基于特征显著性的目标识别方法及其应用研究[D];华中科技大学;2007年

5 李波;基于图像分析的车辆识别与跟踪若干关键技术研究[D];华中科技大学;2011年

相关硕士学位论文 前10条

1 佘爽;对抗生成训练样本用于复杂环境下车牌端到端识别[D];广东工业大学;2019年

2 阳光;基于支持向量机和深度学习的车牌识别技术研究[D];成都理工大学;2019年

3 宋琦悦;扭曲粘连验证码识别算法研究[D];西安电子科技大学;2019年

4 程舟航;端到端文本验证码识别[D];西安电子科技大学;2019年

5 黄良俊;复杂环境下的车牌识别算法研究[D];合肥工业大学;2019年

6 翁祖辉;单指针与数字式仪表远程读数识别定位研究[D];电子科技大学;2019年

7 林惠;基于深度学习的芯片字符实时识别方法研究[D];华中科技大学;2019年

8 骆俊;复杂条件下车牌识别方法的研究与实现[D];西南石油大学;2018年

9 阿萨(Asad Khan);基于彩色图像检测的车牌自动分割与识别[D];北京邮电大学;2019年

10 刘洁;实时车牌识别系统的设计与实现[D];山东大学;2019年



本文编号:2594239

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2594239.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e97c0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com