基于卷积神经网络的验证码字符识别研究
发布时间:2021-10-31 00:43
基于文本的验证码广泛部署于各种需要身份验证的门户网站,是互联网安全机制中重要的一环。对文本验证码的安全性和可用性进行分析,有助于提高网站对抗恶意攻击的能力,保证用户的信息安全,维护安全的网络环境。本文围绕基于卷积神经网络对验证码字符进行识别的问题展开研究,着力于提高神经网络识别准确度,降低实现结构的复杂度。本文的工作一方面可以为文本验证码的设计和可用性提供建议,另一方面为使用卷积神经网络完成具有挑战性的场景文本识别提供了新的研究思路。本文的主要工作如下:首先,分析了影响验证码字符安全机制的因素,分析其反分割与反识别的效果。研究了图像识别领域的主流算法卷积神经网络,对其基本理论和实现结构进行分析。介绍了卷积神经网络的各个实现模块,包括卷积操作、池化采样、激活函数和正则化方法,重点对卷积层中的激活函数的适用范围和使用条件进行分析。对经典的卷积神经网络模型进行仿真,展示了CNN、ResNet和Xception网络对验证码字符的识别性能。其次,在卷积神经网络的基础上,结合自归一化神经网络中的缩放指数型线性单元,引进自归一化属性,提出一种自标准化卷积神经网络。该归一化效果可以保证多层级训练的鲁棒...
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:103 页
【学位级别】:硕士
【部分图文】:
铁路12306图像验证码12306网站的图像验证码如图1.1所示,验证码是一张整体的图片,包括文字提示
第一章绪论3reCAPTCHA是Google提供的一种用于身份验证的基于图像的验证码,用户需要按照文字提示,对相应的图片做出操作,该机制通过这一互动环节预测用户的行为,返回用户的流量分数,作为区分人类与计算机程序的依据。这类图像验证码需要强大的算法保证评判的正确性,同时要保证图片库的容量来对抗恶意程序的暴力破解。图1.2GooglereCAPTCHA基于图像的验证码机制很难实现自动生成,并且需要完成标签和图像的匹配,其生成机制相比基于文本的验证码更加复杂,因此其使用范围受到了限制[8]。同时,寻找提高验证码机制安全性与保证用户体验之间的平衡是图像验证码设计者需要深入研究的课题。3.其他验证码机制除上述两类验证码,其他类型的验证码也存在于需要身份验证的场景,如基于语音的验证码机制,基于视频的验证码机制,互动验证码机制等。基于语音的验证码通常是服务于有视力障碍的人群,该类验证码将有效信息与噪声合成在一段语音中,用户需要反馈其获得的语音信息[9]。这种验证方式经常被各大运营商选用,用于确定用户身份,完成服务评价和个人信息安全维护。语音验证码的识别需要将语音信号处理相关知识,结合神经网络算法,对语音的时域或频域特征进行提龋目前针对非连续的语音验证码,已经可以使用两相法完成识别[10]。语音验证码需要提前录制和大量的语料库,同时由于受到通信质量和通话环境的限制,语音验证码可用性不高[11]。基于视频的验证码,是将字母和数字等字符以动态的形式嵌入到视频格式中。与基于文本的验证码类似,基于视频的验证码会对字符进行旋转、扭曲、加入噪线以及复杂背景等,增加计算机程序识别的难度[12]。由于基于视频的验证码字符的有效信息并不会在同一帧共存,提取验证码中的有效信息变得更加
第二章文本验证码数据集简介及卷积神经网络基础15Microsoft’s(single-layerscheme)50.9%Microsoft’s(two-layerscheme)65.8%Sina(2017)75.0%Weibo51.2%Yandex56.0%PayPal67.4%Apple47.3%结合以上关于文本验证码识别的最新研究成果,reCAPTCHA、BotDetect、PayPal和Ya-hoo四种验证码不再安全,识别Baidu、Taobo、PayPal和eBay等验证码的技术相对成熟。本文选择新浪(2017)为代表的CCT验证码和腾讯的空心验证码作为研究对象,来补充该领域对CCT验证码和空心验证码的研究。另一方面,当前方法中使用的神经网络多基于早期的LeNet-5进行改进,卷积神经网络在近几年的发展过程中已经出现了众多适用于不同目标的网络模型,研究基于卷积神经网络识别验证码字符的方法具有重要的理论意义和研究价值。本文选择空心文本验证码和字符粘连文本验证码作为各类卷积神经网络处理的对象,用以对比不同卷积神经网络之间的识别性能。需要说明的是,本文使用的空心验证码为腾讯公司公开的数据集,CCT的验证码来自开源的验证码库captcha。两种数据集的验证码实例如图2.1所示。图2.1显示CCT验证码的主要防御机制是使用字符粘连重叠以及遮挡线,腾讯验证码采用了复杂的背景,两种验证码都将不同大小的字符进行旋转以增加识别难度。图2.1本文使用的两种验证码数据集
本文编号:3467719
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:103 页
【学位级别】:硕士
【部分图文】:
铁路12306图像验证码12306网站的图像验证码如图1.1所示,验证码是一张整体的图片,包括文字提示
第一章绪论3reCAPTCHA是Google提供的一种用于身份验证的基于图像的验证码,用户需要按照文字提示,对相应的图片做出操作,该机制通过这一互动环节预测用户的行为,返回用户的流量分数,作为区分人类与计算机程序的依据。这类图像验证码需要强大的算法保证评判的正确性,同时要保证图片库的容量来对抗恶意程序的暴力破解。图1.2GooglereCAPTCHA基于图像的验证码机制很难实现自动生成,并且需要完成标签和图像的匹配,其生成机制相比基于文本的验证码更加复杂,因此其使用范围受到了限制[8]。同时,寻找提高验证码机制安全性与保证用户体验之间的平衡是图像验证码设计者需要深入研究的课题。3.其他验证码机制除上述两类验证码,其他类型的验证码也存在于需要身份验证的场景,如基于语音的验证码机制,基于视频的验证码机制,互动验证码机制等。基于语音的验证码通常是服务于有视力障碍的人群,该类验证码将有效信息与噪声合成在一段语音中,用户需要反馈其获得的语音信息[9]。这种验证方式经常被各大运营商选用,用于确定用户身份,完成服务评价和个人信息安全维护。语音验证码的识别需要将语音信号处理相关知识,结合神经网络算法,对语音的时域或频域特征进行提龋目前针对非连续的语音验证码,已经可以使用两相法完成识别[10]。语音验证码需要提前录制和大量的语料库,同时由于受到通信质量和通话环境的限制,语音验证码可用性不高[11]。基于视频的验证码,是将字母和数字等字符以动态的形式嵌入到视频格式中。与基于文本的验证码类似,基于视频的验证码会对字符进行旋转、扭曲、加入噪线以及复杂背景等,增加计算机程序识别的难度[12]。由于基于视频的验证码字符的有效信息并不会在同一帧共存,提取验证码中的有效信息变得更加
第二章文本验证码数据集简介及卷积神经网络基础15Microsoft’s(single-layerscheme)50.9%Microsoft’s(two-layerscheme)65.8%Sina(2017)75.0%Weibo51.2%Yandex56.0%PayPal67.4%Apple47.3%结合以上关于文本验证码识别的最新研究成果,reCAPTCHA、BotDetect、PayPal和Ya-hoo四种验证码不再安全,识别Baidu、Taobo、PayPal和eBay等验证码的技术相对成熟。本文选择新浪(2017)为代表的CCT验证码和腾讯的空心验证码作为研究对象,来补充该领域对CCT验证码和空心验证码的研究。另一方面,当前方法中使用的神经网络多基于早期的LeNet-5进行改进,卷积神经网络在近几年的发展过程中已经出现了众多适用于不同目标的网络模型,研究基于卷积神经网络识别验证码字符的方法具有重要的理论意义和研究价值。本文选择空心文本验证码和字符粘连文本验证码作为各类卷积神经网络处理的对象,用以对比不同卷积神经网络之间的识别性能。需要说明的是,本文使用的空心验证码为腾讯公司公开的数据集,CCT的验证码来自开源的验证码库captcha。两种数据集的验证码实例如图2.1所示。图2.1显示CCT验证码的主要防御机制是使用字符粘连重叠以及遮挡线,腾讯验证码采用了复杂的背景,两种验证码都将不同大小的字符进行旋转以增加识别难度。图2.1本文使用的两种验证码数据集
本文编号:3467719
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3467719.html
最近更新
教材专著