当前位置:主页 > 管理论文 > 领导决策论文 >

不平衡多变量可变长度的鼠标轨迹识别方法研究

发布时间:2022-12-06 04:53
  随着互联网行为式验证码技术的发展,以拖动滑块为代表的鼠标轨迹识别因其传输数据小、暴力破解难度大等特点,广泛运用于多种人机验证产品中。但是攻击者可通过黑产工具产生类人轨迹批量操作以绕过检测,并在对抗过程中不断升级其伪造数据以持续绕过同样升级的检测技术。因此可利用机器学习算法建立有效的鼠标轨迹识别模型,以提高人机验证中各种机器行为的检出率。鼠标轨迹是用户拖动滑块时采样获得的水平方向x、垂直方向y和时间t三个维度的轨迹点集,不同于传统时间序列,它具有多变量、可变长度、数据不平衡、标记样本少等特点。由于这些特点,使得传统的时间序列分类方法并不能直接应用于鼠标轨迹识别,当前有关鼠标轨迹识别方法也未能针对这些特点进行系统性解决。基于此,本文对鼠标轨迹识别问题进行了深入研究,提出了一种结合特征组分层和半监督学习的鼠标轨迹识别方法。主要研究内容如下:1.针对鼠标轨迹多变量、可变长度的问题,采用基于特征的方法,从不同视角构建基础特征和辅助特征。具体地,从t-x维度提取特征作为基础特征,用于描述人机轨迹差异性;从t-y维度提取特征作为辅助特征,用于辅助判断,增加轨迹识别置信度。此外,为进行特征降维,提出了... 

【文章页数】:75 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
注释表
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
    1.3 论文研究的主要内容
    1.4 论文组织结构
第2章 相关理论与技术
    2.1 鼠标轨迹数据概述
    2.2 数据不平衡问题
        2.2.1 不平衡数据集
        2.2.2 数据平衡方法
    2.3 特征选择概述
    2.4 随机森林算法
    2.5 半监督学习
        2.5.1 半监督学习概述
        2.5.2 半监督分类理论
    2.6 本章小结
第3章 基于随机森林的包裹式特征选择算法
    3.1 整体设计方案
    3.2 特征设计
        3.2.1 数据预处理
        3.2.2 特征提取
    3.3 基于不平衡数据的随机森林特征重要性度量
        3.3.1 随机森林特征重要性度量
        3.3.2 改进随机森林特征重要性度量
    3.4 基于随机森林的包裹式特征选择算法
        3.4.1 特征选择方法现存问题分析
        3.4.2 基于随机森林的特征选择算法
    3.5 本章小结
第4章 结合特征组分层和半监督学习的鼠标轨迹识别算法
    4.1 算法的提出
    4.2 算法原理
        4.2.1 单视角随机森林分类器的训练和预测过程
        4.2.2 单视角随机森林分类器的迭代过程
        4.2.3 多视角随机森林分类器的分类识别过程
    4.3 算法描述
    4.4 算法有效性分析
    4.5 本章小结
第5章 算法验证与结果分析
    5.1 实验环境与评价指标
    5.2 结果与分析
        5.2.1 特征选择算法实验结果及分析
        5.2.2 鼠标轨迹识别算法实验结果及分析
    5.3 本章小结
第6章 总结与展望
    6.1 工作总结
    6.2 研究展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果


【参考文献】:
期刊论文
[1]融合并行投票决策树和半监督学习的鼠标轨迹识别方法[J]. 孟广婷,王红,刘海燕.  小型微型计算机系统. 2018(09)
[2]基于梯度提升决策树的鼠标轨迹识别方法与研究[J]. 张志腾,刘琳岚.  信息通信. 2018(09)
[3]基于朴素贝叶斯的鼠标轨迹识别方法[J]. 谢苗,刘琳岚.  信息通信. 2018(09)
[4]基于梯度提升模型的行为式验证码人机识别[J]. 欧阳志友,孙孝魁.  信息网络安全. 2017(09)
[5]基于随机森林的特征选择算法[J]. 姚登举,杨静,詹晓娟.  吉林大学学报(工学版). 2014(01)

博士论文
[1]基于半监督学习的不平衡数据分类算法与应用[D]. 李凤岐.大连理工大学 2014

硕士论文
[1]基于支持向量机的滑动式验证码人机识别研究[D]. 陈林萍.长沙理工大学 2018
[2]滑块验证码人机识别系统特征选择及应用研究[D]. 王二磊.长沙理工大学 2017
[3]时间序列遥感数据植被分类中的特征选择方法研究[D]. 候智庭.云南师范大学 2017
[4]基于Relief算法的siRNA特征选择研究[D]. 舒崇河.吉林大学 2017
[5]半监督随机森林分类算法及其并行化研究[D]. 马超.重庆大学 2017
[6]基于梯度提升树的行为式验证码人机识别的研究[D]. 苏涛.华中师范大学 2016
[7]基于时间序列相似性的股价趋势预测研究[D]. 孙建乐.重庆交通大学 2014



本文编号:3711099

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3711099.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户949b0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com