当前位置:主页 > 管理论文 > 移动网络论文 >

集成学习的恶意网页检测系统的设计与实现

发布时间:2021-05-10 11:43
  近年来互联网行业正在飞速崛起,其带来的信息交流也促进了全世界的商业发展。广大用户一边在享受着互联网带来的便利,同时也在遭受着网络中潜在的威胁。由于网页中病毒和恶意脚本的肆虐,个人、企业电脑受到黑客攻击致使信息泄露的事件频频流出,给人民和政府经济造成了损失。互联网中各种知名网站每日有巨大的访问量,这使得黑客通过这些网页攻击用户变得有机可乘。不少学者对于恶意网页的检测技术已经进行过一些研究,但是大部分针对恶意网页检测模型的构建过于单一造成检测准确率不高,所以如何更全面的挖掘恶意网页的特征并提高恶意网页检测的准确率变得非常重要。本文对恶意网页检测技术进行研究,利用了集成学习的代表算法随机森林进行模型融合,将深度学习算法和机器学习进行集成。其中的主要工作及创新点为:(1)对恶意网页链接URL检测技术进行研究,将卷积神经网络与传统机器学习方法相结合,融合卷积神经网络结构中自动提取的特征与人工提取的特征,并且使用三种传统机器学习方法对特征融合后的URL检测模型进行评价,将表现效果最好的URL检测模型作为本文搭建的集成学习恶意网页检测系统的URL检测层模型。(2)对恶意网页内容检测技术研究,结合正则... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:85 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景及选题意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 国内研究现状
        1.2.2 国外研究现状
        1.2.3 国内外研究现状总结
    1.3 本文的主要工作
    1.4 本文结构
    1.5 本章小节
第二章 相关理论与技术基础
    2.1 Web相关技术理论
        2.1.1 Web协议及万维网
        2.1.2 统一资源定位符
    2.2 典型的恶意网页攻击技术背景
        2.2.1 跨站脚本攻击
        2.2.2 网页标签挂马
    2.3 分类算法
        2.3.1 卷积神经网络
        2.3.2 集成学习
    2.4 本章小结
第三章 基于特征融合的恶意URL和恶意网页内容检测技术研究
    3.1 恶意URL检测技术研究
    3.2 网页链接数据收集及预处理
        3.2.1 恶意URL样本的收集
        3.2.2 数据预处理
    3.3 深度模型URL特征预处理
        3.3.1 词向量特征原理
        3.3.2 词向量特征提取
    3.4 URL人工设计规则提取特征
    3.5 URL检测模型搭建
        3.5.1 卷积神经网络检测模型搭建
        3.5.2 随机森林算法检测模型搭建
        3.5.3 朴素贝叶斯检测模型搭建
        3.5.4 支持向量机算法检测模型搭建
    3.6 恶意网页内容检测技术研究
        3.6.1 网页内容数据收集
        3.6.2 网页内容特征提取
    3.7 网页内容检测模型搭建
        3.7.1 逻辑回归模型搭建
        3.7.2 K邻近检测模型搭建
        3.7.3 随机森林检测模型搭建
    3.8 实验分析
        3.8.1 URL检测实验分析
        3.8.2 网页内容检测实验分析
    3.9 本章小结
第四章 结合URL和网页内容的恶意网页检测系统的设计与实现
    4.1 检测系统web平台
        4.1.1 用户管理
        4.1.2 黑白名单管理模块
        4.1.3 任务管理模块
    4.2 URL多维检测模块
    4.3 网页内容检测层设计
        4.3.1 网页爬虫解析模块
        4.3.2 反混淆代码还原和特征提取模块
    4.4 本章小结
第五章 系统测试及分析
    5.1 实验开发环境及功能性分析
    5.2 检测平台功能性测试
        5.2.1 网站安全性测试
        5.2.2 检测结果测试
    5.3 检测能力测试
        5.3.1 检测能力评价指标
        5.3.2 恶意网页检测系统性能测试
    5.4 本章小结
第六章 总结与展望
    6.1 工作总结
    6.2 工作展望
致谢
参考文献


【参考文献】:
期刊论文
[1]支持向量机、随机森林和人工神经网络机器学习算法在地球化学异常信息提取中的对比研究[J]. 李苍柏,肖克炎,李楠,宋相龙,张帅,王凯,楚文楷,曹瑞.  地球学报. 2020(02)
[2]基于机器学习的恶意URL识别[J]. 李泽宇,施勇,薛质.  通信技术. 2020(02)
[3]基于知识图谱的恶意域名检测方法[J]. 张奕,邹福泰.  通信技术. 2020(01)
[4]基于SpringBoot框架应用开发技术的分析与研究[J]. 熊永平.  电脑知识与技术. 2019(36)
[5]基于Struck的在线学习和相似度匹配的双重更新跟踪算法[J]. 袁振,王传江,张腾飞.  山东科技大学学报(自然科学版). 2019(06)
[6]TCP/IP协议安全分析仿真平台设计[J]. 黄展鹏,蒙炜龙,吴俊璋,韦杰帅.  科技视界. 2019(32)
[7]基于Web系统的跨站脚本攻击漏洞解析[J]. 巨腾飞,田国敏,杨京.  网络安全技术与应用. 2019(11)
[8]基于特征融合和机器学习的恶意网页识别研究[J]. 魏旭,成卫青.  南京邮电大学学报(自然科学版). 2019(05)
[9]基于长短期记忆网络的恶意URL的检测[J]. 张婷,钱丽萍.  北京建筑大学学报. 2019(03)
[10]基于隐马尔可夫模型的反射型XSS检测技术[J]. 赵澄,陈君新.  浙江工业大学学报. 2019(04)



本文编号:3179305

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3179305.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户93ed7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com