基于脚本引擎的恶意网页检测系统
发布时间:2017-06-13 20:00
本文关键词:基于脚本引擎的恶意网页检测系统,,由笔耕文化传播整理发布。
【摘要】:近年来,随着互联网的快速发展和Web应用的日益普及,网络已经融入了人们的日常生活,然而,在计算机用户上网冲浪的同时,也成为了攻击者的目标。当前,恶意网页已经成为恶意软件传播的主要途径。黑客在入侵网站后,对网页进行恶意篡改,植入恶意代码,引诱用户访问到被感染的网页。恶意代码会利用浏览器的漏洞将恶意程序种植到该用户的计算机上。通常这些程序会在后台盗取用户隐私信息或者控制用户的计算机。如果用户在不知情的情况下访问到这些网页,就有可能造成信息泄露和经济损失。恶意网页严重威胁着互联网用户的信息安全。 本文提出了一种基于JavaScript引擎的恶意网页检测方法:通过对Rhino引擎进行扩展,实现特征提取;采用机器学习得到分类模型,实现对恶意网页的检测。完成的主要研究工作包括: (1)首先对恶意网页采用的重定向、JavaScript代码混淆、堆喷射、漏洞利用等技术进行了研究;通过对大量恶意网页进行深入的分析,选择了恶意网页的检测特征。通过动态解析页面,实现对混淆脚本代码的特征提取,基于脚本引擎的特征提取方法提高了系统检测的准确性。 (2)基于Rhino脚本引擎,采用了开源软件,使用Java语言开发实现了原型系统。检测系统包括:预处理模块、页面解析模块、特征提取模块、检测模块、查询模块。页面解析模块使用HtmlUnit实现了对动态页面的处理;特征提取模块实现了DOM对象和内置函数的检测;检测模块提供了多个分类器对恶意网页实现检测;用户可以通过查询模块获取详细的检测报告。 (3)通过实验完成了分类器的参数调整;对比了朴素贝叶斯、决策树以及支持向量机分类器的性能;并与安全软件进行了对比试验,表明本检测系统具有较低的漏报率,可以很好的实现恶意网页检测。 本检测系统可应用于搜索引擎的恶意网页检测中,保护用户上网安全。同时检测系统提供了分析报告,可供安全研究人员对恶意网页进行分析研究。
【关键词】:恶意网页 JavaScript引擎 机器学习 分类器
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.08
【目录】:
- 摘要5-6
- Abstract6-8
- 目录8-10
- 第一章 绪论10-16
- 1.1 研究背景及意义10-11
- 1.2 国内外研究现状11-13
- 1.3 论文主要研究工作和内容13-14
- 1.4 论文结构14-16
- 第二章 恶意网页与检测技术16-27
- 2.1 恶意网页概述16-17
- 2.1.1 恶意网页的定义16
- 2.1.2 恶意网页的危害16-17
- 2.2 网页脚本语言17-20
- 2.2.1 JavaScript语言简介17-18
- 2.2.2 JavaScript脚本引擎18-19
- 2.2.3 网页中引入JavaScript的方式19-20
- 2.2.4 JavaScript语言的安全性20
- 2.3 恶意网页的攻击方式20-25
- 2.3.1 植入途径20-22
- 2.3.2 传播方法22-23
- 2.3.3 攻击过程23-24
- 2.3.4 攻击工具包24-25
- 2.4 恶意网页的检测技术25-26
- 2.5 本章小结26-27
- 第三章 基于脚本引擎的恶意网页特征选择与分类27-46
- 3.1 恶意网页的特征选择27-41
- 3.1.1 重定向27-30
- 3.1.2 攻击环境的检测30-32
- 3.1.3 JavaScript脚本的混淆32-37
- 3.1.4 shellcode37-38
- 3.1.5 堆喷射38-39
- 3.1.6 漏洞利用39-41
- 3.2 网页分类41-45
- 3.2.1 朴素贝叶斯41-42
- 3.2.2 决策树42
- 3.2.3 支持向量机42
- 3.2.4 RapidMiner工具42-43
- 3.2.5 分类模型43-45
- 3.3 本章小结45-46
- 第四章 检测系统的设计与实现46-65
- 4.1 相关技术介绍46-48
- 4.1.1 HtmlUnit46-47
- 4.1.2 Rhino47
- 4.1.3 scdbg47-48
- 4.2 系统的总体设计目标48
- 4.3 系统框架48-49
- 4.4 整体工作流程49-50
- 4.5 预处理模块50
- 4.6 页面解析模块50-52
- 4.7 特征提取模块52-60
- 4.7.1 特征提取53-56
- 4.7.2 URL引用关系树56-57
- 4.7.3 shellcode的检测57-60
- 4.8 检测模块60-61
- 4.9 检测结果记录模块61-62
- 4.10 查询模块62-64
- 4.11 本章小结64-65
- 第五章 系统测试65-74
- 5.1 实验环境65
- 5.2 测试样本来源65-66
- 5.3 采用的样本数据66-68
- 5.4 性能评价指标68
- 5.5 分类器的参数调整实验68-70
- 5.5.1 决策树68-70
- 5.5.2 支持向量机70
- 5.6 分类器的性能对比实验70-71
- 5.7 与安全软件的检测性能对比71-72
- 5.8 本章小结72-74
- 总结与展望74-76
- 参考文献76-79
- 攻读硕士学位期间取得的研究成果79-80
- 致谢80-81
- 附件81
【参考文献】
中国期刊全文数据库 前5条
1 冯雪坪;李芝棠;涂浩;鲍金霞;;基于BHO技术的恶意网页行为检测方法[J];广西大学学报(自然科学版);2011年S1期
2 王涛;余顺争;;基于统计学习的挂马网页实时检测[J];计算机科学;2011年01期
3 毕硕本;朱斌;乔文文;徐寅;王启富;;基于层次分析法的加密恶意脚本风险评估模型研究[J];计算机应用研究;2011年07期
4 仇永泉;林果园;陈伟;;基于BHO技术的网页安全检测系统的研究[J];计算机工程与设计;2012年07期
5 金晓鸥;钟宝燕;李翔;;基于Rhino的JavaScript动态页面解析研究与实现[J];计算机技术与发展;2008年02期
本文关键词:基于脚本引擎的恶意网页检测系统,由笔耕文化传播整理发布。
本文编号:447412
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/447412.html