当前位置:主页 > 科技论文 > 自动化论文 >

基于N-Gram与加权分类器集成的恶意代码检测

发布时间:2018-11-14 13:22
【摘要】:提出网页恶意脚本代码的监测系统,将恶意脚本用V8引擎编译成机器码,用变长N-Gram模型对其进行数据处理,提取特征形成样本训练集.分别与随机森林、逻辑回归及朴素贝叶斯等分类器组合创建分类模型.研究将多个经过训练集训练的分类模型集成,提出加权分类器集成的方式,每个分类器设定不同权值.通过实验分析,试验多种分类器组合,并通过训练集找出最优权值分配.通过比较单个分类器和其他集成方式,结果证明训练过的加权集成分类器的方式能更准确地检测网页存在恶意行为的代码,有较高的准确率.
[Abstract]:A monitoring system for web page malicious script code is proposed. The malicious script is compiled into machine code by V8 engine and processed with variable length N-Gram model. The feature is extracted to form a sample training set. Combined with random forest, logical regression and naive Bayes classifier respectively, the classification model is created. In this paper, several trained classification models are integrated, and a weighted classifier ensemble is proposed. Each classifier sets different weights. Through experimental analysis, several classifier combinations are tested, and the optimal weight allocation is found by training set. By comparing a single classifier with other integration methods, the results show that the trained weighted integrated classifier can detect the malicious code more accurately and has a higher accuracy.
【作者单位】: 浙江工业大学计算机科学与技术学院;
【分类号】:TP181;TP309

【相似文献】

相关期刊论文 前10条

1 郭红玲;程显毅;;多分类器选择集成方法[J];计算机工程与应用;2009年13期

2 吕岳,施鹏飞,赵宇明;多分类器组合的投票表决规则[J];上海交通大学学报;2000年05期

3 韩宏;杨静宇;;多分类器组合及其应用[J];计算机科学;2000年01期

4 陈刚,戚飞虎;多分类器结合的人脸识别[J];上海交通大学学报;2001年02期

5 韩宏,杨静宇,娄震;基于层次的分类器组合[J];南京理工大学学报(自然科学版);2002年01期

6 王正群,叶晖,孙兴华,杨静宇;模糊多分类器组合[J];小型微型计算机系统;2003年01期

7 杨利英,覃征,王向华;多分类器融合实现机型识别[J];计算机工程与应用;2004年15期

8 杨利英,覃征,王卫红;多分类器融合系统设计与应用[J];计算机工程;2005年05期

9 王永;张鸿;;鉴别球类图像的多分类器系统[J];福建电脑;2007年04期

10 叶云龙;杨明;;基于随机子空间的多分类器集成[J];南京师范大学学报(工程技术版);2008年04期

相关会议论文 前10条

1 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年

2 翟静;李海宏;唐常杰;陈敏敏;李智;;可验证对象集分类器的再训练演进[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

3 陈继航;刘家锋;赵巍;唐降龙;;联机手写识别笔段特征分类器的学习方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年

4 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

5 彭涛;左万利;赫枫龄;;基于链接上下文的分类器主题爬行技术(英文)[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

6 王岚;陈珂;迟惠生;;基于多特征组合多分类器的方法用于“与文本无关”的说话人辨认[A];第四届全国人机语音通讯学术会议论文集[C];1996年

7 胡琼;汪荣贵;胡韦伟;孙见青;;基于级联分类器的快速人脸检测方法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

8 宋巍;张宇;谢毓彬;高汉东;刘挺;李生;;利用URL类别改进查询主题分类[A];第六届全国信息检索学术会议论文集[C];2010年

9 李方涛;张显;孙建树;朱小燕;;一种新的层次化结构问题分类器[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

10 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年

相关博士学位论文 前10条

1 许劲松;智能交通中目标检测与分类关键技术研究[D];南京理工大学;2014年

2 赵作林;基于图像分析的北京地区杨树种类识别研究[D];北京林业大学;2015年

3 任亚峰;基于标注和未标注数椐的虚假评论识别研究[D];武汉大学;2015年

4 曹鹏;不均衡数据分类方法的研究[D];东北大学;2014年

5 刘明;分类器组合技术研究及其在人机交互系统中的应用[D];北京交通大学;2008年

6 王U,

本文编号:2331271


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2331271.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户05020***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com