基于TF-IDF的Webshell文件检测
发布时间:2021-05-10 00:10
随着互联网的飞速发展,网络攻击行为日益频繁。Webshell是常见的网络攻击方式,而传统的检测手段已无法应对复杂灵活的变种Webshell攻击。为解决这一问题,提出了一种基于TF-IDF的Webshell文件检测方法。系统首先对不同类型的Webshell文件进行分类,并对不同文件进行相应的预处理转码,以降低混淆干扰技术对检测的影响;随后建立词袋模型,并采用TF-IDF算法加权提取相关特征;最后使用XGBoost算法训练得到检测模型。与传统机器学习算法进行的10折交叉验证对比测试表明,使用TF-IDF算法预处理后结合XGBoost算法的Webshell文件检测模型性能出色,检测效果相较于传统检测方法在准确率、精确率、召回率等方面均有所提高,同时具备更强的鲁棒性与泛化能力,其中对PHP类型文件检测的准确率达到了98.09%,对JSP类型文件检测准确率达到了97.09%。
【文章来源】:计算机科学. 2020,47(S2)北大核心CSCD
【文章页数】:5 页
【文章目录】:
1 概述
2 相关研究
3 基于TF-IDF的Webshell检测模型
3.1 Webshell文件预处理
3.1.1 TF-IDF算法模型
3.1.2 JSP类型Webshell的特征提取
3.1.3 PHP类型Webshell的特征提取
3.2 分类器模型
3.2.1 SVM、随机森林、XGBoost算法模型
3.2.2 XGBoost训练模型的参数设置
4 模型测试
4.1 实验数据
4.2 实验环境
4.3 性能测试
4.3.1 性能评价指标
4.3.2 PHP类型Webshell文件的检测
4.3.3 JSP类型Webshell文件的检测
【参考文献】:
期刊论文
[1]基于支持向量机与Adaboost的入侵检测系统[J]. 池亚平,凌志婷,王志强,杨建喜. 计算机工程. 2019(10)
[2]基于大规模时间序列的井漏事故预警方法[J]. 涂曦予,于露,耿子辰,薛质,张保稳. 信息技术. 2018(12)
[3]基于CNN的Webshell文件检测[J]. 傅建明,黎琳,王应军. 郑州大学学报(理学版). 2019(02)
[4]智能检测WebShell的机器学习算法[J]. 戴桦,李景,卢新岱,孙歆. 网络与信息安全学报. 2017(04)
[5]基于Web日志的Webshell检测方法研究[J]. 石刘洋,方勇. 信息安全研究. 2016(01)
[6]基于支持向量机的Webshell黑盒检测[J]. 叶飞,龚俭,杨望. 南京航空航天大学学报. 2015(06)
[7]Linux下基于SVM分类器的WebShell检测方法研究[J]. 孟正,梅瑞,张涛,文伟平. 信息网络安全. 2014(05)
[8]几种交叉验证检验的可重复性[J]. 李艳芳,王钰,李济洪. 太原师范学院学报(自然科学版). 2013(04)
本文编号:3178287
【文章来源】:计算机科学. 2020,47(S2)北大核心CSCD
【文章页数】:5 页
【文章目录】:
1 概述
2 相关研究
3 基于TF-IDF的Webshell检测模型
3.1 Webshell文件预处理
3.1.1 TF-IDF算法模型
3.1.2 JSP类型Webshell的特征提取
3.1.3 PHP类型Webshell的特征提取
3.2 分类器模型
3.2.1 SVM、随机森林、XGBoost算法模型
3.2.2 XGBoost训练模型的参数设置
4 模型测试
4.1 实验数据
4.2 实验环境
4.3 性能测试
4.3.1 性能评价指标
4.3.2 PHP类型Webshell文件的检测
4.3.3 JSP类型Webshell文件的检测
【参考文献】:
期刊论文
[1]基于支持向量机与Adaboost的入侵检测系统[J]. 池亚平,凌志婷,王志强,杨建喜. 计算机工程. 2019(10)
[2]基于大规模时间序列的井漏事故预警方法[J]. 涂曦予,于露,耿子辰,薛质,张保稳. 信息技术. 2018(12)
[3]基于CNN的Webshell文件检测[J]. 傅建明,黎琳,王应军. 郑州大学学报(理学版). 2019(02)
[4]智能检测WebShell的机器学习算法[J]. 戴桦,李景,卢新岱,孙歆. 网络与信息安全学报. 2017(04)
[5]基于Web日志的Webshell检测方法研究[J]. 石刘洋,方勇. 信息安全研究. 2016(01)
[6]基于支持向量机的Webshell黑盒检测[J]. 叶飞,龚俭,杨望. 南京航空航天大学学报. 2015(06)
[7]Linux下基于SVM分类器的WebShell检测方法研究[J]. 孟正,梅瑞,张涛,文伟平. 信息网络安全. 2014(05)
[8]几种交叉验证检验的可重复性[J]. 李艳芳,王钰,李济洪. 太原师范学院学报(自然科学版). 2013(04)
本文编号:3178287
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3178287.html