当前位置:主页 > 管理论文 > 移动网络论文 >

一种基于stacking集成学习的DGA域名检测方法

发布时间:2021-11-16 00:09
  目前针对基于机器学习的DGA算法生成域名检测方法普遍存在的特征信息不全、检测精度不高等问题,提出了一种基于stacking集成学习的DGA域名检测方法。通过挖掘正常域名和DGA生成域名的字符特征、语言特征,并进一步提取出域名的衍生特征HMM系数共同作为域名特征,选择距离预测方法的KNN模型和基于超平面分类方法的SVM模型,并使用基于梯度提升迭代决策树方法的Cat Boost模型共同作为基分类器,同时以SVM作为第二层元分类器进行回归,通过stacking集成学习方法对DGA域名进行检测。实验证明,该方法一定程度的提升了检测的精确度和召回率。 

【文章来源】:数据通信. 2020,(06)

【文章页数】:6 页

【部分图文】:

一种基于stacking集成学习的DGA域名检测方法


基于stacking集成学习的DGA域名检测方法

流程图,堆栈,流程图,方法


步骤3:当基学习器Mx个数不为1时重复步骤1、2,并将每一次步骤2的预测结果ynstage_x与对应标签yn数据作为元学习器的输入数据并训练。本文实验强分类器的需求通过支持向量机(SVM)的线性核函数已能实现,不需进一步通过非线性核函数和优化调参,模型精度较高,且对过拟合有理论保证;KNN算法训练代价低,在类域重复交叠较多的样本集下分类效果更好;Cat Boost是通过选择决策树为基础预测器并使用GBDT进行分类的监督机器学习算法,其计算样本梯度不取决于所选样本,而是剔除样本后的整体梯度,可以避免特征空间梯度域真实梯度分布偏移而造成的过拟合。

流程图,流程图,方法,学习器


stacking集成方法流程图

【参考文献】:
期刊论文
[1]基于混合词向量深度学习模型的DGA域名检测方法[J]. 杜鹏,丁世飞.  计算机研究与发展. 2020(02)
[2]基于XGBoost特征选择的疾病诊断XLC-Stacking方法[J]. 岳鹏,侯凌燕,杨大利,佟强.  计算机工程与应用. 2020(17)
[3]集成学习在短文本分类中的应用研究[J]. 王国薇,黄浩,周刚,胡英.  现代电子技术. 2019(24)
[4]基于文本和DNS查询的非常规域名检测研究[J]. 李建飞,成卫青.  计算机技术与发展. 2020(02)
[5]特征选择方法综述[J]. 李郅琴,杜建强,聂斌,熊旺平,黄灿奕,李欢.  计算机工程与应用. 2019(24)
[6]DGA恶意域名检测方法[J]. 蒋鸿玲,戴俊伟.  北京信息科技大学学报(自然科学版). 2019(05)
[7]基于加权支持向量机的Domain Flux僵尸网络域名检测方法研究[J]. 宋金伟,杨进,李涛.  信息网络安全. 2018(12)
[8]特征选择稳定性研究综述[J]. 刘艺,曹建军,刁兴春,周星.  软件学报. 2018(09)
[9]基于IP分布及请求响应时间的恶意fast-flux域名检测算法[J]. 袁福祥,王琤,刘粉林,巩道福.  信息工程大学学报. 2017(05)
[10]基于词素特征的轻量级域名检测算法[J]. 张维维,龚俭,刘茜,刘尚东,胡晓艳.  软件学报. 2016(09)



本文编号:3497783

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3497783.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0e2be***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com