基于混合词向量深度学习模型的DGA域名检测方法
发布时间:2021-09-02 13:12
域名生成算法(domain generation algorithm,DGA)是域名检测中防范僵尸网络攻击的重要手段之一,对于生成威胁情报、阻断僵尸网络命令与控制流量、保障网络安全有重要的实际意义.近年来,DGA域名检测技术从依靠手工提取特征发展到自动提取特征的基于深度学习模型的方法,在DGA域名检测任务中取得了较大的进展.但对于不同僵尸网络家族的DGA域名的多分类任务,由于家族种类多,且各家族域名数据存在不平衡性,因此许多已有的深度学习模型在DGA域名的多分类任务上仍有提高空间.针对以上挑战,设计了基于字符和双字母组级别的混合词向量,以提高域名字符串的信息利用度,并设计了基于混合词向量方法的深度学习模型.最后设计了包含多种对比模型的实验,对混合词向量的有效性进行验证.实验结果表明基于混合词向量的深度学习模型在DGA域名检测与分类任务中相比只基于字符级词向量的模型有更好的分类性能,特别是在小样本的DGA域名类别上的分类性能更优,证明了该模型的有效性.
【文章来源】:计算机研究与发展. 2020,57(02)北大核心EICSCD
【文章页数】:14 页
【文章目录】:
1 相关工作
2 混合词向量
2.1 字符级词向量
2.2 双字母组级词向量
3 模型结构
3.1 词嵌入层
3.2 卷积神经网络层
3.3 循环神经网络层
3.4 特征融合层
3.5 稠密层
4 实验与结果
4.1 数据集介绍
4.2 实验步骤
4.3 评价指标
4.4 对比模型
4.5 结果分析
5 总结
【参考文献】:
期刊论文
[1]深度强化学习研究综述[J]. 赵星宇,丁世飞. 计算机科学. 2018(07)
[2]图像超分辨率重建的研究进展[J]. 曾凯,丁世飞. 计算机工程与应用. 2017(16)
[3]拉普拉斯多层极速学习机[J]. 丁世飞,张楠,史忠植. 软件学报. 2017(10)
[4]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
[5]僵尸网络检测技术研究进展[J]. 王海龙,龚正虎,侯婕. 计算机研究与发展. 2010(12)
[6]僵尸网络研究[J]. 诸葛建伟,韩心慧,周勇林,叶志远,邹维. 软件学报. 2008(03)
本文编号:3379074
【文章来源】:计算机研究与发展. 2020,57(02)北大核心EICSCD
【文章页数】:14 页
【文章目录】:
1 相关工作
2 混合词向量
2.1 字符级词向量
2.2 双字母组级词向量
3 模型结构
3.1 词嵌入层
3.2 卷积神经网络层
3.3 循环神经网络层
3.4 特征融合层
3.5 稠密层
4 实验与结果
4.1 数据集介绍
4.2 实验步骤
4.3 评价指标
4.4 对比模型
4.5 结果分析
5 总结
【参考文献】:
期刊论文
[1]深度强化学习研究综述[J]. 赵星宇,丁世飞. 计算机科学. 2018(07)
[2]图像超分辨率重建的研究进展[J]. 曾凯,丁世飞. 计算机工程与应用. 2017(16)
[3]拉普拉斯多层极速学习机[J]. 丁世飞,张楠,史忠植. 软件学报. 2017(10)
[4]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
[5]僵尸网络检测技术研究进展[J]. 王海龙,龚正虎,侯婕. 计算机研究与发展. 2010(12)
[6]僵尸网络研究[J]. 诸葛建伟,韩心慧,周勇林,叶志远,邹维. 软件学报. 2008(03)
本文编号:3379074
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3379074.html