基于LSTM的钓鱼邮件检测系统
发布时间:2021-08-20 00:19
提出了一种基于LSTM的钓鱼邮件检测方式.该方式主要由两部分构成:分别为数据扩充部分及模型训练部分.数据扩展部分中,通过KNN与K-means算法扩大训练数据集,保证数据的数量能够满足深度学习算法的需要.在模型训练部分中,通过对数据进行预处理并将其转化为词向量矩阵,最后将转化完词向量通过训练得到LSTM神经网络模型.最终,可以根据训练好的LSTM模型将邮件分为正常邮件以及钓鱼邮件.通过实验对提出的算法进行了评估,实验结果显示提出的算法准确率可以达到95%.
【文章来源】:北京理工大学学报. 2020,40(12)北大核心EICSCD
【文章页数】:6 页
【部分图文】:
基于恶意附件的钓鱼邮件
基于恶意链接的钓鱼邮件
提出的系统框架如图3所示,主要由3个部分组成:邮件预处理与特征提取部分、数据扩充与聚类部分以及判别部分. 下面分别对这3个部分进行介绍.在邮件预处理与特征提取部分中,通过常规邮件以及攻击性邮件筛选缩减需要被训练以及被检测的邮件数量,从而提高检测模型的准确率以及检测模型效率. 在聚类算法部分中,借助于K-means[14]与KNN[15]算法对邮件进行精准标注以及数据扩增. 深度学习模型部分中,通过分词,词向量训练完成邮件正文到词向量的转化. 最终高效地实现钓鱼邮件的检测.
【参考文献】:
期刊论文
[1]一种新的场景文本识别模型[J]. 王茂森,蒋小森,牛少彰. 北京理工大学学报. 2019(03)
[2]基于二次训练技术的入侵检测方法研究[J]. 李龙杰,于洋,白伸伸,侯元伟,郝永乐. 北京理工大学学报. 2017(12)
[3]基于卷积神经网络的入侵检测算法[J]. 贾凡,孔令智. 北京理工大学学报. 2017(12)
本文编号:3352424
【文章来源】:北京理工大学学报. 2020,40(12)北大核心EICSCD
【文章页数】:6 页
【部分图文】:
基于恶意附件的钓鱼邮件
基于恶意链接的钓鱼邮件
提出的系统框架如图3所示,主要由3个部分组成:邮件预处理与特征提取部分、数据扩充与聚类部分以及判别部分. 下面分别对这3个部分进行介绍.在邮件预处理与特征提取部分中,通过常规邮件以及攻击性邮件筛选缩减需要被训练以及被检测的邮件数量,从而提高检测模型的准确率以及检测模型效率. 在聚类算法部分中,借助于K-means[14]与KNN[15]算法对邮件进行精准标注以及数据扩增. 深度学习模型部分中,通过分词,词向量训练完成邮件正文到词向量的转化. 最终高效地实现钓鱼邮件的检测.
【参考文献】:
期刊论文
[1]一种新的场景文本识别模型[J]. 王茂森,蒋小森,牛少彰. 北京理工大学学报. 2019(03)
[2]基于二次训练技术的入侵检测方法研究[J]. 李龙杰,于洋,白伸伸,侯元伟,郝永乐. 北京理工大学学报. 2017(12)
[3]基于卷积神经网络的入侵检测算法[J]. 贾凡,孔令智. 北京理工大学学报. 2017(12)
本文编号:3352424
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3352424.html