基于CNN的JS代码混淆检测方法
发布时间:2020-03-31 12:47
【摘要】:目前,互联网给人类带来了极大的便利,但与此同时,恶意网页攻击事件频繁发生,其中大部分的JavaScript攻击代码都是通过混淆实施的。为了进一步对抗恶意网页攻击,保护用户的个人财产安全,检测JavaScript混淆脚本已成为当前的一个重要方向。传统的JavaScript代码混淆检测方法主要采用一些浅层机器学习模型或者度量法,它们都需要事先对JavaScript代码混淆有一定的深入研究,对特征要求严格,特征提取过程复杂,并且特征选择的好坏影响着检测的精确率。据此,论文提出了一种基于Bigram的字符矩阵特征提取方法,以简化特征提取过程。同时提出一种基于CNN(卷积神经网络)的JS(JavaScript)代码混淆检测方法,以提高检测的精确率。首先,针对传统JavaScript代码混淆特征提取方法存在过程复杂,需要对JavaScript代码混淆有长时间的研究以及不具有普适性等问题,论文提出了一种基于Bigram的字符矩阵特征提取方法。该方法受Bigram语义模型与马尔科夫概率矩阵启发,在字符级别上对JavaScript代码进行特征提取,简化了特征提取过程,提高了普适性。其次,针对传统机器学习检测方法大都是一些浅层模型,对特征要求高,且检测精确率低的问题,论文提出了一种基于CNN的JavaScript代码混淆检测方法,利用CNN对矩阵特征向量强大的学习能力,不仅降低了对特征的要求,还有效的提高了检测JavaScript代码混淆的精确率。最后,论文对提出的特征提取方法以及卷积神经网络检测JavaScript代码混淆方法进行了实验。实验表明,论文提出的字符矩阵特征提取方法具有明显的区分能力,并且是传统特征提取方法耗时的一半。同时,相比于传统的机器学习检测方法,卷积神经网络检测方法提升了0.6%精确率。
【图文】:
图 1.1 论文框架结构第 3 章分析总结了当前机器学习检测方法的不足,在第 2 章提取的矩阵特征基础上,提出了一种基于卷积神经网络的 JavaScript 代码混淆检测方法,阐述了CNN 较其他浅层机器学习的优势,最后详细描述了基于卷积神经网络的JavaScript 代码混淆检测方法的具体过程。第 4 章主要描述了基于 Bigram 的字符矩阵特征提取方法以及基于卷积神经网络的检测方法的实验过程,将所提取的字符矩阵特征进行可视化并与其他特征提取方法进行比较,同时分别进行了卷积神经网络检测 JavaScript 代码混淆方法与浅层机器学习检测 JavaScript 代码混淆方法的实验,根据实验结果,证明了论文提出特征提取方法可以有效减少特征提取时间,并且论文提出的检测方法,,可以有效的提高检测的精确率。最后,对全文基于 CNN 的 JS 代码混淆检测方法进行了总结,并且阐述了本文存在的一些不足,同时,对这些不足提出了后期的计划。
随机混淆
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.08
本文编号:2609094
【图文】:
图 1.1 论文框架结构第 3 章分析总结了当前机器学习检测方法的不足,在第 2 章提取的矩阵特征基础上,提出了一种基于卷积神经网络的 JavaScript 代码混淆检测方法,阐述了CNN 较其他浅层机器学习的优势,最后详细描述了基于卷积神经网络的JavaScript 代码混淆检测方法的具体过程。第 4 章主要描述了基于 Bigram 的字符矩阵特征提取方法以及基于卷积神经网络的检测方法的实验过程,将所提取的字符矩阵特征进行可视化并与其他特征提取方法进行比较,同时分别进行了卷积神经网络检测 JavaScript 代码混淆方法与浅层机器学习检测 JavaScript 代码混淆方法的实验,根据实验结果,证明了论文提出特征提取方法可以有效减少特征提取时间,并且论文提出的检测方法,,可以有效的提高检测的精确率。最后,对全文基于 CNN 的 JS 代码混淆检测方法进行了总结,并且阐述了本文存在的一些不足,同时,对这些不足提出了后期的计划。
随机混淆
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.08
【参考文献】
相关期刊论文 前2条
1 宣以广;周华;;基于字符熵的JavaScript代码混淆自动检测方法[J];计算机应用与软件;2015年01期
2 刘建伟;刘媛;罗雄麟;;深度学习研究进展[J];计算机应用研究;2014年07期
本文编号:2609094
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2609094.html