基于深度学习的恶意程序检测与分类
发布时间:2021-06-24 10:52
随着计算机技术的飞快发展,恶意程序给人们带来的危险也与日俱增。由于混淆编码技术的提高,恶意程序的数量日益庞大且不易识别,传统的恶意程序检测技术已经难以满足人们的需求。本文采取深度学习的方法来提高模型检测恶意程序的能力。深度学习是机器学习延伸出来的一个新型技术,被广泛应用在图像处理、自然语言处理、计算机视觉以及语言识别等领域,而深度学习中的卷积神经网络(Convolutional Neural Network,CNN)源于人工神经网络的深入研究,具有良好的分类性能,对于未知样本的预测能力也较高。传统方法中提取日志文件进行分析,但是,这样会损失词向量模型中某些维度的语法信息,也不能表现出可执行程序行为的本质。本文具体采取的方法是,通过相关工具对可执行程序进行分析,得到自然语言描述的行为信息的语料库,并根据语料库训练词向量空间,用其中的词向量对提取的行为信息进行表示,得到行为特征图,最后用卷积神经网络的方法训练模型并进行检测。为了改进传统的检测方法以及对实验效果进行证明,本文做了两个对比实验。第一个实验提取了恶意软件的API调用序列作为文本信息,建立一个向量空间模型(Vector Space...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
Sigmoid和Tanh函数图像
这样的特性可以去掉数据中的冗杂值 Tanh 两种激活函数的形式相比,Relu 不需oid 和 Tanh 一样需要进行归一化处理来减轻多优秀特性,所以在深度神经网络中应用比层也称为汇聚层,下采样层。其作用是在保的无关信息,提高模型的训练效率,减小计,方便对卷积处理后的信息进行筛选和过滤合现象。过程就是在一个小区域内,取一个特定的值作域的一个随机值、平均值、最大或最小值。以及最终分类结果的准确性。图2.6中对最大 中最大值的操作进行了展示,本文中使
验中使用的描述信息是“自然语言”描述的行为文本信息,由改进工具进行提取。本章对提取该信息的 Cuckoo 工具进行了展示,介绍了工和使用方法,而后对本文中使用的两种文本特征提取算法进行了论述,过文本得到特征图和特征向量的过程,最后介绍了整个实验的出发点和第四章的实验展示作了铺垫。本信息的获取行程序的行为文本信息通过 Cuckoo 沙箱工具进行获取。Cuckoo 沙箱工pen Source Cuckoo Sandbox Project,是一种用Python编写的开源自动化工件分析领域应用广泛。其架构如图 3.1 所示,通过 Cuckoo 工具可以帮员获取恶意程序动态静态的特征信息。沙箱是一种将未知、不可信的软行的安全机制,恶意软件分析领域中沙箱工具一般用法是,将不可信软境中动态执行,然后提取其运行过程中的进程、网络、文件等动态行为人员可以根据这些行为记录对恶意软件进行更深入地分析。
【参考文献】:
期刊论文
[1]深度学习在统计机器翻译领域自适应中的应用研究[J]. 丁亮,姚长青,何彦青,李辉. 情报工程. 2017(03)
[2]基于Hopfield神经网络的数据分类[J]. 王振华. 计算机应用. 2011(S2)
[3]基于BP人工神经网络的绝缘子泄漏电流预测[J]. 毛颖科,关志成,王黎明,乐波. 中国电机工程学报. 2007(27)
[4]Benchmark性能测试综述[J]. 王良. 计算机工程与应用. 2006(15)
[5]BP神经网络的应用设计[J]. 尹念东. 信息技术. 2003(06)
[6]人工神经网络在遥感数字图像分类处理中的应用[J]. 张宝光. 国土资源遥感. 1998(01)
硕士论文
[1]基于神经网络的股票预测[D]. 俞福福.哈尔滨工业大学 2016
[2]基于CNN的字符识别方法研究[D]. 王强.天津师范大学 2014
[3]Kappa系数在一致性评价中的应用研究[D]. 王军.四川大学 2006
本文编号:3246957
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
Sigmoid和Tanh函数图像
这样的特性可以去掉数据中的冗杂值 Tanh 两种激活函数的形式相比,Relu 不需oid 和 Tanh 一样需要进行归一化处理来减轻多优秀特性,所以在深度神经网络中应用比层也称为汇聚层,下采样层。其作用是在保的无关信息,提高模型的训练效率,减小计,方便对卷积处理后的信息进行筛选和过滤合现象。过程就是在一个小区域内,取一个特定的值作域的一个随机值、平均值、最大或最小值。以及最终分类结果的准确性。图2.6中对最大 中最大值的操作进行了展示,本文中使
验中使用的描述信息是“自然语言”描述的行为文本信息,由改进工具进行提取。本章对提取该信息的 Cuckoo 工具进行了展示,介绍了工和使用方法,而后对本文中使用的两种文本特征提取算法进行了论述,过文本得到特征图和特征向量的过程,最后介绍了整个实验的出发点和第四章的实验展示作了铺垫。本信息的获取行程序的行为文本信息通过 Cuckoo 沙箱工具进行获取。Cuckoo 沙箱工pen Source Cuckoo Sandbox Project,是一种用Python编写的开源自动化工件分析领域应用广泛。其架构如图 3.1 所示,通过 Cuckoo 工具可以帮员获取恶意程序动态静态的特征信息。沙箱是一种将未知、不可信的软行的安全机制,恶意软件分析领域中沙箱工具一般用法是,将不可信软境中动态执行,然后提取其运行过程中的进程、网络、文件等动态行为人员可以根据这些行为记录对恶意软件进行更深入地分析。
【参考文献】:
期刊论文
[1]深度学习在统计机器翻译领域自适应中的应用研究[J]. 丁亮,姚长青,何彦青,李辉. 情报工程. 2017(03)
[2]基于Hopfield神经网络的数据分类[J]. 王振华. 计算机应用. 2011(S2)
[3]基于BP人工神经网络的绝缘子泄漏电流预测[J]. 毛颖科,关志成,王黎明,乐波. 中国电机工程学报. 2007(27)
[4]Benchmark性能测试综述[J]. 王良. 计算机工程与应用. 2006(15)
[5]BP神经网络的应用设计[J]. 尹念东. 信息技术. 2003(06)
[6]人工神经网络在遥感数字图像分类处理中的应用[J]. 张宝光. 国土资源遥感. 1998(01)
硕士论文
[1]基于神经网络的股票预测[D]. 俞福福.哈尔滨工业大学 2016
[2]基于CNN的字符识别方法研究[D]. 王强.天津师范大学 2014
[3]Kappa系数在一致性评价中的应用研究[D]. 王军.四川大学 2006
本文编号:3246957
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3246957.html