基于Variational Autoencoder的软件匹配算法的设计与实现
发布时间:2021-10-24 09:16
因为计算机网络技术的发展迅速,所以各种各样的软件不断推陈出新,当然其中不乏各类恶意软件的出现。由于很难获得这些恶意软件的源代码,因此反向分析已成为分析恶意软件的强大工具。在逆向工程和二进制程序分析中,函数识别又是一个根本性的挑战,因为许多恶意软件通常包含从开源软件中复用的大量函数。如果能够有效的识别函数,不仅能提高逆向分析的效率,减少逆向分析人员的工作量,而且还可以降低不相关代码库之间的假相关性。在函数识别中,如何去辨别出库函数又至关重要。事实证明,对于那些高级语言程序,识别出库函数所花费的时间是相当可观的。逆向人员会因为没有获得新知识而觉得时间被浪费了,但是正常的分析过程中都不得不重复这一步。有时如果我们知道了一个库函数所属的类别,就能够大大降低程序分析事务的强度,例如,在一段代码中,处理流数据的函数一般是独立于代码中的主要算法的。并且在每个高级语言所编写的程序中,都使用了很多标准库中的函数,有时这些库函数甚至在所有被调用的函数中占有95%的比例,这就是识别库函数的重要性所在。在本研究中,我们对函数中的每个block,统计两两相邻指令的操作码类型,即它们出现的频率,存储至矩阵中,最后...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
手机恶意软件的主要行为
播的速度大幅度提升。所以,在恶意软件出现的初期阶段,由于新发现的恶意软件??比较少,因此对恶意软件进行手动分析是可行的。但是在2000年以后,没有被检??测到过的非法软件的数量迅速增加。其增长趋势图如图1.?2所示。??160000000??140000000??120000000??100000000??80000000??60000000??40000000?_??20000000?■?■??0?■??2007?2008?2009?2010?2011?2012?2013?2014??■软件数M??图1.2恶意软件的数量增长趋势图??在这种恶意软件数量快速增长的情况下,它们又具有了新的危害方面。??1、
通过对汇编代码中操作码频率的统计,我们能够得到一个代表函数特征的矩??阵。根据Bilar的统计,共有398个IA-32操作码,而在常用的合法软件中,90%??都是最常见的14个操作码,如图2.1所示。因为汇编指令的数量有限,所以这个??矩阵不会无限扩大,方便计算,也很大程度上控制了计算时间。??jnz?\?I?/??9%??图2.1在常用软件中出现频率最高的14个操作码??9??
【参考文献】:
硕士论文
[1]基于深度学习混合模型的文本分类研究[D]. 周超.兰州大学 2016
本文编号:3455015
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
手机恶意软件的主要行为
播的速度大幅度提升。所以,在恶意软件出现的初期阶段,由于新发现的恶意软件??比较少,因此对恶意软件进行手动分析是可行的。但是在2000年以后,没有被检??测到过的非法软件的数量迅速增加。其增长趋势图如图1.?2所示。??160000000??140000000??120000000??100000000??80000000??60000000??40000000?_??20000000?■?■??0?■??2007?2008?2009?2010?2011?2012?2013?2014??■软件数M??图1.2恶意软件的数量增长趋势图??在这种恶意软件数量快速增长的情况下,它们又具有了新的危害方面。??1、
通过对汇编代码中操作码频率的统计,我们能够得到一个代表函数特征的矩??阵。根据Bilar的统计,共有398个IA-32操作码,而在常用的合法软件中,90%??都是最常见的14个操作码,如图2.1所示。因为汇编指令的数量有限,所以这个??矩阵不会无限扩大,方便计算,也很大程度上控制了计算时间。??jnz?\?I?/??9%??图2.1在常用软件中出现频率最高的14个操作码??9??
【参考文献】:
硕士论文
[1]基于深度学习混合模型的文本分类研究[D]. 周超.兰州大学 2016
本文编号:3455015
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3455015.html