当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的跨平台二进制代码关联分析

发布时间:2021-06-07 07:18
  当前,越来越多的物联网厂商将第三方代码库编译并部署在不同平台上,由于代码的交叉复用,使得对跨平台的二进制代码进行同源性检测具有极大的实用价值。跨平台二进制代码同源性检测旨在检测来自不同平台的两个二进制函数是否属于同源函数。它有很多应用到安全方面的例子,比如抄袭检测、恶意软件检测、漏洞搜索等。现有的同平台二进制代码关联方法并不能直接应用到跨平台场景中来:比特流比对技术分析的对象是比特流,它与平台采用的编码方式相关;指令序列比对技术分析的对象是指令序列,它与平台采用的指令集相关;动态插桩技术分析的是动态分析过程中的中间结果,受限于分析工具的平台兼容性。现有的跨平台二进制代码关联分析依赖于近似图形匹配算法,这些算法在同源性检测速度上不可避免的比较缓慢,而且在精度上准确率不高,难以适应新任务。近年来深度学习技术已经广泛应用于各种领域,包括二进制函数分析,并且已经显示其精度高、速度快的优势。本文主要研究基于深度学习的方法检测二进制函数对的同源性,本文将利用二进制函数代码属性控制流图的跨平台性,为每一个待检测函数对中的函数提取出相应的属性控制流图,然后利用图嵌入神经网络为每一个属性控制流图生成一个... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:57 页

【学位级别】:硕士

【部分图文】:

基于深度学习的跨平台二进制代码关联分析


AlexNet网络结构

导数,函数,激活函数,多层感知机网络


图 2-2 多层感知机网络结构激活函数是用来向神经网络中引入非线性因素,如果不使用激活函数,网络中的每一层都是上层输入的线性函数,那么无论网络有多少层,输出输入的线性组合,但是神经网络通常也用于预测任务,任务场景中的输与输出结果大多是非线性关系,所以通过使用非线性激活函数,可以使网络可以拟合各种任务需要。下面将本文使用的神经网络中用到的两种非激活函数:tanh 和 ReLU。(1) tanh 函数——双曲正切函数

激活函数,学习训练,函数,计算资源


哈尔滨工业大学工程硕士学位论文tanh 激活函数又称为双曲正切激活函数,数学公式表达如下: ( ) = (2将真值压缩在区间[-1, 1]内,具有完全可微分、反对称(对称中心在坐标系)的特征,为了解决学习缓慢和梯度消失的问题,可以使用该函数的更加的变体(softsign、symmetrical 等)。(2) ReLU 函数ReLU 的数学公式表达如下: ( ) = ( ) (2输入 x < 0 时,输出为 0;当输入 x > 0 时,输出为 x。该激活函数可以使网快速地收敛,并且他不会饱和,ReLU 的求导几乎不存在任何计算量,相较nh 函数,ReLU 可以实现单侧抑制,同时可以保证相对宽阔的兴奋边界,但LU 函数的输出不以零为中心,并且在神经网络进行训练的前向传导过程中

【参考文献】:
期刊论文
[1]一种大规模的跨平台同源二进制文件检索方法[J]. 陈昱,刘中金,赵威威,马原,石志强,孙利民.  计算机研究与发展. 2018(07)
[2]VDNS:一种跨平台的固件漏洞关联算法[J]. 常青,刘中金,王猛涛,陈昱,石志强,孙利民.  计算机研究与发展. 2016(10)
[3]基于同源性分析的嵌入式设备固件漏洞检测[J]. 李登,尹青,林键,吕雪峰.  计算机工程. 2017(01)
[4]改进的基于图的可执行文件比较算法[J]. 谢余强,曾颖,舒辉.  计算机工程与设计. 2007(02)
[5]一种基于反汇编技术的二进制补丁分析方法[J]. 曾鸣,赵荣彩,王小芹,姚京松.  计算机科学. 2006(10)



本文编号:3216131

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3216131.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fb470***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com