基于对抗式生成网络的恶意代码检测研究
发布时间:2021-08-16 12:58
随着互联网信息技术的快速发展,大数据分析和人工智能技术正驱使着我们的生活变得更加便捷。然而,恶意代码威胁的行为却在逐步上升,据统计2017年安卓恶意代码相比2016年增加了17.6%,而这个数据还会持续增长,所以恶意代码的检测愈演愈烈。基于对抗式生成网络(Generative Adversarial Network,GAN)的恶意代码检测思想,是获得满足真实恶意代码数据特征且能欺骗判别器判别的“真实”样本分布,以达到抵御恶意代码攻击,提升恶意代码检测效率的目的。首先,提出了一种新的安卓恶意代码APK到图像纹理特征提取的切割方式,称作“图谱化段自增长的纹理分割算法”。其次,基于Low-tubal rank的张量奇异值(Tensor Singular Value Decomposition,t-SVD)分解方式,实现不同尺寸大小的图像统一成固定的三阶张量的形式,输入到神经网络中进行模型的训练和学习。最后,提出了一种灵活的恶意代码检测框架(Flexible Malicious App Detection Model based on Generative Adversarial Networ...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
图2.2张量为多维数据阵列,其中矢量是一阶张量,矩阵表示成二阶张量
公式( U 和 V 满足: , ,其中 是单位张量 生成式对抗网络网络模型生成式对抗网络(GAN,GenerativeAdversarial Networks)是 Ian J.Goodfel在 2014 年提出来的一个通过对抗学习生成模型的深度学习框架,是近年来习的代表。GAN 的思想主要源自于博弈论的极大极小的过程,主要由一个Generative Model)和判别器(Discriminative Model)构成,通过对抗学习行训练。生成器的作用是生成更加逼真的数据分布,判别器的作用是尽最测出哪些是原始数据,哪些是新生成的数据,这样就构成了一个动态的“博。在最理想的情况下,生成器生成的样本足以“以假乱真”,对于判别器来说生成器生成是样本究竟是不是真的,即 D(G(z)) = 0.5,其中 z 是输入到生成足的数据分布。Gooddellow 等人在论文中使用图 2.3 的演变过程介绍了 GA练的基本过程
图 3.1 基于对抗式生成网络的恶意代码的检测模型整个模型框架分为三大部分:生成式对抗网络的判别器(DiscriminativeNetwork)、生成器(Generator Network)以及黑盒检测器(BlackBone),损失函数主要使用了基于分类的交叉熵函数和基于 GAN 网络生成新的图像纹理的感知力损失函数。生成器网络输入和原始图像大小相同的近似的数据分布,生成的新数据(恶意代码)也是 64×64×1 的,判别器网络输入的 reshape 是生成器输出的大小,网络输出的是恶意代码或者正常代码的概率值,整个模型是在一个辅助分类器 GAN 模型的基础上的一个训练,模型的损失函数主要有三部分,第一是生成器网络生成的近似的数据和真实的原始数据的特征误差程度,叫感知损失;第二是判别器网络得到的分类值和原始标签的交叉熵函数;第三是黑盒检测得到结果和原始标签的对比。3.2 B2M 算法B2M 算法是将二进制文件转换成灰度图像的一种方法。针对恶意代码的可执行
【参考文献】:
期刊论文
[1]基于生成对抗网络的低秩图像生成方法[J]. 赵树阳,李建武. 自动化学报. 2018(05)
[2]生成式对抗网络研究进展[J]. 王万良,李卓蓉. 通信学报. 2018(02)
[3]生成式对抗网络GAN的研究进展与展望[J]. 王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃. 自动化学报. 2017(03)
[4]基于小波变换和ODPSF的纹理图象分割方法[J]. 靳华,王晓丹,赵荣椿. 中国图象图形学报. 2000(10)
硕士论文
[1]模糊车牌图像的盲去模糊算法研究[D]. 毛勇.杭州电子科技大学 2018
[2]基于机器学习的安卓恶意应用检测方法研究[D]. 田明会.北京交通大学 2017
本文编号:3345715
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
图2.2张量为多维数据阵列,其中矢量是一阶张量,矩阵表示成二阶张量
公式( U 和 V 满足: , ,其中 是单位张量 生成式对抗网络网络模型生成式对抗网络(GAN,GenerativeAdversarial Networks)是 Ian J.Goodfel在 2014 年提出来的一个通过对抗学习生成模型的深度学习框架,是近年来习的代表。GAN 的思想主要源自于博弈论的极大极小的过程,主要由一个Generative Model)和判别器(Discriminative Model)构成,通过对抗学习行训练。生成器的作用是生成更加逼真的数据分布,判别器的作用是尽最测出哪些是原始数据,哪些是新生成的数据,这样就构成了一个动态的“博。在最理想的情况下,生成器生成的样本足以“以假乱真”,对于判别器来说生成器生成是样本究竟是不是真的,即 D(G(z)) = 0.5,其中 z 是输入到生成足的数据分布。Gooddellow 等人在论文中使用图 2.3 的演变过程介绍了 GA练的基本过程
图 3.1 基于对抗式生成网络的恶意代码的检测模型整个模型框架分为三大部分:生成式对抗网络的判别器(DiscriminativeNetwork)、生成器(Generator Network)以及黑盒检测器(BlackBone),损失函数主要使用了基于分类的交叉熵函数和基于 GAN 网络生成新的图像纹理的感知力损失函数。生成器网络输入和原始图像大小相同的近似的数据分布,生成的新数据(恶意代码)也是 64×64×1 的,判别器网络输入的 reshape 是生成器输出的大小,网络输出的是恶意代码或者正常代码的概率值,整个模型是在一个辅助分类器 GAN 模型的基础上的一个训练,模型的损失函数主要有三部分,第一是生成器网络生成的近似的数据和真实的原始数据的特征误差程度,叫感知损失;第二是判别器网络得到的分类值和原始标签的交叉熵函数;第三是黑盒检测得到结果和原始标签的对比。3.2 B2M 算法B2M 算法是将二进制文件转换成灰度图像的一种方法。针对恶意代码的可执行
【参考文献】:
期刊论文
[1]基于生成对抗网络的低秩图像生成方法[J]. 赵树阳,李建武. 自动化学报. 2018(05)
[2]生成式对抗网络研究进展[J]. 王万良,李卓蓉. 通信学报. 2018(02)
[3]生成式对抗网络GAN的研究进展与展望[J]. 王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃. 自动化学报. 2017(03)
[4]基于小波变换和ODPSF的纹理图象分割方法[J]. 靳华,王晓丹,赵荣椿. 中国图象图形学报. 2000(10)
硕士论文
[1]模糊车牌图像的盲去模糊算法研究[D]. 毛勇.杭州电子科技大学 2018
[2]基于机器学习的安卓恶意应用检测方法研究[D]. 田明会.北京交通大学 2017
本文编号:3345715
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3345715.html