在线学习的主用户仿冒攻击策略
发布时间:2021-04-11 13:47
在认知无线网络中,次用户通过频谱感知来学习频谱环境,从而接入那些没有被主用户占用的频谱空隙。事实上,多种恶意攻击的存在会影响次用户频谱感知的可靠性。只有深入研究恶意攻击策略,才能确保认知无线网络的安全。基于此,研究了一种认知无线网络中的欺骗性干扰策略,即主用户仿冒攻击策略,该攻击策略通过在信道上传输伪造的主用户信号来降低次用户频谱感知的性能。具体来说,将攻击策略问题建模为在线学习问题,并提出基于汤普森采样的攻击策略以实现在探索不确定信道和利用高性能信道间的权衡。仿真结果表明,与现有的攻击策略相比,提出的攻击策略能更好地通过在线学习优化攻击决策以适应非平稳的认知无线网络。
【文章来源】:国防科技大学学报. 2020,42(04)北大核心EICSCD
【文章页数】:6 页
【部分图文】:
主用户仿冒攻击者的帧结构
图2比较了在稳态信道场景下攻击策略的性能,具体仿真参数为:K=10,N=1,λ=1,T=2000,γ=0.99。可以看出:在线攻击策略的主用户仿冒累积攻击为376,比PROLA和RA分别高了35%和119%;相应的次用户累积接入为1105,比PROLA、RA和无攻击者分别少了8%、28%和36%。性能提升的原因有两方面:①考虑并有效处理了次用户行为的非平稳性带来的挑战;② 提出的算法能够更有效而快速地利用观察信息改进攻击策略。值得注意的是,主用户仿冒累积攻击的增加量和次用户累积接入的减少量是密切相关但又不完全相同的。以在线攻击策略为例,相较于无攻击的情况,主用户仿冒累积攻击增加了376,而次用户累积接入减少了609,这是因为每一次成功的主用户仿冒攻击对次用户的影响包括直接的阻止次用户接入和间接的破坏次用户对主用户行为规律的学习。图3比较了在非稳态信道场景下攻击策略的性能,具体仿真参数为:K=10,N=1,λ=1, T=2000,γ=0.99,ΔT=100,PΔ∈[0,1]。随着PΔ的增加,主用户使用状态的非平稳性不断增加,极大影响了次用户和攻击者的性能。随着PΔ从0到1,三种攻击策略的主用户仿冒累积攻击都有着不同程度的下降。其中PROLA的主用户仿冒累积攻击下降了40%,而在线攻击策略的主用户仿冒累积攻击只下降了8%,与此同时两者之间的差距也从35%增加到了98%。这是因为引入的遗忘因子γ可以很好地处理认知无线网络中的非平稳性。值得注意的是,次用户累积接入并没有随着PΔ的增加而产生一致的变化,这是因为次用户在无攻击情况下的累积接入随着PΔ的增加而减少。在线攻击策略的次用户累积接入随着PΔ的增加甚至有小幅增加的原因在于:主用户仿冒攻击的间接影响本质上是为次用户学习的环境添加非平稳性,其影响随着环境本身非平稳性的增加而减弱。
图3比较了在非稳态信道场景下攻击策略的性能,具体仿真参数为:K=10,N=1,λ=1, T=2000,γ=0.99,ΔT=100,PΔ∈[0,1]。随着PΔ的增加,主用户使用状态的非平稳性不断增加,极大影响了次用户和攻击者的性能。随着PΔ从0到1,三种攻击策略的主用户仿冒累积攻击都有着不同程度的下降。其中PROLA的主用户仿冒累积攻击下降了40%,而在线攻击策略的主用户仿冒累积攻击只下降了8%,与此同时两者之间的差距也从35%增加到了98%。这是因为引入的遗忘因子γ可以很好地处理认知无线网络中的非平稳性。值得注意的是,次用户累积接入并没有随着PΔ的增加而产生一致的变化,这是因为次用户在无攻击情况下的累积接入随着PΔ的增加而减少。在线攻击策略的次用户累积接入随着PΔ的增加甚至有小幅增加的原因在于:主用户仿冒攻击的间接影响本质上是为次用户学习的环境添加非平稳性,其影响随着环境本身非平稳性的增加而减弱。图4比较了不同λ下的在线攻击策略性能,具体仿真参数为:K=40,N=4,λ∈[1,37], T=2000,γ=0.99,ΔT=100,PΔ=0.5。随着λ从1到37,在线攻击策略的主用户仿冒累计攻击在稳态和非稳态信道场景下分别提升了30%和90%。这是因为攻击者在每个时隙观察到的信道状态信息随着λ的增加而增加,也就是说攻击者的学习能力随着λ的增加而增加。相较于稳态信道场景,λ的增加对非稳态信道场景的影响更大。这是因为非稳态信道场景更为复杂,攻击者学习起来也更困难。值得注意的是,λ的增加会提高对攻击者计算能力的要求,因此需要在性能和代价间权衡。在刚开始的阶段,通过少量增加λ(如从1到4),主用户仿冒累积攻击显著提高;当λ足够大时(如从10到13),主用户仿冒累积攻击的增加量就几乎可忽略不计了。本次仿真中,当λ为10时,攻击者的表现已经接近最优。
【参考文献】:
期刊论文
[1]改进多重信号分类算法的宽带频谱快速感知方法[J]. 孙伟朝,王丰华,黄知涛,王翔. 国防科技大学学报. 2015(05)
[2]基于Sub-Nyquist采样的单通道频谱感知技术[J]. 杨鹏,樊昀,黄知涛,柳征,姜文利. 国防科技大学学报. 2013(04)
[3]认知无线电网络安全综述[J]. 裴庆祺,李红宁,赵弘洋,李男,闵莹. 通信学报. 2013(01)
本文编号:3131363
【文章来源】:国防科技大学学报. 2020,42(04)北大核心EICSCD
【文章页数】:6 页
【部分图文】:
主用户仿冒攻击者的帧结构
图2比较了在稳态信道场景下攻击策略的性能,具体仿真参数为:K=10,N=1,λ=1,T=2000,γ=0.99。可以看出:在线攻击策略的主用户仿冒累积攻击为376,比PROLA和RA分别高了35%和119%;相应的次用户累积接入为1105,比PROLA、RA和无攻击者分别少了8%、28%和36%。性能提升的原因有两方面:①考虑并有效处理了次用户行为的非平稳性带来的挑战;② 提出的算法能够更有效而快速地利用观察信息改进攻击策略。值得注意的是,主用户仿冒累积攻击的增加量和次用户累积接入的减少量是密切相关但又不完全相同的。以在线攻击策略为例,相较于无攻击的情况,主用户仿冒累积攻击增加了376,而次用户累积接入减少了609,这是因为每一次成功的主用户仿冒攻击对次用户的影响包括直接的阻止次用户接入和间接的破坏次用户对主用户行为规律的学习。图3比较了在非稳态信道场景下攻击策略的性能,具体仿真参数为:K=10,N=1,λ=1, T=2000,γ=0.99,ΔT=100,PΔ∈[0,1]。随着PΔ的增加,主用户使用状态的非平稳性不断增加,极大影响了次用户和攻击者的性能。随着PΔ从0到1,三种攻击策略的主用户仿冒累积攻击都有着不同程度的下降。其中PROLA的主用户仿冒累积攻击下降了40%,而在线攻击策略的主用户仿冒累积攻击只下降了8%,与此同时两者之间的差距也从35%增加到了98%。这是因为引入的遗忘因子γ可以很好地处理认知无线网络中的非平稳性。值得注意的是,次用户累积接入并没有随着PΔ的增加而产生一致的变化,这是因为次用户在无攻击情况下的累积接入随着PΔ的增加而减少。在线攻击策略的次用户累积接入随着PΔ的增加甚至有小幅增加的原因在于:主用户仿冒攻击的间接影响本质上是为次用户学习的环境添加非平稳性,其影响随着环境本身非平稳性的增加而减弱。
图3比较了在非稳态信道场景下攻击策略的性能,具体仿真参数为:K=10,N=1,λ=1, T=2000,γ=0.99,ΔT=100,PΔ∈[0,1]。随着PΔ的增加,主用户使用状态的非平稳性不断增加,极大影响了次用户和攻击者的性能。随着PΔ从0到1,三种攻击策略的主用户仿冒累积攻击都有着不同程度的下降。其中PROLA的主用户仿冒累积攻击下降了40%,而在线攻击策略的主用户仿冒累积攻击只下降了8%,与此同时两者之间的差距也从35%增加到了98%。这是因为引入的遗忘因子γ可以很好地处理认知无线网络中的非平稳性。值得注意的是,次用户累积接入并没有随着PΔ的增加而产生一致的变化,这是因为次用户在无攻击情况下的累积接入随着PΔ的增加而减少。在线攻击策略的次用户累积接入随着PΔ的增加甚至有小幅增加的原因在于:主用户仿冒攻击的间接影响本质上是为次用户学习的环境添加非平稳性,其影响随着环境本身非平稳性的增加而减弱。图4比较了不同λ下的在线攻击策略性能,具体仿真参数为:K=40,N=4,λ∈[1,37], T=2000,γ=0.99,ΔT=100,PΔ=0.5。随着λ从1到37,在线攻击策略的主用户仿冒累计攻击在稳态和非稳态信道场景下分别提升了30%和90%。这是因为攻击者在每个时隙观察到的信道状态信息随着λ的增加而增加,也就是说攻击者的学习能力随着λ的增加而增加。相较于稳态信道场景,λ的增加对非稳态信道场景的影响更大。这是因为非稳态信道场景更为复杂,攻击者学习起来也更困难。值得注意的是,λ的增加会提高对攻击者计算能力的要求,因此需要在性能和代价间权衡。在刚开始的阶段,通过少量增加λ(如从1到4),主用户仿冒累积攻击显著提高;当λ足够大时(如从10到13),主用户仿冒累积攻击的增加量就几乎可忽略不计了。本次仿真中,当λ为10时,攻击者的表现已经接近最优。
【参考文献】:
期刊论文
[1]改进多重信号分类算法的宽带频谱快速感知方法[J]. 孙伟朝,王丰华,黄知涛,王翔. 国防科技大学学报. 2015(05)
[2]基于Sub-Nyquist采样的单通道频谱感知技术[J]. 杨鹏,樊昀,黄知涛,柳征,姜文利. 国防科技大学学报. 2013(04)
[3]认知无线电网络安全综述[J]. 裴庆祺,李红宁,赵弘洋,李男,闵莹. 通信学报. 2013(01)
本文编号:3131363
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3131363.html