当前位置:主页 > 科技论文 > 信息工程论文 >

基于强化学习的定向无线通信网络抗干扰资源调度算法

发布时间:2022-01-06 03:44
  为了在无线网络中进行高效的链路资源调度、减小网络干扰、提高网络容量,提出了一种利用回溯天线并考虑干扰环境的链路资源分布式智能调度算法.首先,结合通信的路径损耗模型设计卷积核,对节点密度矩阵进行卷积来衡量干扰链路强度,从而避免对所有干扰链路进行信道估计产生巨大的计算代价;然后,结合强化学习的思想设计了与通信环境交互的链路调度学习模型,每个链路利用神经网络进行独立的训练,将训练所得的决策结果反馈到环境中进行状态更新,模型在不断更新的环境中迭代来学习最优的调度策略.该方法能分布式的运行,可有效衡量无线网络中的链路干扰强度,结合衡量结果进行高效的链路资源分布式调度,从而最大化网络容量.仿真结果验证了该调度算法无论是在算法迭代收敛还是网络容量性能上都能很好地逼近全局的调度算法,达到全局算法最优结果的92%~100%. 

【文章来源】:电波科学学报. 2020,35(04)北大核心CSCD

【文章页数】:11 页

【部分图文】:

基于强化学习的定向无线通信网络抗干扰资源调度算法


强化学习原理框图

框图,调度算法,链路,原理


本文设计的网络链路分布式调度模型如图3所示. 该模型将各个定向传输链路看成独立的算法执行体,各个执行体在感知得到的通信干扰环境下独立地进行智能决策. 当链路决策完成后,将决策结果反馈给自身链路来进行环境更新. 各个链路在下一次迭代中,会根据更新的环境和自身决策带来的奖励来进行新一轮的智能决策,整个网络在不断迭代过程中学习最优的链路调度策略.1.2 数学模型

示例,波束,链路,节点


在定向传输中,假设采用具有4个方向的天线定向传输模型. 如图4所示,将发射节点周围等分为4个波束方向,按顺时针方向对波束编号. 通信时选取对准接收节点的定向波束进行数据传输. 当链路j在进行定向传输时,链路i的接收节点Di若在其波束覆盖范围内,则会受到干扰,且其干扰强度取决于d(Sj,Di).本文的设计目标是仅利用节点位置信息,在考虑网络定向干扰强度的情况下,通过决策各链路是否激活来最大化网络容量,即

【参考文献】:
期刊论文
[1]高密度场景下D2D通信干扰协调的方法[J]. 李校林,唐虹,李同会,陈永丽.  计算机工程与设计. 2019(02)



本文编号:3571662

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3571662.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户62526***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com