移动边缘网络计算卸载调度与资源管理策略优化研究
发布时间:2020-12-26 01:15
通过将计算和存储资源广泛地分布到更接近用户或数据源的网络边缘,移动边缘计算(Mobile Edge Computing,MEC)支持在无线接入网内完成移动应用的计算卸载过程,大幅降低了网络的端到端时延,并有效减轻了核心网和数据中心的处理压力。计算卸载决策,包括用户侧卸载决策(如任务是否卸载、如何卸载以及何时卸载)和运营商侧卸载决策(如是否允许用户卸载、分配多少资源进行卸载),是MEC能否提升用户体验的关键。由于MEC环境的复杂性,影响卸载决策的因素众多,如何设计最优的卸载决策策略,以充分挖掘MEC在时延、能耗上的性能增益,是非常具有挑战性的科学问题。任务调度与资源管理是MEC卸载决策过程中需要考虑的两个重要因素。一方面,MEC环境本质上是一个分布式异构并行计算环境,只有对任务进行合理调度,才能充分发挥该计算环境的性能优势。若考虑网络环境的动态变化,则还需要对任务卸载的时机进行调度决策。另一方面,由于网络边缘的资源有限,必须对这些资源进行合理分配以充分发挥它们的效用。在用户较多的情况下,还需要对是否允许用户卸载进行决策(即准入决策),避免资源的过度竞争。在此背景下,本文分别针对用户视角下...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:152 页
【学位级别】:博士
【部分图文】:
移动边缘计算网络结构示意图
电子科技大学博士学位论文3.4基于DRL的任务卸载调度本节基于当前最优的DRL算法PPO来学习该MDP的最优卸载调度策略。首先介绍了用于近似该卸载调度策略的神经网络架构。然后设计了基于PPO的策略网络训练算法。最后讨论了几种提高训练过程效率的方法。3.4.1神经网络架构设计本节同样采用共享参数的DNN架构来设计该MDP的策略网络和价值网络。所设计的DNN架构如图3-3所示。其中,策略网络(an|sn)用于训练,以尽可能拟合最优策略;价值网络v(sn)则用作估计函数。两个网络共享大部分网络结构(网络层和对应的参数)并且具有相同的输入(均为任一系统状态sn2S)。不同的是,在共享的FC层之后,策略网络采用softmax层来输出卸载调度动作的概率分布;而价值网络则仍然采用FC层来输出状态价值。!"#(%|")图3-3共享参数DNN架构设计如3.3.1节所述,该MDP的状态空间非常巨大。仅使用简单的FC网络架构对卸载调度策略进行拟合会使得训练效率和训练结果均不理想。通过对状态空间的观察可以发现,对每一个状态s=(Q,slpu,sdtu,sms,x,d),其大多数状态参数是用来描述任务队列的,即Q。由于Q具有固定的矩阵形式并且所存储的数据为结构化数据,因此将CNN网络结构嵌入到所设计的DNN架构中,以高效提取任务队列特68
本文编号:2938749
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:152 页
【学位级别】:博士
【部分图文】:
移动边缘计算网络结构示意图
电子科技大学博士学位论文3.4基于DRL的任务卸载调度本节基于当前最优的DRL算法PPO来学习该MDP的最优卸载调度策略。首先介绍了用于近似该卸载调度策略的神经网络架构。然后设计了基于PPO的策略网络训练算法。最后讨论了几种提高训练过程效率的方法。3.4.1神经网络架构设计本节同样采用共享参数的DNN架构来设计该MDP的策略网络和价值网络。所设计的DNN架构如图3-3所示。其中,策略网络(an|sn)用于训练,以尽可能拟合最优策略;价值网络v(sn)则用作估计函数。两个网络共享大部分网络结构(网络层和对应的参数)并且具有相同的输入(均为任一系统状态sn2S)。不同的是,在共享的FC层之后,策略网络采用softmax层来输出卸载调度动作的概率分布;而价值网络则仍然采用FC层来输出状态价值。!"#(%|")图3-3共享参数DNN架构设计如3.3.1节所述,该MDP的状态空间非常巨大。仅使用简单的FC网络架构对卸载调度策略进行拟合会使得训练效率和训练结果均不理想。通过对状态空间的观察可以发现,对每一个状态s=(Q,slpu,sdtu,sms,x,d),其大多数状态参数是用来描述任务队列的,即Q。由于Q具有固定的矩阵形式并且所存储的数据为结构化数据,因此将CNN网络结构嵌入到所设计的DNN架构中,以高效提取任务队列特68
本文编号:2938749
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2938749.html