当前位置:主页 > 管理论文 > 管理理论论文 >

基于强化学习的网络切片动态资源管理算法研究

发布时间:2025-01-06 04:32
  未来的通信业务将更加丰富多样,由于不同业务有不同的通信需求,而传统网络只能满足单一服务需求,因此网络切片技术应运而生,该技术允许在一个物理网络上建立多个逻辑网络满足各业务的通信需求。为了保证网络切片优异的通信质量,高效的资源管理机制是极其重要的。因此,本文的工作重点是在接入网切片场景下,致力于优化资源管理的方案,且本文的研究工作总结如下:针对很多文献中拓扑感知不符合实际的问题,提出了一种基于部分观察马尔可夫决策过程(Partial Observation Markov Decision Process,POMDP)的多资源联合管理方案。针对物理网络拓扑设计了一种心跳包检测机制部分感知当前的拓扑情况。基于完全的队列状态和部分感知的拓扑状态利用POMDP决策出切片内各服务功能链的计算和链路资源的编排和映射方式。混合启发式值迭代算法因其复杂度较低而用于求解该POMDP模型,并获得近似最优资源管理策略。仿真实验表明该方案可以在动态拓扑情况下优化决策资源编排和映射而降低时延且最小化修复成本,实现低成本的低时延通信并提升资源利用率。针对终端在接入网切片内移动时造成的高时延问题,基于强化学习方法提出了...

【文章页数】:92 页

【学位级别】:硕士

【部分图文】:

图3.4权重对效用的影响

图3.4权重对效用的影响

仿真中有三类切片,且三类切片的SFC总数目范围为[10,70],一类切片的SFC占总数的50%,二类切片的SFC数目占比30%,三类切片的SFC数目占比20%。每个SFC的数据到达服从非齐次泊松过程,而一类切片的平均数据到达率最高,二类切片的平均数据到达率....


图3.5权重对时延的影响

图3.5权重对时延的影响

仿真中有三类切片,且三类切片的SFC总数目范围为[10,70],一类切片的SFC占总数的50%,二类切片的SFC数目占比30%,三类切片的SFC数目占比20%。每个SFC的数据到达服从非齐次泊松过程,而一类切片的平均数据到达率最高,二类切片的平均数据到达率....


图3.6权重对修复成本的影响

图3.6权重对修复成本的影响

图3.6权重对修复成本的影响图3.7CVI和MHVI算法的效用比较图3.8CVI和MHVI的时延对比图3.9CVI和MHVI的修复成本三种资源管理方案的对比结果如图3.11、3.12和3.13所示。马尔可夫近似(MarkovAppr....


图3.7CVI和MHVI算法的效用比较

图3.7CVI和MHVI算法的效用比较

图3.6权重对修复成本的影响图3.7CVI和MHVI算法的效用比较图3.8CVI和MHVI的时延对比图3.9CVI和MHVI的修复成本三种资源管理方案的对比结果如图3.11、3.12和3.13所示。马尔可夫近似(MarkovAppr....



本文编号:4023798

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/glzh/4023798.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bc6a2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com