基于深度强化学习的综合能源业务通道优化机制
发布时间:2021-12-24 10:01
为了保障综合能源系统的稳定运行,承载综合能源业务的通信网络需要具备高可靠、低风险等特征.依据综合能源业务的通道要求,提出了一种深度强化学习的算法,旨在对大规模综合能源业务在承载的电力通信网上寻找到整体最优的路径.该方法以整体时延和网络负载均衡度为目标,对网络拓扑进行训练,并保存模型,然后通过迭代学习获取最优的结果.仿真结果表明,该方法找到的路径既可以保证整体时延较短,又可以保证网络的整体负载均衡.同时,在网络规模很大、业务数量很多的情况下,深度强化学习算法可有效提高计算效率.
【文章来源】:北京邮电大学学报. 2020,43(02)北大核心EICSCD
【文章页数】:7 页
【部分图文】:
综合能源系统
基于深度强化学习的业务通道优化算法流程
对某地区电力通信网拓扑进行路由优化及分析,拓扑图如图3所示,总共设有14个路由节点,节点之间的权重值表示传输时延代价.现有5条源—目的业务:2—13,1—9,3—14,5—8,3—6.每条业务的备选路径在20个左右,状态的量级是205,目标是为这5条业务分别从备选路径中寻求路径,使得目标函数min()最小.算法中的参数实际取值如表1所示.
【参考文献】:
期刊论文
[1]基于值函数和策略梯度的深度强化学习综述[J]. 刘建伟,高峰,罗雄麟. 计算机学报. 2019(06)
[2]综合能源系统与能源互联网简述[J]. 余晓丹,徐宪东,陈硕翼,吴建中,贾宏杰. 电工技术学报. 2016(01)
[3]区域综合能源系统若干问题研究[J]. 贾宏杰,王丹,徐宪东,余晓丹. 电力系统自动化. 2015(07)
[4]考虑电力通信网可靠性的业务路由优化分配方法[J]. 蔡伟,杨洪,熊飞,李俊娥,刘剑,赵子岩,刘开培. 电网技术. 2013(12)
[5]LTE网络中具备QoS保障的动态负载均衡算法[J]. 王浩,李知航,潘志文,尤肖虎,吴平. 中国科学:信息科学. 2012(06)
[6]图的深度优先遍历算法及运用[J]. 周泰. 电脑编程技巧与维护. 2011(16)
[7]SDH光传输系统的时延测算[J]. 高钧利. 浙江电力. 2011(04)
[8]强化学习研究综述[J]. 高阳,陈世福,陆鑫. 自动化学报. 2004(01)
本文编号:3550279
【文章来源】:北京邮电大学学报. 2020,43(02)北大核心EICSCD
【文章页数】:7 页
【部分图文】:
综合能源系统
基于深度强化学习的业务通道优化算法流程
对某地区电力通信网拓扑进行路由优化及分析,拓扑图如图3所示,总共设有14个路由节点,节点之间的权重值表示传输时延代价.现有5条源—目的业务:2—13,1—9,3—14,5—8,3—6.每条业务的备选路径在20个左右,状态的量级是205,目标是为这5条业务分别从备选路径中寻求路径,使得目标函数min()最小.算法中的参数实际取值如表1所示.
【参考文献】:
期刊论文
[1]基于值函数和策略梯度的深度强化学习综述[J]. 刘建伟,高峰,罗雄麟. 计算机学报. 2019(06)
[2]综合能源系统与能源互联网简述[J]. 余晓丹,徐宪东,陈硕翼,吴建中,贾宏杰. 电工技术学报. 2016(01)
[3]区域综合能源系统若干问题研究[J]. 贾宏杰,王丹,徐宪东,余晓丹. 电力系统自动化. 2015(07)
[4]考虑电力通信网可靠性的业务路由优化分配方法[J]. 蔡伟,杨洪,熊飞,李俊娥,刘剑,赵子岩,刘开培. 电网技术. 2013(12)
[5]LTE网络中具备QoS保障的动态负载均衡算法[J]. 王浩,李知航,潘志文,尤肖虎,吴平. 中国科学:信息科学. 2012(06)
[6]图的深度优先遍历算法及运用[J]. 周泰. 电脑编程技巧与维护. 2011(16)
[7]SDH光传输系统的时延测算[J]. 高钧利. 浙江电力. 2011(04)
[8]强化学习研究综述[J]. 高阳,陈世福,陆鑫. 自动化学报. 2004(01)
本文编号:3550279
本文链接:https://www.wllwen.com/kejilunwen/dongligc/3550279.html