基于深度增强学习和多目标优化改进的卫星资源分配算法
发布时间:2021-05-22 21:59
针对多波束卫星系统中资源分配序列决策的多目标优化(MOP)问题,为了在提升卫星系统性能的同时,提高用户业务需求的满意度,提出了一种基于深度增强学习(DRL)的DRL-MOP算法。所提算法基于DRL和MOP技术,对动态变化的系统环境和用户到达模型建模,以归一化处理后的频谱效率、能量效率和业务满意度指数的加权和作为优化目标,实现了系统和用户累计性能的优化。仿真对比表明,所提算法可以更好地解决面向多波束卫星系统的多目标优化问题,系统性能和用户满意度优化结果较好,且收敛快、复杂度低。
【文章来源】:通信学报. 2020,41(06)北大核心EICSCD
【文章页数】:10 页
【参考文献】:
期刊论文
[1]基于深度强化学习的蜂窝网资源分配算法[J]. 廖晓闽,严少虎,石嘉,谭震宇,赵钟灵,李赞. 通信学报. 2019(02)
[2]Joint Optimization of Satisfaction Index and Spectrum Efficiency with Cache Restricted for Resource Allocation in Multi-Beam Satellite Systems[J]. Pei Zhang,Xiaohui Wang,Zhiguo Ma,Junde Song. 中国通信. 2019(02)
[3]Joint Estimation of Carrier Frequency and Phase Offset Based on Pilot Symbols in Quasi-Constant Envelope OFDM Satellite Systems[J]. Cheng Wang,Gaofeng Cui,Weidong Wang,Yinghai Zhang. 中国通信. 2017(07)
[4]一种改进的多波束卫星通信系统功率分配算法[J]. 史煜,张邦宁,郭道省,杨柳. 通信技术. 2016(10)
[5]一种能量和频谱效率兼顾的多波束卫星系统功率分配策略[J]. 阚茜,许小东. 中国科学技术大学学报. 2016(02)
[6]卫星通信的近期发展与前景展望[J]. 易克初,李怡,孙晨华,南春国. 通信学报. 2015(06)
博士论文
[1]卫星通信系统中动态资源管理技术研究[D]. 刘帅军.北京邮电大学 2018
硕士论文
[1]衰落信道下波束卫星系统功率分配策略研究[D]. 阚茜.中国科学技术大学 2016
本文编号:3201729
【文章来源】:通信学报. 2020,41(06)北大核心EICSCD
【文章页数】:10 页
【参考文献】:
期刊论文
[1]基于深度强化学习的蜂窝网资源分配算法[J]. 廖晓闽,严少虎,石嘉,谭震宇,赵钟灵,李赞. 通信学报. 2019(02)
[2]Joint Optimization of Satisfaction Index and Spectrum Efficiency with Cache Restricted for Resource Allocation in Multi-Beam Satellite Systems[J]. Pei Zhang,Xiaohui Wang,Zhiguo Ma,Junde Song. 中国通信. 2019(02)
[3]Joint Estimation of Carrier Frequency and Phase Offset Based on Pilot Symbols in Quasi-Constant Envelope OFDM Satellite Systems[J]. Cheng Wang,Gaofeng Cui,Weidong Wang,Yinghai Zhang. 中国通信. 2017(07)
[4]一种改进的多波束卫星通信系统功率分配算法[J]. 史煜,张邦宁,郭道省,杨柳. 通信技术. 2016(10)
[5]一种能量和频谱效率兼顾的多波束卫星系统功率分配策略[J]. 阚茜,许小东. 中国科学技术大学学报. 2016(02)
[6]卫星通信的近期发展与前景展望[J]. 易克初,李怡,孙晨华,南春国. 通信学报. 2015(06)
博士论文
[1]卫星通信系统中动态资源管理技术研究[D]. 刘帅军.北京邮电大学 2018
硕士论文
[1]衰落信道下波束卫星系统功率分配策略研究[D]. 阚茜.中国科学技术大学 2016
本文编号:3201729
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3201729.html