基于深度强化学习的动态频谱分配方法研究
发布时间:2020-12-14 03:03
随着无线通信技术的飞速发展,人们对频谱资源的需求日愈增加,频谱资源的稀缺问题也愈发突出,因此亟需提出新的智能方法来提高频谱的利用率。而构造认知无线网络是一种有效的解决方案,在面对复杂环境的动态性时认知用户可以相应地调整行为与控制策略,从而更有效地利用频谱资源,提高网络系统的认知用频效率。频谱资源管理是认知无线网络的基本任务之一,主要涵盖了功率控制和信道分配两个核心问题。功率控制指的是网络中的认知用户能够在对授权用户不造成有害干扰的情况下,调整发射功率以机会式接入授权频段,实现认知用户可以和授权用户共享频谱资源。而信道分配是将某一时段的空闲信道合理地分配给认知用户,充分利用处于闲置状态的频谱资源。由于认知无线网络的广泛应用,网络结构越来越错综复杂,要建立相应的数学模型以模拟出高复杂度的网络环境变得难以实现。而强化学习中基于无模型的算法可以有效地解决该问题。加之近年来深度学习的兴起,强化学习与深度学习相结合的深度强化学习在处理复杂问题和数据运算方面都表现出优异的能力。因此,本文重点研究了深度强化学习的智能算法在认知无线网络中频谱资源管理方面的应用,尤其是功率控制和信道分配这两方面的优化问题...
【文章来源】:广东工业大学广东省
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.3 本论文主要研究内容及创新性
1.3.1 主要研究内容
1.3.2 本文创新成果
1.4 论文章节安排
第二章 认知无线网络关键技术和强化学习基础理论
2.1 认知无线网络关键技术
2.1.1 认知无线网络架构
2.1.2 频谱资源管理框架
2.1.3 频谱资源分配
2.2 强化学习基础理论
2.2.1 数学框架
2.2.2 学习过程
2.2.3 深度强化学习
2.3 本章小结
第三章 基于深度强化学习的动态功率控制方法研究
3.1 系统模型设计
3.2 动态功率控制问题描述
3.3 动态功率控制问题解决方案
3.3.1 优先记忆库和竞争深度Q网络
3.3.2 优先记忆库结合竞争深度Q网络的动态功率控制方法
3.4 仿真实验结果及性能对比
3.5 本章小结
第四章 基于深度强化学习的动态功率控制及信道分配联合方法研究
4.1 系统模型设计
4.2 动态功率控制及信道分配联合问题描述
4.3 动态功率控制及信道分配联合问题解决方案
4.3.1 长短期记忆循环神经网络
4.3.2 长短期记忆深度Q网络的动态功率控制及信道分配联合方法
4.4 仿真实验结果及性能分析
4.5 本章小结
结论
参考文献
攻读学位期间学术成果
致谢
本文编号:2915681
【文章来源】:广东工业大学广东省
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.3 本论文主要研究内容及创新性
1.3.1 主要研究内容
1.3.2 本文创新成果
1.4 论文章节安排
第二章 认知无线网络关键技术和强化学习基础理论
2.1 认知无线网络关键技术
2.1.1 认知无线网络架构
2.1.2 频谱资源管理框架
2.1.3 频谱资源分配
2.2 强化学习基础理论
2.2.1 数学框架
2.2.2 学习过程
2.2.3 深度强化学习
2.3 本章小结
第三章 基于深度强化学习的动态功率控制方法研究
3.1 系统模型设计
3.2 动态功率控制问题描述
3.3 动态功率控制问题解决方案
3.3.1 优先记忆库和竞争深度Q网络
3.3.2 优先记忆库结合竞争深度Q网络的动态功率控制方法
3.4 仿真实验结果及性能对比
3.5 本章小结
第四章 基于深度强化学习的动态功率控制及信道分配联合方法研究
4.1 系统模型设计
4.2 动态功率控制及信道分配联合问题描述
4.3 动态功率控制及信道分配联合问题解决方案
4.3.1 长短期记忆循环神经网络
4.3.2 长短期记忆深度Q网络的动态功率控制及信道分配联合方法
4.4 仿真实验结果及性能分析
4.5 本章小结
结论
参考文献
攻读学位期间学术成果
致谢
本文编号:2915681
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2915681.html