基于MDP的Massive MIMO物理层安全算法
发布时间:2020-12-17 00:14
随着无线通信技术的飞速发展,5G技术将在2020年完成标准制定并全面商用。作为5G的关键技术之一,大规模天线阵列(Massive multiple input multiple output,Massive MIMO)技术研究潜力巨大。无线媒质固有的开放性特征使无线网络信息传输深受窃听困扰。传统的无线安全对复杂的高层加密依赖性很高,而物理层安全作为底层安全技术,利用无线信道物理特性存在的固有差异能获得无条件安全,因此研究Massive MIMO系统窃听信道的物理层安全问题十分必要。此外,近几年无线通信和人工智能产业齐头并进,催生了无线通信理论与智能学科理论的交叉学科领域研究,以强化学习、深度学习为代表的机器学习理论成为无线通信技术的重要研究方法。基于强化学习理论的Massive MIMO信号处理有大量理论文献,但其研究分散,场景差异较大,算法通用性不强,并未形成深入、完善的理论体系。本文根据Massive MIMO物理层的无线信号呈现大规模、高速率、高信息量的智能学科特性,利用强化学习算法解决了Massive MIMO的物理层安全问题,为无线信号处理提出了新的研究思路。本文主要针对Ma...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 研究背景及意义
1.2 研究现状
1.2.1 Massive MIMO及物理层安全研究现状
1.2.2 MDP及强化学习算法研究现状
1.3 论文研究内容
1.4 论文章节安排
第二章 相关技术基础
2.1 5G技术
2.2 Massive MIMO技术
2.3 物理层安全技术
2.4 强化学习算法
2.4.1 强化学习基本框架
2.4.2 基于模型的强化学习算法
2.4.3 模型无关的强化学习算法
2.5 本章小结
第三章 Massive MIMO三端口窃听信道
3.1 Massive MIMO窃听信道模型
3.1.1 Massive MIMO基本信道模型
3.1.2 Massive MIMO系统理论模型
3.1.3 三端口窃听信道模型
3.2 三端口窃听信道的保密容量
3.2.1 MIMO信道容量理论分析
3.2.2 一般窃听信道的保密容量
3.2.3 高斯窃听信道的保密容量
3.2.4 多天线窃听信道的保密容量
3.3 本章小结
第四章 三端口窃听信道的MDP模型
4.1 马尔科夫决策过程
4.2 MDP求解方法
4.2.1 值函数
4.2.2 贝尔曼方程
4.3 基于折扣总回报的MDP模型
4.3.1 有限状态马尔科夫信道
4.3.2 信道环境模型
4.3.3 状态转移函数
4.3.4 系统回报函数
4.3.5 策略
4.4 本章小结
第五章 MDP模型的求解算法
5.1 算法理论基础
5.2 动态规划算法寻找最优策略
5.2.1 策略迭代
5.2.2 值迭代
5.3 基于Q值更新的值迭代算法
5.3.1 算法设计
5.3.2 算法实现
5.4 算法仿真分析
5.4.1 不同参数下算法的性能分析
5.4.2 最优参数下算法在系统模型中的表现
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
作者简介
本文编号:2921049
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 研究背景及意义
1.2 研究现状
1.2.1 Massive MIMO及物理层安全研究现状
1.2.2 MDP及强化学习算法研究现状
1.3 论文研究内容
1.4 论文章节安排
第二章 相关技术基础
2.1 5G技术
2.2 Massive MIMO技术
2.3 物理层安全技术
2.4 强化学习算法
2.4.1 强化学习基本框架
2.4.2 基于模型的强化学习算法
2.4.3 模型无关的强化学习算法
2.5 本章小结
第三章 Massive MIMO三端口窃听信道
3.1 Massive MIMO窃听信道模型
3.1.1 Massive MIMO基本信道模型
3.1.2 Massive MIMO系统理论模型
3.1.3 三端口窃听信道模型
3.2 三端口窃听信道的保密容量
3.2.1 MIMO信道容量理论分析
3.2.2 一般窃听信道的保密容量
3.2.3 高斯窃听信道的保密容量
3.2.4 多天线窃听信道的保密容量
3.3 本章小结
第四章 三端口窃听信道的MDP模型
4.1 马尔科夫决策过程
4.2 MDP求解方法
4.2.1 值函数
4.2.2 贝尔曼方程
4.3 基于折扣总回报的MDP模型
4.3.1 有限状态马尔科夫信道
4.3.2 信道环境模型
4.3.3 状态转移函数
4.3.4 系统回报函数
4.3.5 策略
4.4 本章小结
第五章 MDP模型的求解算法
5.1 算法理论基础
5.2 动态规划算法寻找最优策略
5.2.1 策略迭代
5.2.2 值迭代
5.3 基于Q值更新的值迭代算法
5.3.1 算法设计
5.3.2 算法实现
5.4 算法仿真分析
5.4.1 不同参数下算法的性能分析
5.4.2 最优参数下算法在系统模型中的表现
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
作者简介
本文编号:2921049
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2921049.html