基于强化学习的时间触发通信调度方法
发布时间:2022-01-04 08:26
未来航空电子系统中将会更广泛地选择基于时间触发的通信机制进行信息传输,以保证信息交互的确定性。如何合理地进行时间触发通信调度设计是时间触发应用于航空电子互连系统的关键。针对时间触发调度的周期性任务,提出了一种基于强化学习的周期调度时刻表生成方法。首先,将流量调度任务转换为树搜索问题,使之具有强化学习所需要的马尔可夫特性;随后,利用基于神经网络的强化学习算法对调度表进行探索,不断缩短延迟时间以优化调度表,且在训练完成后,可以直接使用到消息分布相近的任务中。与使用Yices等可满足模理论(SMT)形式化求解时间触发调度表方法相比,所提方法不会出现无法判定的问题,能够保证时间触发调度设计结果的正确性和优化性。对于包含1 000条消息的大型网络,所提方法的计算速度为SMT方法的数十倍以上,并且调度生成消息的端到端延迟在SMT方法的1%以下,大大提高了消息传输的及时性。
【文章来源】:北京航空航天大学学报. 2019,45(09)北大核心EICSCD
【文章页数】:8 页
【文章目录】:
1流量调度方法
1.1马尔可夫模型与强化学习
1.2搜索策略
1.3强化学习训练
2实验
2.1实验条件
2.2实验结果
2.3模型鲁棒性测试
2.3.1帧长变化
2.3.2增加消息数量
3结论
【参考文献】:
期刊论文
[1]片间综合化互连时间触发通信调度方法[J]. 孔韵雯,李峭,熊华钢,程子敬. 航空学报. 2018(02)
[2]基于混合遗传算法的TTE静态调度表生成设计[J]. 李炳乾,王勇,谭小虎,刘达. 电子技术应用. 2016(10)
[3]新一代综合化航空电子系统构架技术研究[J]. 王国庆,谷青范,王淼,张丽花. 航空学报. 2014(06)
本文编号:3568035
【文章来源】:北京航空航天大学学报. 2019,45(09)北大核心EICSCD
【文章页数】:8 页
【文章目录】:
1流量调度方法
1.1马尔可夫模型与强化学习
1.2搜索策略
1.3强化学习训练
2实验
2.1实验条件
2.2实验结果
2.3模型鲁棒性测试
2.3.1帧长变化
2.3.2增加消息数量
3结论
【参考文献】:
期刊论文
[1]片间综合化互连时间触发通信调度方法[J]. 孔韵雯,李峭,熊华钢,程子敬. 航空学报. 2018(02)
[2]基于混合遗传算法的TTE静态调度表生成设计[J]. 李炳乾,王勇,谭小虎,刘达. 电子技术应用. 2016(10)
[3]新一代综合化航空电子系统构架技术研究[J]. 王国庆,谷青范,王淼,张丽花. 航空学报. 2014(06)
本文编号:3568035
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3568035.html