马尔可夫决策过程复杂性的熵测度
发布时间:2018-06-29 00:59
本文选题:马尔可夫决策过程 + 复杂性 ; 参考:《控制与决策》2004年09期
【摘要】:应用Shannon熵和其他熵指数来度量马尔可夫决策的复杂性.将马尔可夫链的复杂性、不确定性和不可预测性的度量扩展到马尔可夫决策,提出一套基于信息理论的复杂性度量方法,可用于随机和确定性策略下的完全观测和不完全观测马尔可夫决策.对有关数值进行仿真研究,并给出了计算结果.
[Abstract]:Shannon entropy and other entropy indices are used to measure the complexity of Markov decision making. In this paper, the complexity, uncertainty and unpredictability of Markov chain are extended to Markov decision making, and a set of complexity measurement methods based on information theory are proposed. It can be used for complete observation and incomplete observation Markov decision under stochastic and deterministic strategies. The numerical simulation is carried out and the calculation results are given.
【作者单位】: 华中科技大学系统工程研究所 华中科技大学系统工程研究所 华中科技大学系统工程研究所
【基金】:教育部优秀青年教师教学和科研奖励基金资助项目.
【分类号】:C934
【相似文献】
相关期刊论文 前10条
1 李江洪,韩正之;马尔可夫决策过程自适应决策的进展[J];控制与决策;2001年01期
2 朱一飞,黄国策;备件储备量的马尔可夫决策模型研究[J];空军工程大学学报(自然科学版);2001年02期
3 周子扬;刘思峰;万军;;风险投资退出的灰色决策方法[J];南京航空航天大学学报;2006年03期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前1条
1 田玉楚;吕勇哉;;信息熵测度及其在风险决策中应用[A];1992年中国控制与决策学术年会论文集[C];1992年
,本文编号:2080126
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2080126.html