当前位置:主页 > 科技论文 > 数学论文 >

在线核选择的对抗式多臂赌博机模型

发布时间:2020-04-18 02:18
【摘要】:在线核选择是在线核方法的重要工作,可分为过滤式、包裹式和嵌入式三种类型。在线核选择中存在“探索—利用”两难问题。既要探索新的核以发现潜在的最优核,同时也要尽可能多地利用当前表现最优的核。但已有的在线核选择方法均忽略了“探索—利用”两难问题。针对这一问题,提出在线核选择的一种对抗式多臂赌博机模型,同时给出在线核选择的包裹式方法和嵌入式方法。提出的包裹式方法和嵌入式方法旨在平衡“探索—利用”。给定候选核集合,候选集中的一个核对应对抗式多臂赌博机模型中的一个臂,在线核选择的每回合依据一个概率分布随机地选择核,并应用指数加权的方法来更新该概率分布。这样,在线核选择问题本质上可归约为一个对抗式多臂赌博机问题。在此基础上研究在线核选择的包裹式方法以及嵌入式方法:1.包裹式在线核选择的对抗式多臂赌博机模型。分别在遗忘对手和非遗忘对手环境下,给出在线核选择的包裹式方法。进一步提出一个新的在线核选择后悔的概念。理论证明在遗忘对手环境下的包裹式方法保证亚线性的期望后悔界,在非遗忘对手环境下的包裹式方法保证亚线性的弱期望后悔界。2.嵌入式在线核选择的对抗式多臂赌博机模型。在非遗忘对手环境下给出在线核选择的嵌入式方法。理论证明嵌入式方法保证亚线性的期望后悔界。最后,标准数据集上的实验结果验证了所提出方法的可行性。
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O225

【相似文献】

相关期刊论文 前10条

1 武新苗;;从对抗式解读中看网络传播的舆论引导[J];传播力研究;2018年09期

2 胡正强;;新闻传播中“对抗式”解码现象论析[J];现代传播(中国传媒大学学报);2016年10期

3 成果;;“对抗式”训练在“信息化侦查”课程教学中的应用初探[J];法制与社会;2015年14期

4 成果;;“对抗式”训练在信息化侦查课程教学中的实践应用[J];公安学刊(浙江警察学院学报);2015年03期

5 禹夏;邓亮;;微博用户对主流媒体报道的对抗式解读探析[J];媒体时代;2013年03期

6 张卫;;浅谈法律诊所对抗式模拟庭审教学[J];海南大学学报(人文社会科学版);2011年03期

7 陈洪友;;我国当代新闻传播中对抗式解读的成因探析[J];鄂州大学学报;2011年06期

8 陈洪友;;中国当代新闻传播中对抗式解读的特点[J];新闻爱好者;2009年16期

9 陈洪友;;试论中国当代新闻传播中的对抗式解读[J];荆楚理工学院学报;2009年08期

10 张磊;;军事战略问题的对抗式研讨方法初探[J];军事运筹与系统工程;2008年01期

相关会议论文 前5条

1 廖初民;;对抗式诉讼制度功能的异变——英国民事诉讼制度变革探究[A];全国外国法制史研究会学术丛书——20世纪外国司法制度的变革[C];2002年

2 张锋;;环保约谈:环境法协商式实施机制的新探索[A];中国特色社会主义:实践探索与理论创新——纪念改革开放四十周年(上海市社会科学界第十六届学术年会文集-2018年度)[C];2018年

3 李霖;乔谦;;家事审判模式的新探索[A];新型城镇化进程中的法律问题研究——第十届中部崛起法治论坛论文集[C];2017年

4 李琛;;刑事法官阅卷如何走向未来——改革轮回之后的实证研究[A];全国法院第二十六届学术讨论会论文集:司法体制改革与民商事法律适用问题研究[C];2015年

5 程周明;甘文超;;以“审判为中心”改革对检察机关的影响——以基层公诉为视角[A];2016检察官“阅百种名刊 读百家文献”阅读征文活动优秀论文集[C];2016年

相关重要报纸文章 前10条

1 张丁予 柴泽兴;新型对抗式无领导小组讨论在银行招聘中的应用[N];中国城乡金融报;2016年

2 复旦大学国际关系与公共事务学院教授 苏长和;民主分为对抗式民主和协商式民主[N];北京日报;2016年

3 本报记者 高柱 李娜;成都法院试水“对抗式”审判[N];工人日报;2015年

4 李智;从意大利新刑诉法看对抗式模式之缺陷[N];检察日报;2004年

5 记者 朱丹邋通讯员 张峰;欧委会就紧固件案20年来首开对抗式听证会[N];嘉兴日报;2008年

6 毛玲;当事人自主权与法官程序控制权的平衡[N];人民法院报;2005年

7 西南政法大学副教授 法学博士 李昌盛;文化与审判[N];人民法院报;2010年

8 本报记者 谢佳;找准“痛点”推动机关作风建设[N];人民公安报;2016年

9 钟建伟、王阳;“四个随机”考出官兵真水平[N];战士报;2011年

10 本报记者 王握文;科学精神:自主创新的强大动力[N];解放军报;2006年

相关博士学位论文 前1条

1 李昌盛;论对抗式刑事审判[D];西南政法大学;2008年

相关硕士学位论文 前10条

1 李峻樊;在线核选择的对抗式多臂赌博机模型[D];天津大学;2018年

2 张晶;论政府危机公关中的对抗式解读[D];南昌大学;2015年

3 俞忠;对抗式诉讼模式初论—兼论刑事诉讼辩护制度的改革[D];复旦大学;2008年

4 杜学姣;网络新闻跟贴中的对抗式解读研究[D];山东师范大学;2016年

5 刘白;基于大数据的重大决策社会稳定风险对抗式评估模式研究[D];西南政法大学;2017年

6 郑龙晓;抗日“神剧”的对抗式解读现象研究[D];南京师范大学;2017年

7 刘杰;“编”“解”成就深度[D];四川大学;2007年

8 傅寅俊;论我国对抗式侦查程序的构建[D];浙江工商大学;2011年

9 龚琰;合意的公正[D];湖南师范大学;2011年

10 宋京霖;交叉询问中的美国联邦刑事品格证据规则[D];中国政法大学;2010年



本文编号:2631594

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/2631594.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6a485***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com