当前位置:主页 > 管理论文 > 领导决策论文 >

片段平稳的多摆臂决策问题中改进的偏移检测框架

发布时间:2021-02-18 05:25
  在研究序列决策的问题中,多摆臂决策算法(MAB)是常用的方法之一,旨在极小化累计遗憾(regret)的条件下,做出最优的选择。在不平稳的数据流中,潜在的偏移会增加决策方案的探索成本。故本文主要研究在非平稳场景下,如何有效的检测偏移,降低其对决策结果的非预期影响,从而控制累计遗憾的上界。已有的研究中描述了在非平稳场景下序列数据的统计特征,例如分段常数均值。但是在实际情况下,数据分布的变化不只局限于此。本文首次在MAB问题中讨论了两个新的变化(1)连续且分段线性均值(2)分段常数方差和分段常数均值。本文主要利用统计学习理论中模型评估与选择的界定方法和收敛性质去完成自适应的概念偏移检测任务,进而提出了新的偏移检测算法:基于SVM估计器计算样本损失(sigmoid损失或分段线性损失),利用样本损失检验局部数据间的趋势偏移,从而实现较优的累计遗憾。另外,考虑在离群值存在的情况下,许多传统的识别变点的检测方法效果不佳甚至失效。通常,传统方法会把这些离群值错判为变点来完成检测任务。为了克服这个问题,本文着重于区分离群点和变点(或趋势偏移)两者之间的区别。针对异常值的存在,本文提出了两种新的算法:基于... 

【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:69 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
主要符号对照表
第一章 引言
    §1.1 MAB问题背景
    §1.2 片段平稳的MAB问题
    §1.3 存在噪音扰动的MAB问题
    §1.4 伴自适应偏移检测的MAB算法
    §1.5 针对有异常值存在的MAB算法
    §1.6 文献综述
    §1.7 本文主要的贡献
第二章 基础知识
    §2.1 MAB中的基本设定
    §2.2 片段平稳环境
    §2.3 自适应概念偏移检测
    §2.4 存在异常值的变点检测方法
第三章 改进的MAB算法框架
    §3.1 AD-UCB算法框架
    §3.2 存在异常值的CPD算法框架
        §3.2.1 伴截断损失函数的CD-UCB
        §3.2.2 伴偏移轨迹识别的CD-UCB
第四章 改进的MAB算法性能分析
    §4.1 自适应概念偏移检测
    §4.2 存在异常值的检测算法
第五章 实验结果
    §5.1 自适应的概念偏移检测
        §5.1.1 模拟实验
        §5.1.2 真实数据实验
    §5.2 存在异常值的变点检测
        §5.2.1 模拟实验一
        §5.2.2 模拟实验二
        §5.2.3 真实数据实验
第六章 结论
附录A 相关数学公式和证明
    §A.1 定理 4.1.1 分步证明
        §A.1.1 引理 4.1.2
        §A.1.2 引理 4.1.3
        §A.1.3 引理 4.1.4
        §A.1.4 引理 4.1.5
        §A.1.5 定理 4.1.1
    §A.2 定理 4.2.1 分步证明
        §A.2.1 引理 4.2.2
        §A.2.2 引理 4.2.3
        §A.2.3 引理 4.2.4
        §A.2.4 引理 4.2.5
        §A.2.5 定理 4.2.1
参考文献
致谢



本文编号:3039098

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3039098.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户93f87***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com