U-过程集中不等式及其在学习理论中的应用

发布时间:2018-04-15 03:32

  本文选题:U-过程 + 集中不等式 ; 参考:《华中科技大学》2015年博士论文


【摘要】:偏序学习和排序学习在机器学习、信息检索领域受到广泛的关注,在统计学习理论的框架下,我们基于U-过程的理论,对偏序学习和排序学习进行推广性的分析。 本文面向两个紧密相连的研究领域:一是U-过程的最大值集中不等式,二是学习算法的推广性能的界。 集中不等式描述一个随机变量是否集中在某个数值(如数学期望)附近。在统计学习理论中,一个主要的数学工具就是集中不等式,经验过程的集中不等式广泛的应用在学习算法的收敛速率的研究中。而一些学习问题又可以归结到U-统计的表达形式。这样促使我们研究U-过程最大值的集中不等式。U-过程与经验过程紧既有区别又有联系,这种紧密的联系使我们自然地想到用来证明经验过程的熵方法也能够用来证明U-过程。区别是U-过程具有弱的相关结构,所以我们使用退耦的技巧来分解这种复杂的结构。 在本文中我们的主要贡献和创新点如下: 首先,我们给出了三种类型的集中不等式: ·关于非退化核的集中不等式, ·关于退化核的集中不等式, ·关于相关随机变量的集中不等式。前两个是关于U-过程的,其实当我们把这种弱相关整体看成一个泛函时,这样仍然可以当做独立同分布的情形来证明,只是在证明过程中使用退耦不等式来分解这种非独立的结构。在证明第一个不等式时,我们分成了两步,先是证明非负核的U-过程的集中不等式,然后证明有界的核。我们使用非退化的不等式的研究了逐对损失的学习问题。第二个不等式的证明更复杂一些,我们证明的结果和经验过程有相同的结构。第三个是非独立的随机变量的泛函,可以看作是图上的数据,每一个随机变量是图的顶点,我们借助于分数覆盖的理论,把非独立的随机变量,分解成一些块的和,而每一块是独立同分布的随机变量之和,结合已有的结果和染色数的概念,我们就得到了非独立的集中不等式。此外,我们还推广了自有界函数的结构,定义了推广的自有界函数,并且给出了一个集中不等式。 第二个是学习算法的推广性能的界。集中不等式和统计学习紧密的相连,二阶的U-过程是适用于逐对的损失的学习问题。在本文中我们主要集中于偏序学习和排序学习,采用两种分割假设空问的方法,一是基于相对风险的分割,二是基于方差的分割。 采用我们新证明的不等式,应用到逐点损失学习,不同于已有的文献。在已有的结果中,作者采用了先把U-过程进行分解,然后分别用经验过程理论和退化的U-过程来界定。而我们的方法是统一的进行处理,然后再分解然后分别用Rademacher复杂度和Rademacher chaos复杂度来界定。这样做的好处是,对于基于U-过程的不同的经验风险最小化的学习问题,我们主要研究其损失函数的不同。我们分别提供了偏序学习的样本误差的上界和带惩罚的MP排序的风险的界。
[Abstract]:In the field of machine learning and information retrieval, partial order learning and ranking learning are paid more and more attention. Under the framework of statistical learning theory, we analyze the generalization of partial order learning and ranking learning based on U- process theory.This paper focuses on two closely connected research areas: one is the inequality of the maximum set of U- processes and the other is the bound of the generalized performance of the learning algorithm.A set inequality describes whether a random variable is concentrated near a numerical value, such as mathematical expectation.In statistical learning theory, one of the main mathematical tools is lumped inequality, which is widely used in the study of convergence rate of learning algorithm.Some learning problems can be attributed to the expression of U- statistics.This leads us to study the set inequality of the maximum value of U- process. U- process and empirical process are closely related and different. This close relation makes us naturally think that the entropy method used to prove the empirical process can also be used to prove the U- process.The difference is that U- processes have weak correlation structures, so we use decoupling techniques to decompose this complex structure.Our main contributions and innovations in this article are as follows:First, we give three types of set inequalities:On the set inequalities of nondegenerate kernels,On inequalities in sets of degenerate kernels,On the set inequality of correlated random variables.The first two are about U- processes, but when we look at this weakly correlated whole as a functional, we can still prove it as a case of independent co-distribution.It is only in the process of proof that decoupling inequalities are used to decompose this non-independent structure.When we prove the first inequality, we divide it into two steps: first, we prove the set inequality of the U-process with non-negative kernel, then we prove the bounded kernel.We study the learning problem of pair by pair loss by using nondegenerate inequalities.The proof of the second inequality is more complicated. The result of our proof has the same structure as the empirical process.The third is the functional of the dependent random variable, which can be regarded as the data on the graph, and each random variable is the vertex of the graph. We decompose the non-independent random variable into the sum of some blocks with the help of the fractional covering theory.And each block is the sum of random variables with independent and same distribution. Combined with the existing results and the concept of coloring number, we obtain an independent set inequality.In addition, we generalize the structure of the self-bounded function, define the generalized self-bounded function, and give a set inequality.The second is the bound of the generalized performance of the learning algorithm.Set inequality is closely related to statistical learning. Second order U- process is suitable for pair by pair loss learning problem.In this paper, we mainly focus on partial order learning and ranking learning. We use two segmentation methods, one is based on relative risk and the other is based on variance.By using our newly proved inequality, we apply it to point by point loss learning, which is different from the existing literature.In the existing results, the U- process is first decomposed and then defined by the empirical process theory and the degenerate U- process, respectively.Our method is unified, then decomposed and then defined by Rademacher complexity and Rademacher chaos complexity respectively.The advantage of this is that we mainly study the difference of loss function for different empirical risk minimization problems based on U- process.We provide the upper bound of the sample error of partial order learning and the bound of the risk of MP ordering with penalty, respectively.
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP18

【相似文献】

相关期刊论文 前10条

1 李文海;学习,世纪之交的呼唤[J];采.写.编;1999年01期

2 姜永平;网络环境下的学习[J];中国青年科技;2004年09期

3 程智;网络教育中建构主义学习理论的运用[J];广州大学学报(社会科学版);2002年11期

4 胡秋梅;;简析建构主义学习理论在多媒体教学中的实践应用[J];教育与职业;2004年28期

5 陈明选;基于建构主义学习理论下的网络教育观[J];教育信息化;2004年12期

6 王婧;浅谈学习理论在网络教育中的应用[J];黑龙江教育学院学报;2005年05期

7 雷敏;;浅谈建构主义学习理论指导下的多媒体教学[J];赤峰学院学报(自然科学版);2006年06期

8 丁新;;主持人语:积极推进适应网络时代的学习理论研究[J];广东广播电视大学学报;2010年03期

9 杨强;;基于建构主义的网络课程的设计研究[J];科技信息;2012年02期

10 R.C.Schank;张晓东;董稚明;;学习之我见[J];计算机科学;1989年05期

相关会议论文 前10条

1 杨静萍;;教师角色的转变与学习理论的学习[A];第四届全国中学化学教学研讨会论文集(一)[C];2004年

2 侯维芝;吕鑫祥;;基于建构主义学习理论的高职教育教学设计[A];中国职业技术教育学会2006年学术年会论文集[C];2006年

3 王华容;;现代建构主义学习理论的困惑[A];第十届全国心理学学术大会论文摘要集[C];2005年

4 武杰;;特殊教育实践对几种学习理论的检验及其分析[A];第九届全国心理学学术会议文摘选集[C];2001年

5 王志远;陈作珊;;重温陈云《学习是共产党员的责任》[A];陈云和他的事业——陈云生平与思想研讨会论文集(下)[C];1995年

6 艾辛;;和青年朋友谈治学[A];忘年交书简五十封[C];2007年

7 陈勇;郑东;;陈云有关学习论述的启示[A];陈云百周年纪念-全国陈云生平和思想研讨会论文集(中)[C];2005年

8 周婷;;如何发挥好预习在小学高年段数学学习中的作用——实证研究报告[A];江苏省教育学会2006年年会论文集(理科专辑)[C];2006年

9 吴思为;伍新春;;从建构主义到复杂科学[A];第十二届全国心理学学术大会论文摘要集[C];2009年

10 王光龙;;略论毛泽东民主革命时期的学习思想[A];纪念《教育史研究》创刊二十周年论文集(2)——中国教育思想史与人物研究[C];2009年

相关重要报纸文章 前10条

1 记者 周波;市委办机关党员学习十七大精神[N];桂林日报;2007年

2 张斌;学习实践活动要解决“形而象”的问题[N];赤峰日报;2010年

3 定陶二中 蔡玲;如何激发学生学习化学的兴趣[N];学知报;2011年

4 湖南省委建设学习型党组织办公室主任 肖君华;“学习大国”的理论特质与实践意义[N];光明日报;2014年

5 张正华;学习是一种责任[N];沈阳日报;2004年

6 邹仕樘;勤奋学习应成为政协工作者首要之责[N];光华时报;2006年

7 特约记者 崔孝宗 裴文华;天水国税中心组学习做到“五保证”[N];甘肃经济日报;2006年

8 郭春秋;让学习常态化[N];战士报;2008年

9 ;党员干部要牢固树立终身学习的理念[N];组织人事报;2008年

10 刘力 菏泽市立医院;新形势下更需要学习[N];菏泽日报;2009年

相关博士学位论文 前6条

1 任传宝;U-过程集中不等式及其在学习理论中的应用[D];华中科技大学;2015年

2 刘菊;关联主义学习理论及其视角下的教与学组织研究[D];东北师范大学;2011年

3 魏晶;外语学习者计算机网络生态环境优化研究[D];上海外国语大学;2012年

4 冯云龙;统计学习理论中基于核的算法研究[D];中国科学技术大学;2012年

5 李丽;追寻学习的生存论意义[D];华东师范大学;2007年

6 曹扬;基于博弈与学习理论的无线网络自组织策略与算法研究[D];华中科技大学;2014年

相关硕士学位论文 前10条

1 陈倩;基于深度学习理论的教学法的研究[D];上海师范大学;2015年

2 李贤慧;基于稀疏学习的专家列表排序学习方法研究[D];昆明理工大学;2015年

3 唐莉蓉;美国成人转化学习理论发展研究[D];西南大学;2015年

4 季烈;农村留守儿童身份认同和英语学习的调查研究[D];沈阳师范大学;2014年

5 张旭;基于生活化学习理论的成长记录袋网站设计与研究[D];贵州师范大学;2015年

6 高树勇;外来务工者子女的学习问题与教育策略[D];内蒙古师范大学;2015年

7 陆春梅;服务—学习理论在我国高校实践育人中的有效运用研究[D];华中师范大学;2015年

8 张竣尧;建构主义学习理论指导下的语文教学研究[D];贵州师范大学;2014年

9 詹晓梅;建构主义学习理论运用于田径技术教学的实验研究[D];江西师范大学;2005年

10 姚锐;关于技术与学习理论互动关系的研究[D];广西师范大学;2007年



本文编号:1752350

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1752350.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户206dd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com