当前位置:主页 > 科技论文 > 自动化论文 >

基于样例及标记相关性的多标记学习算法研究

发布时间:2017-03-26 08:08

  本文关键词:基于样例及标记相关性的多标记学习算法研究,,由笔耕文化传播整理发布。


【摘要】:多标记学习作为一种解决多义性对象学习建模的框架,其研究成果已经广泛应用到诸如文本分类、网页分类、场景分类等分类问题中,已然成为了机器学习研究领域的一个热点问题。针对多标记分类问题,目前已经涌现出了大量的学习算法,不管是基于k近邻的方法,还是应用支持向量机的方法,以及运用决策树的方法等,都可以将其归为两大类:算法适应法(algorithm adaptation methods,简称AAM)和问题转换法(problem transformation methods,简称PTM)。顾名思义,算法扩展法即在算法层面上解决多标记分类问题。同样地,问题转换法则是从问题本身出发,把复杂的多标记问题转化成“二类分类”问题,继而运用简单易实现的单标记学习算法去处理多标记分类问题。本文的绪论中简述了多标记学习的研究背景及意义,然后对多标记学习在国内外的研究现状进行了详细介绍;简要介绍了多标记学习的理论基础,包括多标记学习问题定义,多标记学习策略简介,以及多标记学习中常用的评估标准、多标记学习中的典型算法、数据集等理论知识。多标记分类问题的研究关键是如何有效利用训练好的分类器,将待分类样例划分到预先定义好的类别中,本文重点考察了多标记分类过程中标记相关性和属性特征选择这两个方面,主要研究成果有:(1)基于多标记学习中存在的标记相关性问题,提出一种基于邻域粗糙集的多标记分类改进算法。研究者在多标记学习中引入邻域粗糙集模型,构造了一个新的学习框架MLRS,运用邻域粗糙集找出给定示例的所有可能相关的标签和排除所有不相关的标签,根据邻域和不同标记间的关系为样例预测正确标记范围。但是,要是一个类在边界区域中因为正例过少,导致该类在通过计算得到的近邻中占据很小的比例,此时如果只看数量很容易造成错分。针对这个问题,本文对MLRS算法做了相应的改进,在边界区域,除了考虑在训练样例和各个不同类别的近邻样例之间计算欧式距离这个因素,还要考虑个数的问题,这两者之间可以建立起一个映射关系,然后用该映射关系预测测试样例类别标记,实验表明,本文提出的方法能较好地提高算法的分类性能。(2)基于多标记学习中存在的属性特征选择的问题,提出一种基于类属属性的多标记局部加权分类算法。一个对象具有多种语义信息,是因为该对象同时含有描述这些语义的属性。因此,对刻画示例与标记间关系的属性进行有效的转换,将使多标记学习过程更加可靠。LIFT算法是基于类属属性的多标记学习方法,本文针对其不足提出了一种新的基于类属属性的多标记局部加权分类算法LIFT-LOCW,该算法通过加权的方法提高了原算法的分类精度,根据实验结果可以看出,本文提出的方法拥有比其他多标记分类算法更好的分类结果。
【关键词】:多标记分类 K近邻 邻域粗糙集 不确定性 类属属性 加权
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
  • 摘要6-7
  • Abstract7-9
  • 第1章 绪论9-14
  • 1.1 研究背景与意义9-10
  • 1.2 国内外研究现状10-12
  • 1.2.1 多标记分类研究现状10-12
  • 1.2.2 标记相关性研究现状12
  • 1.3 本文主要研究工作12-13
  • 1.4 本文章节安排情况13-14
  • 第2章 多标记学习简介14-25
  • 2.1 多标记学习问题14-15
  • 2.1.1 多标记问题定义14
  • 2.1.2 多标记学习策略14-15
  • 2.2 评价指标15-18
  • 2.2.1 “基于标记”的评价指标15-16
  • 2.2.2 “基于样例”的评价指标16-18
  • 2.3 典型算法简介18-22
  • 2.3.1 ML-KNN算法18-19
  • 2.3.2 分类器链CC算法19-20
  • 2.3.3 RAKEL算法20-21
  • 2.3.4 RANK-SVM算法21
  • 2.3.5 LIFT算法21-22
  • 2.4 数据集22-24
  • 2.5 本章小结24-25
  • 第3章 一种基于邻域粗糙集的多标记加权分类算法25-31
  • 3.1 引言25
  • 3.2 MLRS算法25-26
  • 3.3 WMLRS算法26-29
  • 3.3.1 WMLRS算法思想27
  • 3.3.2 WMLRS算法描述27-29
  • 3.4 实验结果及分析29-30
  • 3.5 本章小结30-31
  • 第4章 一种基于类属属性的多标记加权改进算法31-37
  • 4.1 引言31
  • 4.2 LIFT-LOCW算法31-33
  • 4.2.1 LIFT-LOCW算法思想32-33
  • 4.2.2 LIFT-LOCW算法描述33
  • 4.3 实验对比算法简介33-34
  • 4.4 实验结果及分析34-36
  • 4.5 本章小结36-37
  • 第5章 总结与展望37-39
  • 5.1 本文研究工作总结37
  • 5.2 未来研究工作展望37-39
  • 参考文献39-42
  • 攻读硕士学位期间发表的论文和参与的项目42-43
  • 致谢43

【相似文献】

中国期刊全文数据库 前10条

1 刘峰涛;;浅谈基于样例池不确定性缩减的主动学习算法[J];才智;2011年09期

2 龙军;殷建平;祝恩;蔡志平;;选取最大可能预测错误样例的主动学习算法[J];计算机研究与发展;2008年03期

3 龙军;殷建平;祝恩;赵文涛;;主动学习研究综述[J];计算机研究与发展;2008年S1期

4 甄蓓蓓;吴昊;徐丹;;一种基于样例的数字人脸化妆算法[J];云南大学学报(自然科学版);2010年S2期

5 彭剑;王奕;;计算机专业本科毕业论文案例评析及改进样例[J];计算机教育;2010年16期

6 彭小波;郑先超;胡琳;;基于样例的参数化鞋楦建模研究[J];机电工程技术;2007年05期

7 翟俊海;王婷婷;王熙照;;样例约简支持向量机[J];计算机科学与探索;2011年12期

8 田丰;;基于样例交互式三维动画的生成研究[J];数字技术与应用;2012年10期

9 卢涤非;任文华;李国军;斯进;;基于样例的交互式三维动画的生成[J];计算机研究与发展;2010年01期

10 王珍钰;王熙照;;基于近邻熵的主动学习算法[J];模式识别与人工智能;2011年01期

中国重要会议论文全文数据库 前8条

1 赵弘;张奇;;小学生算术应用题多重变异样例学习的迁移效果[A];第十一届全国心理学学术会议论文摘要集[C];2007年

2 许德志;张奇;;正、误碳氢共价键组合样例的学习效果[A];第十二届全国心理学学术大会论文摘要集[C];2009年

3 张华;张奇;;物体受力分析正误样例组合的学习效果[A];第十五届全国心理学学术会议论文摘要集[C];2012年

4 丁艳云;赵俊峰;;不同种类的样例对初中生代数问题解决迁移的影响[A];第十二届全国心理学学术大会论文摘要集[C];2009年

5 张奇;;开方运算样例关键步骤的设计与学习迁移效果[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年

6 张华;张奇;;正误样例相似性对受力分析学习效果的影响[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年

7 林洪新;张奇;;小学生四则混合运算规则的样例学习[A];第十届全国心理学学术大会论文摘要集[C];2005年

8 林洪新;张奇;;关键与非关键步骤对数学运算样例学习迁移效果的影响[A];第十二届全国心理学学术大会论文摘要集[C];2009年

中国博士学位论文全文数据库 前9条

1 王蒙;解释错误样例学习模式的研究[D];华中师范大学;2015年

2 赵弘;小学生算术应用题多重变异样例学习的迁移效果[D];辽宁师范大学;2007年

3 邵光华;数学样例学习的理论与实证研究[D];华东师范大学;2003年

4 邢强;样例解题步骤编码对原理学习和迁移的影响[D];华南师范大学;2002年

5 张华;中学生物体受力分析正误样例组合学习及促进方法的研究[D];辽宁师范大学;2013年

6 林洪新;初一学生数学运算样例中关键步骤的学习研究[D];辽宁师范大学;2009年

7 申丰山;样例权重估计及在此基础上的SVM[D];西安电子科技大学;2011年

8 曹瑞;刺激特征数量和特征突显度对样例效应的影响[D];天津师范大学;2008年

9 张邦佐;基于正例和无标记样例学习研究[D];吉林大学;2009年

中国硕士学位论文全文数据库 前10条

1 孙小菱;错误样例与自我解释对大学生数学学习迁移的影响[D];浙江师范大学;2012年

2 赵倩;样例特征及激活方式对创造性观点生成的影响[D];华东师范大学;2015年

3 王硕;高中地理计算题样例学习的应用研究[D];辽宁师范大学;2015年

4 蒋曦;正误样例和解释方式对初中生解决概率问题的影响[D];苏州大学;2016年

5 马文;基于样例及标记相关性的多标记学习算法研究[D];山东师范大学;2016年

6 许德志;碳氢共价键结构式正误样例组合的学习效果[D];辽宁师范大学;2010年

7 董令彩;基于不确定性样例选择算法的研究与改进[D];河北大学;2010年

8 刘春兰;样例学习成绩与元认知水平的实证研究[D];重庆师范大学;2010年

9 刘峰涛;基于样例池类标改变率的主动学习算法终止准则研究[D];河北大学;2011年

10 陈战胜;规则策略和样例策略在类别学习中运用的实验研究[D];华南师范大学;2002年


  本文关键词:基于样例及标记相关性的多标记学习算法研究,由笔耕文化传播整理发布。



本文编号:268511

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/268511.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4affc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com