基于k近邻多标签学习的数据降维算法的研究
发布时间:2017-09-16 00:34
本文关键词:基于k近邻多标签学习的数据降维算法的研究
更多相关文章: PCAI算法 距离加权 信息容忍度 MRF-mRMR算法
【摘要】:随着“互联网+”发展,与人们生活息息相关的多标签数据将会大量产生。由于多标签学习过程中需要考虑属性特征与多个标签、标签之间的相关性,从而使得多标签学习在分类和降维方面比单标签学习更为复杂、更具挑战性。自上世纪九十年代末多标签学习的概念提出以来,吸引了众多专家学者的关注。多标签学习的研究成果如雨后春笋,主要集中在分类和降维两个研究方向。数据降维是机器学习中的重要步骤,是提高数据分类性能的重要手段。本文提出了PCAI和MRF-mRMR两种数据降维算法。PCAI算法与原有算法相比,分类效果明显提升;MRF-mRMR算法在去除冗余属性特征的同时还能保持属性特征与标签之间的相关性。本文对多标签学习的研究可以分为两部分。第一部分提出了基于PCA算法的PCAI数据降维算法,并利用ML-kNN分类器对数据分类。首先,提出了信息容忍度的概念,并定义了其计算公式,同时对公式中的参数取值范围做了实验探讨;其次,得到数据降维后的特征值,并将特征值得应用到ML-kNN分类器中对距离的加权上;最后,将降维后的数据集应用到改进后的ML-kNN分类器中验证降维效果。第二部分讲述了Relief算法和mRMR算法,一方面对Relief算法中属性特征权重的计算方式进行改进,另一方面提出了MRF-mRMR组合特征选择算法。提出的MRF-mRMR算法既保持了mRMR算法最大相关和最小冗余的优势,又拥有Relief算法对每个属性特征加权排序的优点。实验结果表明,MRF-mRMR组合算法的降维效果明显优于已有算法。综上所述,本文提出了PCAI和MRF-mMMR两种降维算法,并以ML-kNN为分类器验证降维效果。实验结果表明,数据降维效果明显,且数据分类效果也有所提升。
【关键词】:PCAI算法 距离加权 信息容忍度 MRF-mRMR算法
【学位授予单位】:闽南师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
- 摘要5-6
- Abstract6-10
- 第1章 绪论10-16
- 1.1 研究背景及意义10-11
- 1.2 国内外研究现状分析11-14
- 1.2.1 多标签数据降维研究现状12-13
- 1.2.2 多标签数据分类研究现状13-14
- 1.3 本文的主要内容和组织结构14-16
- 1.3.1 主要内容14-15
- 1.3.2 组织结构15-16
- 第2章 背景知识16-26
- 2.1 多标签学习分类16-20
- 2.1.1 问题转换17-19
- 2.1.2 算法改进19-20
- 2.2 维数约简20-22
- 2.2.1 特征选择21
- 2.2.2 特征提取21-22
- 2.3 评价指标22-23
- 2.4 本章小结23-26
- 第3章 PCAI数据降维算法的研究26-44
- 3.1 相关知识26-30
- 3.1.1 ML-kNN算法27-29
- 3.1.2 PCA算法29-30
- 3.2 PCAIML算法30-33
- 3.2.1 PCAI算法30-32
- 3.2.2 距离加权32-33
- 3.2.3 PCAIML算法伪代码33
- 3.3 信息容忍度分析33-39
- 3.3.1 实验数据34
- 3.3.2 比较方法及参数说明34-35
- 3.3.3 信息容忍度取值分析35-39
- 3.4 实验数据及结果分析39-43
- 3.4.1 实验数据及参数说明39
- 3.4.2 实验结果分析39-43
- 3.5 本章小结43-44
- 第4章 MRF-mRMR组合特征选择算法44-54
- 4.1 相关知识44-47
- 4.1.1 Relief特征选择算法45-46
- 4.1.2 mRMR特征选择算法46-47
- 4.2 MRF-mRMR组合特征选择算法47-49
- 4.2.1 MRelief特征选择算法47-48
- 4.2.2 MRF-mRMR特征选择算法48-49
- 4.3 实验结果及分析49-53
- 4.3.1 实验数据及参数说明49-50
- 4.3.2 实验结果分析50-53
- 4.4 本章小结53-54
- 第5章 总结与展望54-56
- 5.1 工作总结54-55
- 5.2 进一步展望55-56
- 参考文献56-64
- 致谢64-66
- 攻读学位期间所发表的学术论文及所参加项目66
【相似文献】
中国期刊全文数据库 前10条
1 杨玉平;向华;;对人脸识别特征数据降维算法的优化[J];重庆电子工程职业学院学报;2012年01期
2 张国印;楼宋江;王庆军;程慧杰;;一种基于局部和判别特性的降维算法[J];计算机应用研究;2009年09期
3 李燕燕;闫德勤;刘胜蓝;;基于密度刻画的降维算法[J];计算机工程;2011年21期
4 王立鹏;袁占亭;陈旭辉;周智芳;;基于非线性降维算法的膜蛋白类型识别[J];微计算机信息;2010年10期
5 吴正寅;薛安荣;李明;;基于权值的局部保持半监督降维算法[J];计算机应用研究;2011年04期
6 宋欣;叶世伟;;基于直接估计梯度思想的数据降维算法[J];计算机工程;2008年08期
7 刘胜蓝;闫德勤;;一种新的全局嵌入降维算法[J];自动化学报;2011年07期
8 王万良;陈e,
本文编号:859869
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/859869.html