基于自我表述的学习方法的研究
发布时间:2021-05-13 18:23
在高维数据中,许多样本存在冗余或者不相关的特征,冗余特征的存在会降低算法的效率,不相关特征的存在会对学习算法的效果造成一定的影响。特征选择能给算法带来很多好处,如降低计算代价、提高效率、增强泛化能力等。而在数据样本不断增大的同时,数据的标注结构复杂程度也在不断增大。虽然多标记学习现在已经能够处理大量的标记多义性问题,但现实世界中还有着许多需要反映每个标记对实例准确描述程度的数据,即标记分布型数据。针对以上的数据问题,本文将自我表述思想应用到学习过程中,分别提出基于自我表述的两种学习方法:(1)针对存在大量冗余特征和不相关特征的无标记数据,提出基于自我表述依赖度量的无监督特征选择方法(DMSR)。该算法首先定义特征的性能依赖于原始数据的自我表述依赖度量原则,即投影后的低维空间数据越依赖于原始数据,则该低维空间越好。然后通过依赖最大化,使投影到低维空间后的数据尽可能保持原始数据的特征信息,据此对原始数据进行降维。获得可靠的低维数据后,引入稀疏表示技术进行特征选择。最后,在4个公开的数据集上进行实验,并与3种已有的无监督特征选择算法进行比较,实验结果表明提出的DMSR特征选择方法是有效的。(...
【文章来源】:闽南师范大学福建省
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题研究意义
1.2 国内外研究现状
1.2.1 特征选择的研究现状
1.2.2 标记分布学习的研究现状
1.3 本文主要内容和组织结构
1.3.1 本文主要工作
1.3.2 本文组织结构
第2章 背景知识
2.1 特征选择
2.1.1 有监督特征选择
2.1.2 无监督特征选择
2.1.3 无监督特征选择算法
2.2 标记分布学习
2.2.1 多标记与标记分布
2.2.2 标记分布学习形式化
2.2.3 标记分布学习算法
2.3 本章小结
第3章 基于自我表述依赖度量的无监督特征选择方法
3.1 依赖度量
3.1.1 依赖度量理论
3.1.2 基于自我表述的依赖度量
3.2 自我表述依赖最大化特征选择方法
3.3 实验与结果分析
3.3.1 评价指标
3.3.2 实验设置
3.3.3 实验结果分析
3.4 本章小结
第4章 基于样本自我表述的标记分布学习方法
4.1 标记分布问题
4.2 模型提出
4.3 模型优化和算法步骤
4.3.1 联合L2范数的自我表述
4.3.2 联合L2,1-范数的自我表述
4.4 实验与结果分析
4.4.1 评价指标
4.4.2 实验设置
4.4.3 实验结果分析
4.4.4 参数分析
4.5 本章小结
第5章 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
致谢
攻读学位期间取得的科研成果
【参考文献】:
期刊论文
[1]联合依赖最大化与稀疏表示的无监督特征选择方法[J]. 李婵,杨文元,赵红. 南京大学学报(自然科学). 2017(04)
[2]应用k-means算法实现标记分布学习[J]. 邵东恒,杨文元,赵红. 智能系统学报. 2017(03)
[3]面向标记分布学习的标记增强[J]. 耿新,徐宁,邵瑞枫. 计算机研究与发展. 2017(06)
[4]Control 5.0: From Newton to Merton in Popper’s Cyber-Social-Physical Spaces[J]. Fei-Yue Wang. IEEE/CAA Journal of Automatica Sinica. 2016(03)
[5]标记分布学习中目标函数的选择[J]. 赵权,耿新. 计算机科学与探索. 2017(05)
[6]基于随机投影的正交判别流形学习算法[J]. 马丽,董唯光,梁金平,张晓东. 郑州大学学报(理学版). 2016(01)
[7]L1-L2范数联合约束的鲁棒目标跟踪[J]. 孔繁锵,王丹丹,沈秋. 仪器仪表学报. 2016(03)
[8]基于低秩评分的非监督特征选择算法[J]. 谢乃俊,杨国亮,罗璐,梁礼明. 计算机工程与设计. 2015(06)
[9]基于局部保持投影和稀疏表示的无监督特征选择方法[J]. 简彩仁,陈晓云. 模式识别与人工智能. 2015(03)
[10]一种基于特征聚类的特征选择方法[J]. 王连喜,蒋盛益. 计算机应用研究. 2015(05)
博士论文
[1]大数据处理技术与系统研究[D]. 顾荣.南京大学 2016
硕士论文
[1]标记分布学习若干问题研究[D]. 赵权.东南大学 2016
[2]机器学习算法在数据挖掘中的应用[D]. 李运.北京邮电大学 2015
[3]最大相关最小冗余的无监督特征选择算法的研究及其应用[D]. 刘荣烨.中国海洋大学 2010
[4]多元线性模型与岭回归分析[D]. 何秀丽.华中科技大学 2005
本文编号:3184493
【文章来源】:闽南师范大学福建省
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题研究意义
1.2 国内外研究现状
1.2.1 特征选择的研究现状
1.2.2 标记分布学习的研究现状
1.3 本文主要内容和组织结构
1.3.1 本文主要工作
1.3.2 本文组织结构
第2章 背景知识
2.1 特征选择
2.1.1 有监督特征选择
2.1.2 无监督特征选择
2.1.3 无监督特征选择算法
2.2 标记分布学习
2.2.1 多标记与标记分布
2.2.2 标记分布学习形式化
2.2.3 标记分布学习算法
2.3 本章小结
第3章 基于自我表述依赖度量的无监督特征选择方法
3.1 依赖度量
3.1.1 依赖度量理论
3.1.2 基于自我表述的依赖度量
3.2 自我表述依赖最大化特征选择方法
3.3 实验与结果分析
3.3.1 评价指标
3.3.2 实验设置
3.3.3 实验结果分析
3.4 本章小结
第4章 基于样本自我表述的标记分布学习方法
4.1 标记分布问题
4.2 模型提出
4.3 模型优化和算法步骤
4.3.1 联合L2范数的自我表述
4.3.2 联合L2,1-范数的自我表述
4.4 实验与结果分析
4.4.1 评价指标
4.4.2 实验设置
4.4.3 实验结果分析
4.4.4 参数分析
4.5 本章小结
第5章 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
致谢
攻读学位期间取得的科研成果
【参考文献】:
期刊论文
[1]联合依赖最大化与稀疏表示的无监督特征选择方法[J]. 李婵,杨文元,赵红. 南京大学学报(自然科学). 2017(04)
[2]应用k-means算法实现标记分布学习[J]. 邵东恒,杨文元,赵红. 智能系统学报. 2017(03)
[3]面向标记分布学习的标记增强[J]. 耿新,徐宁,邵瑞枫. 计算机研究与发展. 2017(06)
[4]Control 5.0: From Newton to Merton in Popper’s Cyber-Social-Physical Spaces[J]. Fei-Yue Wang. IEEE/CAA Journal of Automatica Sinica. 2016(03)
[5]标记分布学习中目标函数的选择[J]. 赵权,耿新. 计算机科学与探索. 2017(05)
[6]基于随机投影的正交判别流形学习算法[J]. 马丽,董唯光,梁金平,张晓东. 郑州大学学报(理学版). 2016(01)
[7]L1-L2范数联合约束的鲁棒目标跟踪[J]. 孔繁锵,王丹丹,沈秋. 仪器仪表学报. 2016(03)
[8]基于低秩评分的非监督特征选择算法[J]. 谢乃俊,杨国亮,罗璐,梁礼明. 计算机工程与设计. 2015(06)
[9]基于局部保持投影和稀疏表示的无监督特征选择方法[J]. 简彩仁,陈晓云. 模式识别与人工智能. 2015(03)
[10]一种基于特征聚类的特征选择方法[J]. 王连喜,蒋盛益. 计算机应用研究. 2015(05)
博士论文
[1]大数据处理技术与系统研究[D]. 顾荣.南京大学 2016
硕士论文
[1]标记分布学习若干问题研究[D]. 赵权.东南大学 2016
[2]机器学习算法在数据挖掘中的应用[D]. 李运.北京邮电大学 2015
[3]最大相关最小冗余的无监督特征选择算法的研究及其应用[D]. 刘荣烨.中国海洋大学 2010
[4]多元线性模型与岭回归分析[D]. 何秀丽.华中科技大学 2005
本文编号:3184493
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3184493.html