当前位置:主页 > 科技论文 > 自动化论文 >

数据维数约简及分类算法研究

发布时间:2017-04-05 21:00

  本文关键词:数据维数约简及分类算法研究,由笔耕文化传播整理发布。


【摘要】:随着信息技术的发展,涌现出海量数据,推动了机器学习理论不断地向前发展。样本数据维数越高,数据存储越困难,同时数据的计算量也越大;此外,数据中还存在着噪声或者冗余特征。因此,如何降低高维数据的维数,避免“维数灾难”问题,提高数据的分类精度,已经成为机器学习领域关注的一个热点问题。非负矩阵分解作为一种矩阵分解算法,约束待分解矩阵中和因式分解获得的矩阵中所有的元素为非负。这种非负性约束具有明确的物理意义,使得非负矩阵分解作为一种维数约简算法得到了广泛关注。同时,半监督学习(semi-supervised learning)由于能够同时利用少量的已知标记样本和大量未标记样本数据进行有效的学习,大大克服了有监督学习算法中样本数量不足问题,提高了分类的精度,因而半监督学习方法在图像分类、文本分类及邮件分类等问题中得到了普遍的运用。论文集成基于非负矩阵分解的维数约简算法和基于半监督学习的分类算法,首先提出了一种基于非负矩阵分解与一致性学习的半监督学习算法。然后,在非负矩阵分解过程中引入类别信息,提出了一种基于约束非负矩阵分解与一致性学习的半监督分类算法。该算法在降维过程中引入少量已知标签类别信息作为约束条件,增强数据降维后的特征表示能力。最后,引入类别之间的依赖性,提出了一种基于构建类别图的维数约减的半监督学习算法。该算法分别在样本与样本之间、类与类之间创建图,构建基于图的正则化框架,再通过求解Sylvester方程得到未标记样本的标签。在公开数据集上的实验结果表明,论文算法在充分利用少量已知标签的同时用于数据的维数约简,不仅能有效地降低了数据的维度,还能够有效地提高分类器的泛化能力。
【关键词】:机器学习 维数灾难 维数约简 半监督学习 Sylvester方程
【学位授予单位】:辽宁工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O151.21;TP18
【目录】:
  • 摘要4-5
  • Abstract5-8
  • 1 绪论8-17
  • 1.1 研究背景与意义8-10
  • 1.2 国内外研究现状10-15
  • 1.2.1 维数约简研究现状10-13
  • 1.2.2 数据分类研究现状13-15
  • 1.3 论文的主要工作和结构安排15-17
  • 1.3.1 论文的主要工作15
  • 1.3.2 论文的组织结构15-17
  • 2 维数约简与半监督学习概况17-30
  • 2.1 维数约简17-23
  • 2.2 半监督学习的基本知识23-25
  • 2.2.1 半监督学习基本思想及其未标记数据的作用23-24
  • 2.2.2 半监督学习假设24-25
  • 2.3 基于图的半监督学习25-29
  • 2.3.1 基于图的半监督学习框架25-26
  • 2.3.2 基于图的半监督分类算法26-27
  • 2.3.3 基于图的半监督学习算法27-29
  • 2.4 本章小结29-30
  • 3 基于非负矩阵分解和一致性学习的半监督分类算法30-40
  • 3.1 非负矩阵分解30-34
  • 3.1.1 非负矩阵分解原理30-32
  • 3.1.2 非负矩阵分解算法收敛性证明32-34
  • 3.2 基于NMF和一致性学习半监督分类算法34-36
  • 3.3 实验结果与分析36-39
  • 3.3.1 评价指标36
  • 3.3.2 数据集与参数选择36-37
  • 3.3.3 分类结果及分析37-39
  • 3.4 本章小结39-40
  • 4 基于约束非负矩阵分解和一致性学习的半监督分类算法40-52
  • 4.1 约束非负矩阵分解40-45
  • 4.1.1 约束非负矩阵分解原理40-42
  • 4.1.2 约束非负矩阵分解算法收敛性证明42-45
  • 4.2 基于CNMF和一致性学习的半监督分类算法45-48
  • 4.3 实验结果与分析48-51
  • 4.3.1 数据集与参数选择48-49
  • 4.3.2 分类结果及分析49-51
  • 4.5 本章小结51-52
  • 5 基于构建类别图的维数约简半监督学习52-58
  • 5.1 基于类别图的结构框架52-55
  • 5.2 基于构建类别图的维数约简半监督学习55-56
  • 5.3 实验结果及分析56-57
  • 5.3.1 评价指标56
  • 5.3.2 数据集与参数选择56
  • 5.3.3 分类结果及分析56-57
  • 5.4 本章小结57-58
  • 6 总结与展望58-60
  • 6.1 总结58
  • 6.2 展望58-60
  • 参考文献60-63
  • 攻读硕士期间发表学术论文情况63-64
  • 致谢64

【相似文献】

中国期刊全文数据库 前2条

1 陈威;;几种维数约简方法在人脸识别中的比较研究[J];甘肃联合大学学报(自然科学版);2011年04期

2 ;[J];;年期

中国重要会议论文全文数据库 前2条

1 陈伟福;冯国灿;;局部光滑主成分分析[A];第十五届全国图象图形学学术会议论文集[C];2010年

2 孙涛;刘静;刘青山;卢汉清;;半监督谱判别式分析[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

中国博士学位论文全文数据库 前4条

1 侯臣平;基于图优化框架的数据维数约简方法及应用研究[D];国防科学技术大学;2009年

2 何力;维数约简中的若干问题[D];复旦大学;2010年

3 殷飞;基于稀疏学习的图像维数约简和目标识别方法研究[D];西安电子科技大学;2014年

4 朱麟;基于图的嵌入和维数约简方法研究[D];中国科学技术大学;2013年

中国硕士学位论文全文数据库 前4条

1 周勇;数据维数约简及分类算法研究[D];辽宁工业大学;2016年

2 周斯斯;谱聚类维数约简算法研究与应用[D];西安电子科技大学;2010年

3 胡奎;两种针对张量数据和多视图数据的半监督维数约简方法[D];国防科学技术大学;2010年

4 谭龙;基于近似零范数和无穷范数的维数约简[D];天津大学;2014年


  本文关键词:数据维数约简及分类算法研究,,由笔耕文化传播整理发布。



本文编号:287651

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/287651.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ceec5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com