当前位置:主页 > 科技论文 > 软件论文 >

结合稀疏学习和超图的低秩属性选择算法

发布时间:2018-03-31 23:01

  本文选题:数据挖掘 切入点:属性选择 出处:《广西师范大学》2017年硕士论文


【摘要】:数据挖掘是指从大量复杂数据中寻找和提取有用规律,形成有用模式,得到价值的过程。随着现代科技水平的发展,尤其是近年大数据概念的提出,我们正进入一个数据资源极其丰富的时代,数据挖掘技术正得到越来越多的重视,在工业发展,医疗卫生,信息产业等诸多领域发挥着重要的作用。随着数据维度的增加,随之给数据挖掘任务带来更多挑战,例如属性之间的冗余,增加了数据的存储空间。一般高维数据不宜在实际应用中直接使用,而且对高维数据进行处理会大大增加数据处理的时间和空间复杂度。因此,如何有效地并且高效地利用高维数据在数据的预处理过程中是一个重大的挑战。高维数据并不是毫无结构的,对高维数据进行属性约简可以缩小数据维度。属性选择方法可以选择出小部分重要且具有代表性的属性作为新的属性集,并且能够维持原高维数据的数据结构甚至可以提高分类效果,因而成为机器学习的一个重要领域。常见的属性约简的方法有两种,即子空间学习方法和属性约简方法[1,2]。子空间学习法是将高维数据空间投影到低维数据空间,保持了数据间的相关性。属性选择方法是通过一种预设标准对每个属性进行打分排序,然后选择出部分重要且能代表原始特征的子集。属性选择方法是一种很重要的技术,因此它被广泛地运用于模式识别和机器学习等领域。属性选择方法最常见的有两种,分别是稀疏逻辑回归[3]和t-test检验法[4]。最近,有些研究者在属性选择算法中使用低秩回归模型。低秩回归模型是一种全新的非常有意义的子空间聚类方法,并广泛应用到机器学习和计算机视觉等领域并取得了比较满意的效果。但低秩回归方法直接地运用在实际应用中易出现以下问题:首先,当输入的数据的属性个数非常大时,传统的回归模型表现出很低的性能;其次,一般线性回归模型在不同的响应之间不会考虑其相关性,其典型的代表是最小二乘回归,此方法只是对每个预测的数据分别产生一个响应。因此,本文针对原始数据具有缺失值的样本、异常样本、噪声样本和高维等问题,提出了一种利用稀疏学习、超图和低秩的属性选择算法,即结合稀疏学习和超图的低秩属性选择算法。本文首先在线性回归模型框架中直接地运用低秩属性选择模型,低秩属性选择模型结合了两种方法:低秩表示方法和稀疏表示方法;接着为了使得模型选择出来的属性能够更好地保留数据的局部信息,在模型中嵌入一个基于超图的拉普拉斯矩阵,用于保持各属性之间的更深层次的关系;同时为了让模型选择出来的属性更具有代表性,在模型中恰当地嵌入经典子空间学习方法--LDA算法,以用于对低秩属性模型选择的结果进行微调;最后,提出一种新的算法优化方法,即对目标函数按顺序执行低秩属性选择和子空间学习方法,并不断交替地迭代执行此过程使得结果达到最优,最终取得全局最优解。本文提出的SLH算法结合稀疏学习、低秩超图和子空间学习各自优点用于回归分析和分类,经大量实验验证,该算法在回归和分类实验中能够取到较好的效果。
[Abstract]:......
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 黄汝激;有向超图理论的发展和应用[J];地质科技管理;1995年03期

2 郭嘉凯;;云可大可小[J];软件和信息服务;2013年11期

3 范鹏飞;;超图与组合优化的探讨[J];南京邮电学院学报;1988年02期

4 郝忠孝;郭景峰;;一种基于超图的最小覆盖集求法[J];计算机研究与发展;1990年10期

5 杨春德;;伪超图开关类的若干性质[J];重庆邮电学院学报;1993年01期

6 许小满,孙雨耕,,杨山,黄汝激;超图理论及其应用[J];电子学报;1994年08期

7 高则年;具有最佳连通性超图和容错多总线系统的设计[J];计算机学报;1990年11期

8 牛禄青;;超图软件:内外兼修[J];新经济导刊;2011年09期

9 郝忠孝,高岩,姚春龙;连接超图的有关理论研究I:无α环分解的基本理论[J];计算机研究与发展;1997年S1期

10 黄汝激;应用超图理论实现有向基本割集矩阵[J];电子科学学刊;1992年01期

相关重要报纸文章 前10条

1 本报驻东京记者 吴仲国;中国软件在日本叫响知名品牌成市场宠儿[N];科技日报;2002年

2 证券时报记者 吴中珞;超图软件信披创新 微博释疑股吧发帖详解年报延期[N];证券时报;2011年

3 本报记者 朱熹妍;地理信息火爆 超图地理专注成器[N];经济观察报;2008年

4 记者 赵一蕙;超图软件业绩快报“失准”逾20%[N];上海证券报;2013年

5 栾玲 赵培;超图软件:中国“智”造的跨国软件企业[N];中国高新技术产业导报;2010年

6 本报记者 解佳涛 戈清平;超图软件:做“中国智造”的跨国软件企业[N];中国高新技术产业导报;2010年

7 本报记者 梁爽;超图:十年打造地理信息超级版图[N];中国政府采购报;2012年

8 徐洋;北京市委书记郭金龙视察超图软件公司[N];中国测绘报;2012年

9 本报记者 郑燃;超图软件:让应急事件避免盲人摸象[N];政府采购信息报;2011年

10 江雪;钟耳顺钟情GIS[N];中国企业报;2007年

相关博士学位论文 前10条

1 古万荣;基于超图模型的新闻推荐研究[D];华南理工大学;2015年

2 孙艳萍;3一致超图的拉格朗日和最大团之间的关系的研究[D];湖南大学;2016年

3 彭豪;超图的Motzkin-Straus型结果及Frankl-F(?)redi猜想[D];湖南大学;2015年

4 岳俊杰;超图H谱理论和稀疏低秩优化算法研究[D];清华大学;2016年

5 吴艳;3-一致超图分解及相关问题[D];北京交通大学;2010年

6 吴颖敏;市场机遇发现的超图支持方法研究[D];华中科技大学;2009年

7 叶淼林;图与超图理论中的谱方法[D];安徽大学;2010年

8 吉日木图;图的标号及超图分解问题研究[D];大连理工大学;2006年

9 王琦;网络中的超图嵌入问题[D];山东大学;2007年

10 蔡p

本文编号:1692833


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1692833.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e76f5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com