当前位置:主页 > 科技论文 > 数学论文 >

超图低秩属性选择多输出回归算法

发布时间:2019-02-23 13:17
【摘要】:随着科技的发展,不少学者已经提出了许多方法来应对越来越具有挑战性的多输出回归任务。在高维数据的回归任务中,多输出回归算法利用数据的多个特征值来预测多个输出值,能获得较好的效果。实际应用中产生的数据往往具有很多的特征,比如生物医学的基因数据,计算机视觉中的图像数据,web网站中产生的日志或用户浏览记录的文本数据等。为了提高对这些高维数据的利用效率,并在回归分析中能取得比较好的分类效果,因此需要对这些高维数据进行特征选择,降低这些高维数据的维度。许多研究者提出了低秩回归模型,并在此基础上进行特征选择和属性约减。由于只是简单的进行处理,没有对样本进行选择(去除噪音数据和离群点数据对模型的干扰)。因此,为了能够快速且稳定地处理高维数据多输出回归问题,本文提出了一种超图低秩属性选择多输出回归算法。具体地,首先,本文在基本线性回归基础上应用l2,p范数进行样本选择,去除噪音和离群点样本,使得学习得到的模型具有更准确的预测能力。接着,通过回归系数矩阵来进行特征选择,从而得到新的特征样本数据集。然后,使用10-折交叉验证进行模型训练,从而学习最终回归模型。模型中学习得到的回归系数矩阵可以选择出重要的特征,而低秩回归可以输出各变量之间紧密的关联结构。最后,在模型中嵌入超图,通过超图来保留各数据之间的局部相关性结构,使得模型更具有稳定性。实验结果表明,该算法相比其它对比算法,能更有效地选取属性,应用于多输出回归任务中能取得很好的分类效果。
[Abstract]:With the development of science and technology, many scholars have proposed many methods to deal with the more and more challenging multi-output regression task. In the task of regression of high-dimensional data, multi-output regression algorithm uses multiple eigenvalues of data to predict multiple output values, which can obtain better results. The data produced in practical applications often have many characteristics, such as biomedical genetic data, image data in computer vision, logs produced in web websites or text data recorded by users. In order to improve the utilization efficiency of these high-dimensional data and obtain better classification results in regression analysis, it is necessary to select the features of these high-dimensional data and reduce the dimensions of these high-dimensional data. Many researchers have proposed a low rank regression model based on which feature selection and attribute reduction are carried out. Because of the simple processing, the sample is not selected (noise data and outlier data interference to the model). Therefore, in order to deal with the multi-output regression problem of high-dimensional data quickly and stably, this paper proposes a multi-output regression algorithm for hypergraph with low-rank attribute selection. Specifically, first of all, on the basis of basic linear regression, this paper uses L2, p norm to select samples to remove noise and outliers, so that the model obtained from learning has more accurate prediction ability. Then, the new feature sample data set is obtained by regression coefficient matrix. Then, the 10-fold cross-validation is used to train the model to learn the final regression model. The regression coefficient matrix obtained from the model can select the important characteristics, while the low rank regression can output the tight correlation structure among the variables. Finally, the hypergraph is embedded in the model, and the local correlation structure between the data is preserved by the hypergraph, which makes the model more stable. The experimental results show that the proposed algorithm can select attributes more effectively than other comparison algorithms, and can achieve good classification effect in multi-output regression task.
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O212.1

【相似文献】

相关期刊论文 前10条

1 王建方,闫桂英;超图的圈结构[J];科学通报;2001年19期

2 林启忠,房杰,刘娟,杜智华;两类特殊超图的分数横贯[J];新疆师范大学学报(自然科学版);2005年03期

3 唐宇轩;;圈区间超图相关性质的讨论[J];新疆师范大学学报(自然科学版);2006年03期

4 刘木伙;柳柏濂;;严格(d)-连通无圈超图的计数[J];数学学报;2007年06期

5 范新爱;赵守娟;;r一致导出匹配可扩张超图及性质[J];新乡学院学报(自然科学版);2009年05期

6 石怡;王福;;有关交簇超图的两个结论[J];兵团教育学院学报;2009年05期

7 朱俊杰;;超图的奇圈横贯[J];成都大学学报(自然科学版);2010年02期

8 孙林;;完美图在超图上的推广[J];新疆师范大学学报(自然科学版);2011年01期

9 王福;石怡;杜智华;;一类超图的横贯[J];石河子大学学报(自然科学版);2011年03期

10 赵凌琪;冯伟;徐春雷;吉日木图;;无圈超图规模的进一步研究[J];应用数学学报;2012年05期

相关重要报纸文章 前10条

1 本报驻东京记者 吴仲国;中国软件在日本叫响知名品牌成市场宠儿[N];科技日报;2002年

2 证券时报记者 吴中珞;超图软件信披创新 微博释疑股吧发帖详解年报延期[N];证券时报;2011年

3 本报记者 朱熹妍;地理信息火爆 超图地理专注成器[N];经济观察报;2008年

4 记者 赵一蕙;超图软件业绩快报“失准”逾20%[N];上海证券报;2013年

5 栾玲 赵培;超图软件:中国“智”造的跨国软件企业[N];中国高新技术产业导报;2010年

6 本报记者 解佳涛 戈清平;超图软件:做“中国智造”的跨国软件企业[N];中国高新技术产业导报;2010年

7 本报记者 梁爽;超图:十年打造地理信息超级版图[N];中国政府采购报;2012年

8 徐洋;北京市委书记郭金龙视察超图软件公司[N];中国测绘报;2012年

9 本报记者 郑燃;超图软件:让应急事件避免盲人摸象[N];政府采购信息报;2011年

10 江雪;钟耳顺钟情GIS[N];中国企业报;2007年

相关博士学位论文 前10条

1 古万荣;基于超图模型的新闻推荐研究[D];华南理工大学;2015年

2 孙艳萍;3一致超图的拉格朗日和最大团之间的关系的研究[D];湖南大学;2016年

3 彭豪;超图的Motzkin-Straus型结果及Frankl-F(?)redi猜想[D];湖南大学;2015年

4 岳俊杰;超图H谱理论和稀疏低秩优化算法研究[D];清华大学;2016年

5 吴艳;3-一致超图分解及相关问题[D];北京交通大学;2010年

6 吴颖敏;市场机遇发现的超图支持方法研究[D];华中科技大学;2009年

7 叶淼林;图与超图理论中的谱方法[D];安徽大学;2010年

8 吉日木图;图的标号及超图分解问题研究[D];大连理工大学;2006年

9 王琦;网络中的超图嵌入问题[D];山东大学;2007年

10 蔡p,

本文编号:2428868


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/2428868.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9aa09***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com