超高维数据降维与Logistic广义线性拟合分析
本文关键词: 高维数据 Logistic回归 广义线性模型 降维 TCS算法 出处:《统计与决策》2016年07期 论文类型:期刊论文
【摘要】:文章以美国威斯康星州的乳腺癌调查数据为例,分别采用SIS和TCS算法对高维数据进行降维处理,尝试将改进的Logistic广义线性模型对降维后的变量进行拟合。再与传统的一般线性模型、Logistic广义线性模型相比,结果表明,基于算法降维后的Logistic广义线性模型预测误差更小,其中基于TCS算法降维后的广义线性模型在拟合中要明显优于SIS算法降维后的广义线性模型。
[Abstract]:Taking the breast cancer survey data of Wisconsin as an example, this paper uses SIS and TCS algorithms to reduce the dimension of high-dimensional data. The improved Logistic generalized linear model is used to fit the dimensionally reduced variables, and compared with the traditional general linear model and Logistic generalized linear model, the results show that. The prediction error of Logistic generalized linear model based on reduced dimension algorithm is smaller. The generalized linear model after dimension reduction based on TCS algorithm is obviously superior to the generalized linear model after dimension reduction by SIS algorithm in fitting.
【作者单位】: 南京信息工程大学数学与统计学院;
【基金】:国家社会科学基金资助项目(15BTJ019) 公益性行业科研专项(GYHY201506051) 教育部哲学社会科学发展报告项目(13JBG004) 气候变化与公共政策研究院开放课题(14QHA020)
【分类号】:F224
【正文快照】: 0引言 降维是处理高维数据最有效的方法,总体可分为两大类:线性降维和非线性降维。线性降维方法包括PCA、PP、LDA、MDS、ICA、LUP等;非线性降维技术有LLE、Is0map以及Laplacian Eigenmap等IM,此外DCT变换(离散余弦变换)121是主要用于图像压缩的一种数据降维方法。Fan和Lv(2
【相似文献】
相关期刊论文 前5条
1 吴武清;汪成杰;蒋勇;陈敏;;高维数据选元:方法比较及其在纳税评估中的应用[J];管理评论;2013年08期
2 郝媛;高学东;孟海东;;高维数据对象聚类算法效果分析[J];中国管理信息化;2012年08期
3 郭茜;朱杰;;高维数据挖掘技术在教学质量监控与评价的应用研究[J];全国商情(理论研究);2010年11期
4 顾冬娟;戴浩;;改进的基于密度和网格的高维聚类算法[J];科技创新导报;2008年22期
5 ;[J];;年期
相关会议论文 前6条
1 周煜人;彭辉;桂卫华;;基于映射的高维数据聚类方法[A];04'中国企业自动化和信息化建设论坛暨中南六省区自动化学会学术年会专辑[C];2004年
2 梁俊杰;杨泽新;冯玉才;;大规模高维数据库索引结构[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 陈冠华;马秀莉;杨冬青;唐世渭;帅猛;;面向高维数据的低冗余Top-k异常点发现方法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
4 刘运涛;鲍玉斌;吴丹;冷芳玲;孙焕良;于戈;;CBFrag-Cubing:一种基于压缩位图的高维数据立方创建算法(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 刘文慧;;PCA与PLS用于高维数据分类的比较性研究[A];2011年中国卫生统计学年会会议论文集[C];2011年
6 刘喜兰;冯德益;王公恕;朱成喜;冯雯;;脸谱分析在中进期地震跟踪预报中的应用[A];中国地震学会第四次学术大会论文摘要集[C];1992年
相关重要报纸文章 前1条
1 本报记者 李双艺;引领高维数据分析先河[N];吉林日报;2013年
相关博士学位论文 前10条
1 刘胜蓝;余弦度量下的高维数据降维及分类方法研究[D];大连理工大学;2015年
2 黄晓辉;高维数据的若干聚类问题及算法研究[D];哈尔滨工业大学;2015年
3 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年
4 陈黎飞;高维数据的聚类方法研究与应用[D];厦门大学;2008年
5 吴庆耀;高维数据的若干分类问题及算法研究[D];哈尔滨工业大学;2013年
6 楼巍;面向大数据的高维数据挖掘技术研究[D];上海大学;2013年
7 黄健美;高维数据索引及其查询处理技术研究[D];东北大学;2009年
8 任亚洲;高维数据上的聚类方法研究[D];华南理工大学;2014年
9 董道国;高维数据索引结构研究[D];复旦大学;2005年
10 于怡;高维数据变量选择的几点研究[D];复旦大学;2013年
相关硕士学位论文 前10条
1 沈江炎;基于软子空间的高维数据树形索引研究[D];昆明理工大学;2015年
2 侯小丽;高维数据聚类中的神经网络降维方法研究[D];兰州大学;2015年
3 赵俊琴;基于Lasso的高维数据线性回归模型统计推断方法比较[D];山西医科大学;2015年
4 何荧;高维数据下的特征选择与聚类方法研究[D];西南大学;2015年
5 胡昌杰;基于Autoencoder的高维数据降维方法研究[D];兰州大学;2015年
6 杨代君;基于进化算法的高维数据聚类研究[D];西安电子科技大学;2014年
7 王宏霞;交通高维数据逻辑整合与降解研究[D];重庆交通大学;2015年
8 杨庭庭;基于信息熵的高维数据流聚类及其应用研究[D];重庆交通大学;2015年
9 康永为;大数据环境下高维数据处理若干问题[D];广西师范大学;2013年
10 张晓;基于超网络的高维数据聚类方法研究[D];山东师范大学;2015年
,本文编号:1447124
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/1447124.html