基于稀疏表示的高维数据无监督挖掘研究
本文关键词:基于稀疏表示的高维数据无监督挖掘研究,由笔耕文化传播整理发布。
《北京科技大学》 2015年
基于稀疏表示的高维数据无监督挖掘研究
冯小东
【摘要】:数据挖掘是协助管理决策的重要工具之一,随着数据挖掘的应用范围不断扩大,数据挖掘所处理的数据逐渐呈现出高维和未标记的主要特点,即高维未标记数据。对该类数据的挖掘可以称为高维数据无监督挖掘,其中缺失数据填补、数据学习建模尤其大规模在线学习建模属于其中的主要内容。 本文针对高维数据无监督挖掘的这些问题,研究基于稀疏表示的高维数据无监督挖掘方法,具体研究包括以下内容。 (1)针对高维数据无监督挖掘的缺失数据填补问题,研究基于局部约束稀疏表示的缺失数据无监督填补方法。提出局部约束稀疏表示(Locality Constrained Sparse Representation, LCSR)的优化目标,给出优化求解方法,其引入距离加权l1范数和l2范数正则化项,在自动选择相似数据对象的同时,保留局部结构特征并避免过拟合;提出基于LCSR的高维缺失数据无监督填补方法,并设计了三种字典构造方法;利用真实高维基因和图像数据的实验验证了该方法的有效性及参数选择的低敏感性。 (2)针对高维数据无监督挖掘的学习建模问题,研究基于近邻加权稀疏表示的无监督图学习方法。提出近邻加权稀疏表示(NEighborhood Weighted Sparse Representation, NESR)的优化目标及相应的高维数据无监督图构造方法,其利用稀疏约束和近邻距离加权能同时保持高维数据的稀疏性和局部结构特征,并能降低传统的基于稀疏表示方法的时间复杂度;将提出的图构造方法融合到谱聚类、子空间学习及标签繁殖等高维数据挖掘任务;在真实高维图像和语音识别数据集上的实验验证了该算法在效果及计算效率上的优势。 (3)针对大规模在线高维数据无监督挖掘的学习建模问题,研究基于多重超图约束稀疏编码的无监督字典学习方法。提出多重超图约束稀疏编码(Multiple Hypergraph Consistent Sparse Coding, MultiHC_SC)的优化目标及交替优化求解方法,其利用能有效描述高维数据多元流形关系的超图模型及超图拉普拉斯正则化约束,扩展超图矩阵对稀疏求解系数的一致性约束,增加字典学习的无监督判别能力,并通过多重集成约束项实现最优超图的自动选择:通过实验验证了提出方法]MultiHC_SC同时在静态图像聚类和在线图像聚类挖掘任务上的效果提高。
【关键词】:
【学位授予单位】:北京科技大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP311.13
【目录】:
下载全文 更多同类文献
CAJ全文下载
(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)
CAJViewer阅读器支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库 前8条
1 陈建斌,宋翰涛;基于属性分布相似度的超图高维聚类算法研究[J];计算机工程与应用;2004年34期
2 张蓉,彭宏;一种基于超图模式的高维空间数据聚类方法[J];计算机工程;2002年07期
3 高媛,陈建斌,陈立潮;一种基于多层概图的高维聚类算法研究[J];计算机应用;2004年S1期
4 赵亚琴;周献中;何新;王建宇;;一种有效的高属性维稀疏数据聚类算法[J];模式识别与人工智能;2006年03期
5 武森;冯小东;单志广;;基于不完备数据聚类的缺失数据填补方法[J];计算机学报;2012年08期
6 李国杰;程学旗;;大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J];中国科学院院刊;2012年06期
7 刘星毅;檀大耀;曾春华;韦小铃;;基于马氏距离的缺失数据填充算法[J];微计算机信息;2010年09期
8 沙金;张翠肖;贾玉锋;胡迎新;;HGHD:一种基于超图的高维空间数据聚类算法[J];微电子学与计算机;2006年06期
【共引文献】
中国期刊全文数据库 前10条
1 吕蓬;;基于变精度粗糙集的齿轮故障诊断[J];华北电力大学学报(自然科学版);2010年06期
2 赵晓霞;;一种粗糙模糊神经网络识别器及其应用[J];中北大学学报(自然科学版);2009年03期
3 齐光雅;杜云艳;曹峰;;基于粗糙集的南海中尺度涡旋时空关系抽取研究[J];海洋科学进展;2010年04期
4 武志峰;陈冬霞;;基于粗糙集方法的知识发现[J];河北省科学院学报;2006年04期
5 张春英;许广利;刘保相;刘凤春;;决策规则的加密通信与数字签名方案[J];河北理工学院学报;2006年04期
6 王晶;张春英;;关系学习中贝叶斯分类算法的比较研究[J];河北理工大学学报(自然科学版);2011年01期
7 曾晓宁;崔勇;蔺旭东;;基于粗糙集的视频片段自动分类方法[J];河北科技师范学院学报;2009年01期
8 梁伟;肖爱平;钱桦;;粗糙集多传感器融合理论在大棚喷雾机器人中的应用[J];湖北农业科学;2011年03期
9 张诚一;张玉俊;;粗糙集运算的表上作业方法及其应用[J];河北师范大学学报;2006年03期
10 高正科;夏新涛;陈龙;;发动机轴承振动的粗集分析[J];哈尔滨轴承;2008年01期
中国重要会议论文全文数据库 前10条
1 王印松;冯康;;主汽温调节系统性能评价的粗糙集实现方法[A];第二十七届中国控制会议论文集[C];2008年
2 方炜炜;杨炳儒;彭珍;;一种基于粗糙集的启发式属性归约的新算法[A];第二十七届中国控制会议论文集[C];2008年
3 张红梅;刘文蕊;;基于粗糙集和BP神经网络的信息产业上市公司财务预警研究[A];“中国视角的风险分析和危机反应”——中国灾害防御协会风险分析专业委员会第四届年会论文集[C];2010年
4 张志恒;花拥军;;基于粗糙集的数据挖掘技术在企业财务危机预测中的应用[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
5 张红梅;刘玉芬;;基于粗集和熵值的卷烟消费市场潜力评价[A];新机遇·新台阶·新跨越——数量经济学视野下贵州自我发展能力回顾与展望:2010年贵州省社会科学年会数量经济学会论文集[C];2010年
6 高永祥;刘伟华;;基于粗糙集与K-均值聚类的多光谱遥感影象分割[A];江苏省测绘学会2007年学术年会论文集[C];2008年
7 郭永辉;吴保民;马芳;王炳锡;;基于粗糙集的自然语言基本名词短语识别[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
8 周献中;李华雄;;基于DTRS的风险偏好决策模型[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
9 朱梅梅;周献中;;江苏省省级学会考核指标约简报告[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
10 张品佳;孙秋野;;基于粗糙集的配电系统故障诊断方法研究[A];2005中国控制与决策学术年会论文集(上)[C];2005年
中国博士学位论文全文数据库 前10条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
4 任家福;服务商选择与备件备品库存管理研究[D];电子科技大学;2010年
5 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
6 黄光东;基于智能算法的滑坡稳定性建模与分析[D];中国地质大学(北京);2011年
7 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
8 雷迎科;流形学习算法及其应用研究[D];中国科学技术大学;2011年
9 郝冀;中国国有企业竞争力研究[D];中共中央党校;2011年
10 解滨;信息系统中的知识获取与不确定性度量的若干问题研究[D];河北师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘志强;基于数据挖掘的客户行为分析和预测研究[D];山东科技大学;2010年
2 杨新忠;基于案例的地理时空过程表达模型研究[D];山东科技大学;2010年
3 吴晓婷;基于流形学习的数据降维算法的研究[D];辽宁师范大学;2010年
4 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
5 王晓换;基于粗糙集和神经网络的故障诊断虚拟系统的研究[D];郑州大学;2010年
6 杨海陆;公路收费系统数据分析与挖掘[D];哈尔滨工程大学;2010年
7 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
8 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
9 王秀锋;网络环境下异构日志信息获取和预处理研究[D];哈尔滨工程大学;2010年
10 李慧;基于粗糙集理论的连续属性离散化算法研究[D];辽宁师范大学;2010年
【二级参考文献】
中国期刊全文数据库 前5条
1 张蓉,彭宏;一种基于超图模式的高维空间数据聚类方法[J];计算机工程;2002年07期
2 张伟;廖晓峰;吴中福;;一种基于Rough集理论的不完备数据分析方法[J];模式识别与人工智能;2003年02期
3 谷峪;于戈;李晓静;王义;;基于动态概率路径事件模型的RFID数据填补算法[J];软件学报;2010年03期
4 苗夺谦,王珏;粗糙集理论中概念与运算的信息表示[J];软件学报;1999年02期
5 刘星毅;;GBNN-填充缺失属性值算法[J];微计算机信息;2007年15期
【相似文献】
中国期刊全文数据库 前10条
1 郑轶;蔡体健;;稀疏表示的人脸识别及其优化算法[J];华东交通大学学报;2012年01期
2 段菲;章毓晋;;一种面向稀疏表示的最大间隔字典学习算法[J];清华大学学报(自然科学版);2012年04期
3 李仲生;李仁发;蔡则苏;赵乘麟;;稀疏表示下的非监督显著对象提取[J];电子学报;2012年06期
4 段菲;章毓晋;;基于多尺度稀疏表示的场景分类[J];计算机应用研究;2012年10期
5 胡正平;李静;白洋;;基于样本-扩展差分模板的联合双稀疏表示人脸识别[J];信号处理;2012年12期
6 姜芳芳;;稀疏表示理论在提高数字图像质量中的应用[J];科技创新导报;2012年36期
7 马莉娜;;增强的两阶段测试样本稀疏表示方法[J];福建电脑;2013年07期
8 尹学忠;樊甫华;;基于字典学习的超宽带信号稀疏表示与降噪方法[J];计算机应用研究;2014年06期
9 张佳宇;彭力;;基于联合动态稀疏表示方法的多图像人脸识别算法[J];江南大学学报(自然科学版);2014年03期
10 陈才扣;喻以明;史俊;;一种快速的基于稀疏表示分类器[J];南京大学学报(自然科学版);2012年01期
中国重要会议论文全文数据库 前3条
1 何爱香;刘玉春;魏广芬;;基于稀疏表示的煤矸界面识别研究[A];虚拟运营与云计算——第十八届全国青年通信学术年会论文集(上册)[C];2013年
2 樊亚翔;孙浩;周石琳;邹焕新;;基于元样本稀疏表示的多视角目标识别[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
3 葛凤翔;任岁玲;郭鑫;郭良浩;孙波;;微弱信号处理及其研究进展[A];中国声学学会水声学分会2013年全国水声学学术会议论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 李小薪;稀疏表示的分段匹配寻踪方法[D];华南理工大学;2009年
2 何艳敏;稀疏表示在图像压缩和去噪中的应用研究[D];电子科技大学;2011年
3 宋相法;基于稀疏表示和集成学习的若干分类问题研究[D];西安电子科技大学;2013年
4 匡金骏;基于稀疏表示的图像分类与目标跟踪研究[D];重庆大学;2013年
5 李海山;基于稀疏表示理论的地震信号处理方法研究[D];中国石油大学(华东);2013年
6 邓承志;图像稀疏表示理论及其应用研究[D];华中科技大学;2008年
7 路锦正;基于稀疏表示的图像超分辨率重构技术研究[D];电子科技大学;2013年
8 尹海涛;面向图像融合和图像复原的稀疏表示研究[D];湖南大学;2012年
9 谢成军;图像稀疏表示模型在可视化追踪中的应用研究[D];合肥工业大学;2014年
10 欧卫华;基于稀疏表示和非负矩阵分解的部分遮挡人脸识别研究[D];华中科技大学;2014年
中国硕士学位论文全文数据库 前10条
1 张琨雨;在线字典训练及加权差异性稀疏表示的研究[D];大连理工大学;2011年
2 王勇;基于稀疏表示的人脸识别研究[D];五邑大学;2013年
3 李义真;基于词包与稀疏表示的场景分类[D];华南理工大学;2013年
4 孙丽花;基于稀疏表示的人脸识别方法研究[D];河南科技大学;2013年
5 陈天娇;基于分组稀疏和权重稀疏表示的人脸识别研究[D];安徽大学;2014年
6 刘自成;基于稀疏表示的雷达目标角度与距离估计[D];西安电子科技大学;2014年
7 李立;基于稀疏表示的人脸图像识别方法研究[D];南京理工大学;2012年
8 满江月;基于稀疏表示的代价敏感性人脸识别算法研究[D];南京邮电大学;2012年
9 赵广銮;稀疏表示在图像识别中的应用[D];北京邮电大学;2013年
10 罗燕龙;基于局部稀疏表示模型的在线字典学习跟踪算法研究[D];厦门大学;2014年
本文关键词:基于稀疏表示的高维数据无监督挖掘研究,,由笔耕文化传播整理发布。
本文编号:217310
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/217310.html