面向多特征集成的粒化建模方法及其应用研究
发布时间:2018-06-28 20:56
本文选题:多粒度 + 信息粒化 ; 参考:《江苏科技大学》2017年硕士论文
【摘要】:随着互联网技术的迅猛发展,特别是近年来云计算、物联网、社交网络等新兴服务的快速普及,人类社会产生的数据规模正以一种前所未有的速度增长.从大规模复杂数据中,以应用需求为目标,挖掘有效的信息已经成为现代科技发展的主要驱动力.然而,现代数据具有描述的多样性、来源的广博性、结构的复杂性、增长的飞速性等典型特征,探寻如何从规模庞大且复杂异构的数据中获取蕴含的深层信息和隐含知识,相对于传统的数据挖掘与知识发现任务而言,显得任重而道远且极具挑战性.目前很多大规模复杂数据处理方法中,分而治之是一种能被广泛接受的策略,即先采用适当的抽样或分层技术对复杂数据进行合理的“分割”,再建立高效的学习机制对各部分数据进行针对性地处理,该策略体现了人类面临复杂问题时所拥有的多粒度认知能力.但粒度世界的多样性致使有关多粒度的研究面临计算复杂度高、对指定目标特性掌握不够、缺乏足够的融合思想与动态学习能力等严峻挑战,鉴于此,本文将在复杂数据背景下,分别从标记多特征空间的信息粒化、参数多特征空间的分类器设计、多特征空间的融合学习方法等方面来探索高效的多粒度信息粒化技术,并以此为基础发展新的多粒度建模与知识获取方法.具体而言,本文的研究内容和创新性成果主要在于:(1)单标记下的特征空间转换策略与粗糙数据分析.有关粗糙集的研究大多建立在原始特征空间之上,并未考虑具有不同决策类别的样本可能拥有自身特定的性质,而这些特性往往有助于产生更为精准的规则.为此,本文针对决策系统中不同的决策类,提出了一种能够反映各个决策类性质的多特征空间转换策略,并给出了多特征空间下决策系统近似质量和条件熵的定义方法,有效地降低了决策系统的不确定性程度,提升了分类性能.(2)多标记下的特征空间转换策略与粗糙数据分析.考虑到不同标记可能会带有其自身的一些特性,故为多标记学习构建类属特征空间显得尤为重要.然而,类属特征空间的构建可能导致特征空间维度的增加,且含有大量冗余信息.为了缓解该不足,本文借助模糊粗糙近似约简的思想,提出了两种基于类属特征空间维度约简的多标记学习方法,即:FRS-LIFT和FRS-SS-LIFT.其中,FRS-SS-LIFT在FRS-LIFT的基础上,采用了样本选择策略,大幅降低了维度约简的时间消耗.相关实验结果验证了本文算法在提升多标记学习系统预测性能的可行性和高效性.(3)参数化特征空间下的协同分类方法.在邻域粗糙集模型中,随着信息粒尺寸的增长,基于多数投票原则的邻域分类器容易对未知样本的类别产生误判.为了缓解该不足,本文借助协同表达的思想,提出了一种邻域协同分类器NCC.该算法在未知样本的邻域空间内,通过协同表达的方式找出与未知样本具有最小重构误差的类别作为预测的类别标记.相关实验结果在验证本文算法能够提升较大尺寸信息粒下邻域分类器分类性能的同时,也表明该算法是一种降低传统CRC算法时间消耗的有效手段.(4)多特征空间融合策略下的蛋白质结构类型预测方法.本文针对生物信息学中蛋白质二级结构类型的预测问题,先从Pse AAC和Pse PSSM两个视角抽取了蛋白质序列的特征,并将两者以串行方式融合,再以k-近邻错误率最小化为目标,借助启发式搜索策略,提出了一种基于k-近邻错误率下降的蛋白质结构类型预测方法.相关实验结果表明本文算法对蛋白质二级结构预测的准确率有一定程度地提升.
[Abstract]:With the rapid development of Internet technology , especially the rapid popularization of new services such as cloud computing , Internet of Things , social network and so on in recent years , the scale of data generated by human society has become the main driving force for modern science and technology . In order to alleviate this deficiency , this paper proposes two kinds of methods for predicting the structure types of protein structures based on fuzzy rough approximation . In order to alleviate this deficiency , this paper presents a new method for predicting the structure types of protein structures based on the concept of fuzzy rough approximation .
【学位授予单位】:江苏科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP18
【参考文献】
相关期刊论文 前9条
1 杨习贝;徐苏平;戚ng;於东军;;基于多特征空间的粗糙数据分析方法[J];江苏科技大学学报(自然科学版);2016年04期
2 张云泉;徐葳;龙桂鲁;;数据科学:问题导向的交叉学科创新[J];科学通报;2015年Z1期
3 吴伟志;高仓健;李同军;;序粒度标记结构及其粗糙近似[J];计算机研究与发展;2014年12期
4 蒋亦樟;邓赵红;王骏;钱鹏江;王士同;;熵加权多视角协同划分模糊聚类算法[J];软件学报;2014年10期
5 张维;苗夺谦;高灿;岳晓冬;;邻域粗糙协同分类模型[J];计算机研究与发展;2014年08期
6 李霖;毛凯;谭永滨;;地标分层多粒度路径导引描述方法[J];测绘学报;2014年01期
7 王磊;李天瑞;刘清;黎敏;;对象集变化时近似集动态维护的矩阵方法[J];计算机研究与发展;2013年09期
8 王国胤;张清华;;不同知识粒度下粗糙集的不确定性研究[J];计算机学报;2008年09期
9 胡清华;于达仁;谢宗霞;;基于邻域粒化和粗糙逼近的数值属性约简[J];软件学报;2008年03期
相关博士学位论文 前1条
1 杨习贝;不完备信息系统中粗糙集理论研究[D];南京理工大学;2010年
,本文编号:2079324
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2079324.html