当前位置:主页 > 医学论文 > 医卫管理论文 >

基于样本差异性分析的多标记特征选择算法研究

发布时间:2020-08-06 10:42
【摘要】:大数据时代,基于数据挖掘技术的医疗诊断对现在医学的医疗辅助中有着重要的作用。医疗诊断对于患者的病例、特征、患病类别以及严重性能够快速的进行判断,且对于实时性以及准确性具有较高的要求。目前,大数据分析领域中特征排序和选择算法已经应用到了很多领域,本文主要针对数据所呈现特征空间高维性、标记空间多标记性等特点,提出了对于多标记数据集中判断样本所属类别具有重要作用的特征。因此,通过深入分析已有数据的固有特点,基于粒计算思维,从样本粒化和特征粒化角度出发寻求对不同类别样本具有差异性的特征。在此基础上,利用已选特征进行分类建模,以提高数据的准确性和泛化能力。本文以信息粒化为基础,分别从样本粒化和特征粒化进行以下几个方面的研究:(1)因多标记数据往往呈现高维小样本特点,使得分类建模中易出现过拟合问题。本文根据聚类技术对数据集中的特征进行粒化,然后结合大间隔的相关知识,提出了一种基于样本差异性的多标记特征选择算法。实验结果表明该模型能有效地提高分类精度,且降低特征选择过程中的计算整体代价。(2)为了能够很好地度量特征间的相关性以及特征与标记间的相似性,以利于选出质量较高的特征,本文提出了多标记学习环境下邻域差异因子概念,邻域差异因子不仅能够用来衡量特征子集的区分能力,而且能有效地区分样本之间的差异性。从特征子集的紧凑性,分类精度,以及分类精度对着特征数目的变化等三个方面验证了所提算法的有效性。
【学位授予单位】:闽南师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R-05;TP18
【图文】:

分类间隔,样本,邻域,大间隔


NM(x)和 x, NH(x)代表的是距离的意义,如图2.1所示。图2.1 样本x的分类间隔 marg in(x)基于大间隔的经典特征选择 Re lief算法主要通过度量特征对样本是否可分来选择特征。Re lief中特征的权重计算方法如下:()()iiiiiiw w x NM x x NHx, (2.23)2.3 本章小结本章首先对经典粗糙集进行介绍,在此基础上详细介绍了面向混合数据的邻域粗糙集模型。其次,基于样本邻域关系,分别介绍了单标记学习和多标记学习环境下的邻域熵和邻域互信息。最后简单介绍了大间隔的相关知识。

【相似文献】

相关期刊论文 前10条

1 吴中华;郑玮;;基于?_(2,1)范数的在线流特征选择算法[J];计算机与数字工程;2019年06期

2 代琨;于宏毅;马学刚;李青;;基于支持向量机的特征选择算法综述[J];信息工程大学学报;2014年01期

3 陈建华;王治和;蒋芸;许虎寅;樊东辉;;一种改进的文本分类特征选择算法[J];微电子学与计算机;2011年12期

4 张文静;王备战;张志宏;;基于图的特征选择算法综述[J];安徽大学学报(自然科学版);2017年01期

5 孙刚;张靖;;面向高维微阵列数据的集成特征选择算法[J];计算机工程与科学;2016年07期

6 张自敏;;大数据中基于稀疏投影的在线特征选择算法[J];湖南科技大学学报(自然科学版);2018年03期

7 陈晓明;;海量高维数据下分布式特征选择算法的研究与应用[J];科技通报;2013年08期

8 李富星;蒙祖强;;一种改进的类别区分词特征选择算法[J];计算机与现代化;2019年03期

9 刘飞飞;;特征选择算法及应用综述[J];办公自动化;2018年21期

10 侯屿;秦小林;彭皓月;张力戈;;全局调距和声特征选择算法[J];计算机工程与应用;2019年02期

相关会议论文 前10条

1 甄超;郑涛;许洁萍;;音乐流派分类中特征选择算法研究[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年

2 陈伟海;李建军;赵志华;曹丹阳;李晋宏;;数据挖掘特征选择算法研究及其在铝电解中的应用[A];2011中国有色金属行业仪表自动化学术会议论文集[C];2011年

3 张仰森;曹元大;;最大熵建模方法中一种改进的特征选择算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

4 张铮;胡社教;江萍;;基于EP模式的特征选择算法[A];2011中国仪器仪表与测控技术大会论文集[C];2011年

5 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年

6 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

7 李文法;段m#毅;刘悦;孙春来;;一种面向流分类的特征选择算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

8 戴键;杨宏晖;;用于水声目标识别的自适应免疫克隆特征选择算法[A];2011'中国西部声学学术交流会论文集[C];2011年

9 杨宏晖;李江涛;甘安琴;姚晓辉;;用于水下目标识别的无监督谱特征选择算法[A];2016年中国造船工程学会水中目标特性学组学术交流会论文集[C];2016年

10 罗勇;周超;许超;;文本分类在商品广告分类中的应用[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年

相关博士学位论文 前10条

1 田肃岩;吸纳通路信息识别相关基因的特征选择算法的研究[D];吉林大学;2018年

2 黄鑫;基于特征关联关系的特征选择算法研究[D];大连理工大学;2018年

3 李云;特征选择算法及其在基于内容图像检索中的应用研究[D];重庆大学;2005年

4 张靖;面向高维小样本数据的分类特征选择算法研究[D];合肥工业大学;2014年

5 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年

6 史彩娟;网络空间图像标注中半监督稀疏特征选择算法研究[D];北京交通大学;2015年

7 杨杰明;文本分类中文本表示模型和特征选择算法研究[D];吉林大学;2013年

8 潘巍巍;故障严重程度识别的有序分类特征分析方法[D];哈尔滨工业大学;2013年

9 杨峻山;生物组学数据的集成特征选择研究[D];深圳大学;2017年

10 王剑桥;基于局部特性的毫米波距离像识别方法研究[D];南京理工大学;2014年

相关硕士学位论文 前10条

1 唐莉;基于样本差异性分析的多标记特征选择算法研究[D];闽南师范大学;2019年

2 李森;基于多目标进化优化的癌症数据特征选择算法研究[D];安徽大学;2019年

3 郭伟;大样本高维数据下基于进化多目标优化的特征选择算法研究[D];安徽大学;2019年

4 赵凯;Android恶意应用检测中特征选择算法的研究[D];湖南大学;2016年

5 赵军;基于Top-r方法的特征选择算法研究[D];湖南大学;2014年

6 樊力文;基于Spark的稳定特征及流式特征选择算法研究[D];河南大学;2018年

7 脱倩娟;基于数据相似性的特征选择算法研究[D];闽南师范大学;2018年

8 张梦林;基于SAL框架的特征选择算法[D];吉林大学;2018年

9 施瑞朗;中文文本分类中特征选择算法的研究与改进[D];杭州电子科技大学;2018年

10 王国权;面向高维不平衡数据的特征选择算法研究[D];哈尔滨工业大学;2017年



本文编号:2782267

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2782267.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3ad03***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com