基于RRF的信息数据集的特征选择
本文关键词:基于RRF的信息数据集的特征选择,由笔耕文化传播整理发布。
【摘要】:信息数据集中存在的冗余、不相关甚至是噪音特征会严重影响管理决策的质量和效率。整合RS理论和ReliefF算法,提出一种"二次过滤"的RRF组合决策方法。首先采用ReliefF算法计算出各个特征权重,过滤掉噪音特征;之后再用启发式的RS方法对原有特征集进行特征约简,过滤掉冗余特征。RRF组合决策方法集合了两个算法的优点,能够有效减少计算的工作量和复杂度,避免RS约简过多以及约简中存在噪音特征等问题,从而起到提高决策质量和效率的作用。最后,用一个真实的医疗信息数据集对算法进行测试,并与两个常见的特征选择算法进行对比,证明本算法在辅助临床决策中的作用。
【作者单位】: 同济大学经济与管理学院;
【关键词】: 信息数据集 决策 特征选择 ReliefF RS
【基金】:国家自然科学基金重点项目“面向全生命周期的医疗质量安全管理与资源优化配置”(71432007)
【分类号】:C934
【正文快照】: 1问题的提出随着信息技术的迅猛发展以及知识经济的到来,人类每天面临的知识量越来越多、知识复杂度越来越高。对于一些大的信息数据集来说,描述对象的特征数量众多,但是同时也存在着以下一些问题:最初的数据集中往往存在着与分类不相关的特征、冗余特征,甚至是噪音特征;众多
【相似文献】
中国期刊全文数据库 前10条
1 刘祖斌;;政府数据门户网站及其数据集的建设研究[J];信息化建设;2011年04期
2 李作春;周秀梅;覃泽;;异质数据集关联规则挖掘[J];科技创新导报;2009年28期
3 汪莉萍;;基于压缩数据集的挖掘算法研究[J];科技创新导报;2009年14期
4 路艳明,郝素萍;Delphi的数据集过滤在票据管理中的应用[J];中国会计电算化;2002年09期
5 崔园;张军鹏;冯焕婷;;数据挖掘技术在人寿保险数据库中的应用[J];成都医学院学报;2006年02期
6 郑开杰;;无序数据集的向量化编码[J];价值工程;2010年33期
7 皮兴进;;ADO.NET中的数据集应用研究[J];大众商务;2009年10期
8 谢笑盈;;基于半静态分层抽样的模糊聚类分析方法的改进[J];统计与决策;2010年11期
9 刘亢 ,黄豁;我国研制出“数字化可视人”[J];中国高校科技与产业化;2002年11期
10 蔡龙飞;;基于XML数据集访问WEB服务的研究[J];科技创新导报;2008年01期
中国重要会议论文全文数据库 前10条
1 田捷;;三维医学影像数据集处理的集成化平台[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
2 范明;魏芳;;挖掘基本显露模式用于分类[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 冷传良;;飞机化铣成样板划线数据集设计方法探索[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
4 孟烨;张鹏;宋大为;王雷;;信息检索系统性能对数据集特性的依赖性分析[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
5 段磊;唐常杰;左R,
本文编号:447940
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/447940.html