当前位置:主页 > 科技论文 > 自动化论文 >

半监督特征选择关键技术研究

发布时间:2017-08-11 09:33

  本文关键词:半监督特征选择关键技术研究


  更多相关文章: 降维 特征选择 属性依赖 聚类 l_(2.1)-norm 分类


【摘要】:特征选择是一种重要的数据预处理方法,通过在原始数据中筛选出特征子集并进行优化,对算法性能的提高起到事半功倍的作用。针对传统利用互信息以及成对约束的特征选择算法通常忽略特征之间的依赖性的问题,本文基于属性依赖率先提出了一种特征选择算法。主要工作包括:第一,对属性依赖进行分析,根据特征相关性重构原始数据;第二,定义目标函数,计算每一维特征与其他特征之间的互信息,进而根据得分对特征进行排序;第三,利用K-means方法对特征选择的结果进行分析,并采用不同的评价标准进行评价。本实验采用UCI数据集并与五种传统的特征选择算法(UFSMI、Laplacian Score、MCFS、SPECFS、LDA)进行对比。理论分析及实验表明,该算法能够有效地利用属性依赖之间的关系,提高特征选择的准确率和性能。基因表达数据是DNA微阵列数据分析的重点,但是由于该数据的样本数目远远小于样本维数,将特征选择算法应用在高维数据上意义重大。本文提出了基于l2,1-norm的半监督特征选择算法,该方法同时结合了损失函数和正则化方法,可以有效的去除离群点,同时利用稀疏性进行特征选择,用于解决现实生活中高维数据的计算复杂度问题。数据诊断模型的关键是对高维数据进行预处理,另一方面是使用分类器对数据进行分类研究,对比分析分类器的分类性能和执行效率。本实验主要采用基因表达序列数据集,一是对比分析选择不同特征维数对分类精度的影响;二是对比分析了特征选择前后SVM和ELM的分类精度;三是对比分析了算法的执行时间。理论分析及实验表明,选择合适的特征选择器和分类器可以有效提高实验诊断模型的准确率及性能。
【关键词】:降维 特征选择 属性依赖 聚类 l_(2.1)-norm 分类
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;TP18
【目录】:
  • 摘要6-7
  • Abstract7-11
  • 第1章 绪论11-16
  • 1.1 研究的背景和意义11-12
  • 1.2 国内外研究现状12-14
  • 1.2.1 特征选择研究现状12-13
  • 1.2.2 特征选择应用研究现状13-14
  • 1.3 本文主要研究内容和结构安排14-16
  • 第2章 相关理论基础概述16-24
  • 2.1 特征选择算法分析16-20
  • 2.1.1 特征选择的一般过程16
  • 2.1.2 产生过程16-18
  • 2.1.3 评价函数18-20
  • 2.2 特征选择算法分类20-21
  • 2.3 聚类算法分析21-23
  • 2.4 本章小结23-24
  • 第3章 基于属性依赖的半监督特征选择24-40
  • 3.1 半监督学习方法24-26
  • 3.1.1 Constraint Score算法24-25
  • 3.1.2 基于Constraint Score的半监督特征选择算法25-26
  • 3.2 基于属性依赖的半监督特征选择26-34
  • 3.2.1 问题描述和符号定义27-28
  • 3.2.2 算法总体框架28-29
  • 3.2.3 算法总体描述29-34
  • 3.3 实验及分析34-38
  • 3.3.1 实验数据集34-35
  • 3.3.2 实验评价标准35-36
  • 3.3.3 算法聚类性能分析36-37
  • 3.3.4 属性依赖对特征选择的影响37-38
  • 3.4 本章小结38-40
  • 第4章 半监督特征选择的应用40-48
  • 4.1 数据分析及实验诊断模型40-42
  • 4.1.1 基因表达数据分析40-41
  • 4.1.2 基因表达数据诊断模型41-42
  • 4.2 分类器算法42-44
  • 4.2.1 朴素贝叶斯分类算法42
  • 4.2.2 K近邻分类算法42-43
  • 4.2.3 支持向量机算法43-44
  • 4.2.4 极限学习机算法44
  • 4.3 半监督特征选择的应用44-47
  • 4.4 本章小结47-48
  • 第5章 半监督特征选择应用实验与分析48-57
  • 5.1 实验数据集48
  • 5.2 实验与分析48-55
  • 5.2.1 特征选择前后分类精度对比实验49-51
  • 5.2.2 选择不同特征维数对分类精度的影响51-54
  • 5.2.3 算法时间复杂度分析54-55
  • 5.3 本章小结55-57
  • 总结与展望57-58
  • 致谢58-59
  • 参考文献59-64
  • 攻读硕士学位期间发表的论文及科研成果64

【相似文献】

中国期刊全文数据库 前10条

1 吉小军,李世中,李霆;相关分析在特征选择中的应用[J];测试技术学报;2001年01期

2 贾沛;桑农;唐红卫;;一种改进的类别依赖型特征选择技术[J];计算机与数子工程;2003年06期

3 靖红芳;王斌;杨雅辉;徐燕;;基于类别分布的特征选择框架[J];计算机研究与发展;2009年09期

4 吴洪丽;朱颢东;周瑞琼;;使用特征分辨率和差别对象对集的特征选择[J];计算机工程与应用;2010年16期

5 杨艺;韩德强;韩崇昭;;基于排序融合的特征选择[J];控制与决策;2011年03期

6 李云;;稳定的特征选择研究[J];微型机与应用;2012年15期

7 钱学双;多重筛选逐步回归特征选择法及其应用[J];信息与控制;1986年05期

8 宣国荣;柴佩琪;;基于巴氏距离的特征选择[J];模式识别与人工智能;1996年04期

9 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期

10 王新峰;邱静;刘冠军;;基于特征相关性和冗余性分析的机械故障特征选择研究[J];中国机械工程;2006年04期

中国重要会议论文全文数据库 前10条

1 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

2 李长升;卢汉清;;排序学习模型中的特征选择[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

3 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

4 倪友平;王思臣;马桂珍;陈曾平;;分支界定算法在低分辨雷达飞机架次判别中的应用[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年

5 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年

6 蒙新泛;王厚峰;;主客观识别中的上下文因素的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

7 万京;王建东;;一种基于新的差异性度量的ReliefF方法[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年

8 范丽;许洁萍;;基于GMM的音乐信号音色模型研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年

9 陈友;戴磊;程学旗;;基于MRMHC-C4.5的IP流分类[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

10 申f;杨宏晖;袁帅;;用于水声目标识别的互信息无监督特征选择[A];第三届上海——西安声学学会学术会议论文集[C];2013年

中国博士学位论文全文数据库 前10条

1 李静;高维数据交互特征选择和分类研究[D];燕山大学;2015年

2 刘风;基于磁共振成像的多变量模式分析方法学与应用研究[D];电子科技大学;2014年

3 王石平;粗糙拟阵及其在高维数据降维中的应用研究[D];电子科技大学;2014年

4 代琨;基于支持向量机的网络数据特征选择技术研究[D];解放军信息工程大学;2013年

5 王爱国;微阵列基因表达数据的特征分析方法研究[D];合肥工业大学;2015年

6 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年

7 张明锦;基于特征选择的多变量数据分析方法及其在谱学研究中的应用[D];华东理工大学;2011年

8 高青斌;蛋白质亚细胞定位预测相关问题研究[D];国防科学技术大学;2006年

9 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年

10 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年

中国硕士学位论文全文数据库 前10条

1 张金蕾;蛋白质SUMO化修饰位点预测的数据挖掘技术研究[D];西北农林科技大学;2015年

2 史德飞;自适应特征选择在线瓷砖分类系统[D];南京大学;2014年

3 马铮;网络流量特征分析与特征选择[D];北京邮电大学;2013年

4 徐冬;基于特征选择的入侵检测方法研究[D];吉林大学;2016年

5 郑芳泉;稀有数据的集成特征选择与入侵检测[D];福州大学;2013年

6 徐子伟;基于分步特征选择和组合分类器的电信客户流失预测模型[D];中国科学技术大学;2016年

7 肖丽莎;半监督特征选择关键技术研究[D];西南交通大学;2016年

8 李昌;概率特征选择分类向量机[D];中国科学技术大学;2016年

9 黄春虎;基于ReliefF-FCBF组合的入侵特征选择算法研究[D];新疆大学;2016年

10 谭蕴琨;面向稀疏数据的在线学习特征选择方法研究[D];华南理工大学;2016年



本文编号:655398

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/655398.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0de18***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com