当前位置:主页 > 科技论文 > 搜索引擎论文 >

非均衡医学数据的特征选择与分类

发布时间:2021-02-12 09:56
  对于非均衡医学数据的分类问题,由于各类别所含样本的数目相差悬殊,导致少数类样本被误分类的比例远大于多数类,因而传统的分类算法所建立的模型一般无法满足分类性能的要求。从数据维度和特征属性的角度,高维连续非均衡数据包含大量无关和冗余特征,易导致维度灾难及过拟合,降低学习算法性能;某些低维离散非均衡数据则存在特征与类别相关性不强及特征稀疏程度较大等问题。本论文采用特征选择方法解决非均衡医学数据的分类问题,在保证模型预测性能的前提下,找出与非均衡数据分类最相关且冗余度最小的特征子集,本文的主要研究内容如下:1.对于高维连续非均衡的基因表达数据,提出了 一种基于改进ReliefF和支持向量机递归特征消除算法(SVM-RFE)的非均衡特征选择方法。首先使用改进ReliefF算法剔除无关特征,筛选有利于预测少数类的特征;再使用SVM-RFE进一步搜索最优特征子集,并建立分类预测模型;最后,利用KentRidge生物医学数据集,与 All-SVM、ReliefF-SVM、ReliefFM-SVM 及 SVM-RFE 模型进行对比,实验结果验证了所提方法的有效性。2.对于高维连续非... 

【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校

【文章页数】:84 页

【学位级别】:硕士

【文章目录】:
致谢
摘要
Abstract
第一章 绪论
    1.1 课题研究背景及意义
        1.1.1 微阵列基因表达数据
        1.1.2 颈动脉狭窄术后脑过度灌注综合征
    1.2 非均衡分类方法研究现状
        1.2.1 类非均衡问题本质
        1.2.2 非均衡分类评价标准
        1.2.3 非均衡分类方法
    1.3 特征选择研究现状
        1.3.1 特征选择过程
        1.3.2 特征选择方法
    1.4 本文主要内容及安排
第二章 基于改进ReliefF和SVM-RFE的非均衡特征选择方法
    2.1 引言
    2.2 改进ReliefF算法
        2.2.1 ReliefF算法
        2.2.2 改进的ReliefF算法
    2.3 SVM-RFE算法
        2.3.1 支持向量机基本原理
        2.3.2 支持向量机递归特征消除
    2.4 改进ReliefF+SVM-RFE非均衡特征选择方法
    2.5 结果与分析
        2.5.1 数据描述与处理
        2.5.2 评价标准
        2.5.3 实验设置
        2.5.4 结果与讨论
    2.6 本章小结
第三章 基于多目标优化的非均衡特征选择方法
    3.1 引言
    3.2 多目标优化方法
        3.2.1 多目标优化概述
        3.2.2 遗传算法
        3.2.3 多目标遗传算法
    3.3 NSGA-Ⅱ算法
        3.3.1 方法原理
        3.3.2 基本流程
    3.4 多目标优化非均衡特征选择方法
    3.5 结果与分析
        3.5.1 实验设置
        3.5.2 结果与讨论
    3.6 本章小结
第四章 CEA术后CHS非均衡数据集分类应用
    4.1 数据描述
    4.2 特征选择
    4.3 算法层面分类
        4.3.1 单类支持向量机
        4.3.2 代价敏感模型
        4.3.3 实验设置
        4.3.4 结果与讨论
    4.4 数据层面分类
        4.4.1 朴素贝叶斯
        4.4.2 集成学习
        4.4.3 实验设置
        4.4.4 结果与讨论
    4.5 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
攻读学位期间发表的论文与成果


【参考文献】:
期刊论文
[1]一种基于SVM的快速特征选择方法[J]. 戴平,李宁.  山东大学学报(工学版). 2010(05)
[2]生物信息学中基因芯片的特征选择技术综述[J]. 周昉,何洁月.  计算机科学. 2007(12)
[3]特征选择算法研究综述[J]. 毛勇,周晓波,夏铮,尹征,孙优贤.  模式识别与人工智能. 2007(02)
[4]非平衡数据集Fisher线性判别模型[J]. 谢纪刚,裘正定.  北京交通大学学报. 2006(05)
[5]动脉粥样硬化危险因素与颈动脉狭窄和缺血性卒中的相关性[J]. 华扬,郑宇,凌晨,段春,张蕾,王力力,刘玉梅,周瑛华.  中国脑血管病杂志. 2004(02)
[6]基因芯片技术与基因表达谱研究[J]. 郭新红,姜孝成,潘晓玲,陈良碧.  生物学杂志. 2001(05)

博士论文
[1]基于支持向量机的特征选择方法的研究与应用[D]. 毛勇.浙江大学 2006



本文编号:3030675

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3030675.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c0313***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com