流特征选择算法设计及其在基因表达数据上的应用
发布时间:2021-06-07 09:47
生物信息学是近年来一门新型的热点研究学科。生物信息学中的基因表达数据具有高维度、高冗余和类别不平衡等特点,对于机器学习算法来说,这类数据集是一项困难的挑战。在机器学习算法模型训练之前,对这类数据的降维处理是必不可少的过程。使用特征选择方法进行降维处理是一种有效的方法。对基因表达数据的特征选择及分类等问题的相关研究,能够为疾病的诊断和治疗提供可靠有效的研究方法。近些年许多学者对基因表达数据的特征选择问题进行了研究,并取得了很多有价值的成果,但是仍没有达到理想的分析效果,许多研究者依然致力于研究更好的基因表达数据特征选择算法。以往的研究均基于传统的静态特征选择算法,此类算法模型较为复杂,时间复杂度较高,已有学者将流特征选择技术应用在基因表达数据的特征选择问题上并取得较好的效果。针对基因表达数据的特点,本文对基因表达数据的特征选择问题进行了深入研究。本文结合在线学习的相关算法,建立强鲁棒性、易理解的特征选择模型,提出能够降低特征空间压缩率和提高分类识别率的流特征选择算法。本文将提出的基于L2,1范数的流特征选择算法在12个高维基因表达数据上进行了特征选择实验,并与其他四个典型的流特征选择算法...
【文章来源】:南京理工大学江苏省 211工程院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图2.1?DNA芯片的制备流程??基因表达数据的相关研究发展地十分迅速,实验中获得了大量的基因表达数据集,??
图2.1最大分类间隔??图2.1中,实心点和空心点分别代表二分类问题中的正类别和负类别样本,丑是需??
图3.1与grafting算法实验结果对比(SVM)??
【参考文献】:
期刊论文
[1]多类别肿瘤分类的特征基因选择方法研究[J]. 李小波,彭司华. 复旦学报(自然科学版). 2014(03)
[2]基于粒子群优化和判别熵信息的基因选择算法[J]. 关健,韩飞,杨善秀. 计算机工程. 2013(11)
[3]基于集成类随机森林方法的神经胶质瘤特征基因选择的研究[J]. 来海锋,韩斌,厉力华,陈岩,祝磊,代琦. 生物物理学报. 2010(09)
[4]基于模糊粗糙集的肿瘤分类特征基因选取[J]. 徐菲菲,苗夺谦,魏莱. 计算机科学. 2009(03)
[5]急性白血病的基因表达谱分析与亚型分类特征的鉴别[J]. 李颖新,刘全金,阮晓钢. 中国生物医学工程学报. 2005(02)
[6]基于支持向量机的微阵列基因表达数据分析方法[J]. 刘青,杨小涛. 小型微型计算机系统. 2005(03)
本文编号:3216355
【文章来源】:南京理工大学江苏省 211工程院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图2.1?DNA芯片的制备流程??基因表达数据的相关研究发展地十分迅速,实验中获得了大量的基因表达数据集,??
图2.1最大分类间隔??图2.1中,实心点和空心点分别代表二分类问题中的正类别和负类别样本,丑是需??
图3.1与grafting算法实验结果对比(SVM)??
【参考文献】:
期刊论文
[1]多类别肿瘤分类的特征基因选择方法研究[J]. 李小波,彭司华. 复旦学报(自然科学版). 2014(03)
[2]基于粒子群优化和判别熵信息的基因选择算法[J]. 关健,韩飞,杨善秀. 计算机工程. 2013(11)
[3]基于集成类随机森林方法的神经胶质瘤特征基因选择的研究[J]. 来海锋,韩斌,厉力华,陈岩,祝磊,代琦. 生物物理学报. 2010(09)
[4]基于模糊粗糙集的肿瘤分类特征基因选取[J]. 徐菲菲,苗夺谦,魏莱. 计算机科学. 2009(03)
[5]急性白血病的基因表达谱分析与亚型分类特征的鉴别[J]. 李颖新,刘全金,阮晓钢. 中国生物医学工程学报. 2005(02)
[6]基于支持向量机的微阵列基因表达数据分析方法[J]. 刘青,杨小涛. 小型微型计算机系统. 2005(03)
本文编号:3216355
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3216355.html