基于乳腺癌基因表达数据的特征选择算法研究
发布时间:2021-03-04 09:52
近年来,随着发病率和死亡率的持续升高,癌症已经成为影响人类健康的重要因素之一。乳腺癌作为女性疾病中最常见的恶性肿瘤,严重危害着女性的健康。在目前的医疗设备和医学技术背景下,早期诊断和早期治疗成为治疗乳腺癌的关键手段。随着机器学习技术的不断发展,机器学习算法能够以更简单、更有效的方式检测出患癌症的风险,从而达到降低癌症发病率的目的。依托机器学习的背景,基因检测手段也在不断地发展。肿瘤的产生和发展与基因密切相关,将基因表达数据用于乳腺癌的早期诊断对乳腺癌的发现和识别具有重要的意义。使用机器学习相关算法对基因表达数据进行特征选择及分类来预测癌症发病情况,已成为癌症分类领域的热点问题。基因表达数据具有高维度的特点,然而高维度特征集合中包含着大量与癌症无关的数据。因此需要对其使用特征选择方法,筛选出与乳腺癌有关的特征基因集合。传统的特征选择方法,如卡方检验、决策树和信息增益等,通常存在不能有效去除特征冗余、时间复杂度高和过拟合等缺点。因此,如何选用合适的特征选择方法成为本文研究的重点问题。本文在国内外学者对乳腺癌特征基因选择算法的研究基础上,提出了三种新的基于机器学习的特征选择算法Ave-mRM...
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
本文研究内容框架图
图 2.1 线性可分最优分类面机存在线性可分和线性不可分两种情况:可分数据集nNNiT {(x,y),...,(x,y)},x R11, yi { 1, 1}, S: x b 0,能够将数据集的正负实例点完全正
线性不可分分类界面
【参考文献】:
期刊论文
[1]改进的多类支持向量机递归特征消除在癌症多分类中的应用[J]. 黄晓娟,张莉. 计算机应用. 2015(10)
[2]一种改进的谱聚类算法及其在基因表达谱分析中的应用[J]. 葛芳,王年,郭秀丽. 安徽大学学报(自然科学版). 2012(05)
[3]动态多分类器集成在肺结节辅助检测中的应用[J]. 韩妍妍,冯筠,崔鑫,王秋萍. 计算机工程与应用. 2012(02)
[4]基于SVM-RFE-SFS的基因选择方法[J]. 游伟,李树涛,谭明奎. 中国生物医学工程学报. 2010(01)
[5]肿瘤信息基因启发式宽度优先搜索算法研究[J]. 王树林,王戟,陈火旺,李树涛,张波云. 计算机学报. 2008(04)
博士论文
[1]微阵列基因表达数据的特征分析方法研究[D]. 王爱国.合肥工业大学 2015
硕士论文
[1]基于遗传算法的大规模MIMO系统导频优化研究[D]. 高露.南京邮电大学 2018
[2]基于遗传算法的网络视频流特征选择与识别研究[D]. 岳全涛.南京邮电大学 2018
[3]粒子群算法改进及其应用研究[D]. 秦媛.南京邮电大学 2018
[4]基于改进邻域粗糙集和随机森林算法的糖尿病预测研究[D]. 胡玮.首都经济贸易大学 2018
[5]肿瘤基因表达数据的特征选择方法研究[D]. 李晨阳.兰州交通大学 2018
[6]基于随机森林和支持向量机的癌症基因数据分析[D]. 梁炉方.山东大学 2017
[7]微阵列基因表达数据混合特征算法研究[D]. 董文娟.沈阳工业大学 2017
[8]基于特征选择和集成学习的结直肠癌预测模型研究[D]. 李甜.西南大学 2017
[9]基因表达谱的肿瘤特征基因提取研究分析[D]. 尹蕾.西安建筑科技大学 2014
[10]基于聚类分析和智能优化特征选择的基因微阵列数据分类[D]. 宋创.西安电子科技大学 2014
本文编号:3063007
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
本文研究内容框架图
图 2.1 线性可分最优分类面机存在线性可分和线性不可分两种情况:可分数据集nNNiT {(x,y),...,(x,y)},x R11, yi { 1, 1}, S: x b 0,能够将数据集的正负实例点完全正
线性不可分分类界面
【参考文献】:
期刊论文
[1]改进的多类支持向量机递归特征消除在癌症多分类中的应用[J]. 黄晓娟,张莉. 计算机应用. 2015(10)
[2]一种改进的谱聚类算法及其在基因表达谱分析中的应用[J]. 葛芳,王年,郭秀丽. 安徽大学学报(自然科学版). 2012(05)
[3]动态多分类器集成在肺结节辅助检测中的应用[J]. 韩妍妍,冯筠,崔鑫,王秋萍. 计算机工程与应用. 2012(02)
[4]基于SVM-RFE-SFS的基因选择方法[J]. 游伟,李树涛,谭明奎. 中国生物医学工程学报. 2010(01)
[5]肿瘤信息基因启发式宽度优先搜索算法研究[J]. 王树林,王戟,陈火旺,李树涛,张波云. 计算机学报. 2008(04)
博士论文
[1]微阵列基因表达数据的特征分析方法研究[D]. 王爱国.合肥工业大学 2015
硕士论文
[1]基于遗传算法的大规模MIMO系统导频优化研究[D]. 高露.南京邮电大学 2018
[2]基于遗传算法的网络视频流特征选择与识别研究[D]. 岳全涛.南京邮电大学 2018
[3]粒子群算法改进及其应用研究[D]. 秦媛.南京邮电大学 2018
[4]基于改进邻域粗糙集和随机森林算法的糖尿病预测研究[D]. 胡玮.首都经济贸易大学 2018
[5]肿瘤基因表达数据的特征选择方法研究[D]. 李晨阳.兰州交通大学 2018
[6]基于随机森林和支持向量机的癌症基因数据分析[D]. 梁炉方.山东大学 2017
[7]微阵列基因表达数据混合特征算法研究[D]. 董文娟.沈阳工业大学 2017
[8]基于特征选择和集成学习的结直肠癌预测模型研究[D]. 李甜.西南大学 2017
[9]基因表达谱的肿瘤特征基因提取研究分析[D]. 尹蕾.西安建筑科技大学 2014
[10]基于聚类分析和智能优化特征选择的基因微阵列数据分类[D]. 宋创.西安电子科技大学 2014
本文编号:3063007
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3063007.html