当前位置:主页 > 科技论文 > 自动化论文 >

基于传统特征提取和深度学习方法相结合的基因表达数据降维研究

发布时间:2021-06-21 08:44
  DNA微阵列技术的使用促使越来越多的基因表达数据产生。大量的信息蕴含在基因表达数据中,通过分析基因表达数据,能够增加对肿瘤细胞和正常细胞之间的基因表达差异的了解,同时也可以找出与肿瘤形成关系密切的基因,这对于癌症的诊断、治疗和预防都具有非常重要的意义。分类是实现癌症诊断的重要手段,然而,由于基因表达数据具有特征维数高、存在大量冗余信息等特点,如果采用传统的分类方法对样本直接分类,可能会出现“维数灾难”。如果采用传统的特征降维方法先降低原始数据的维数,可以解决基因表达数据的“维数灾难”问题,但会影响基因表达数据的分类正确率。因此,选择合适的特征提取方法是对基因表达数据分类前的关键一步。深度学习是一种特征学习方法,能够学习高维数据中的复杂结构。因此,本文首先研究自动编码器对基因表达数据的降维作用,并与传统的特征提取方法主成分分析方法、线性判别分析方法和核主成分分析方法进行比较。实验结果表明在8种基因表达数据集上,自动编码器的降维效果整体要优于主成分分析方法、线性判别分析方法和核主成分分析方法,同时,也验证了自动编码器对基因表达数据降维的有效性。由于基因表达数据特征维数比较高,自动编码器学习... 

【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校

【文章页数】:72 页

【学位级别】:硕士

【部分图文】:

基于传统特征提取和深度学习方法相结合的基因表达数据降维研究


cDNA微阵列获取基因表达数据过程示意图

特征对,特征和,分类器,数据集


26(g)ALLAML (h)9_Tumors图 3.5 PCA 特征和 AE 特征对 softmax 分类器性能的影响对于 PCA 特征,当保留 99.9999%的方差变化时,数据集 colon、lymphoma、prostate、gcm、nci64、mit、ALLAML 和 9_Tumors 的 PCA 特征维数分别为 61、61、101、189、63、71、37、59。对于每个数据集,当特征维数从 1 开始变化时,自动编码器的隐藏

特征对,特征和,分类器,降维


29(g)ALLAML (h)9_Tumors图 3.7 KPCA 特征和 AE 特征对 softmax 分类器性能的影响从以上三个实验可知,在大多数的数据集上,自动编码器的降维作用要优于PCA、LDA 和 KPCA,同时,也验证了自动编码器对基因表达数据降维的有效性。然而,由于基因表达数据的特征维数比较高,自动编码器学习基因表达数据中的

【参考文献】:
期刊论文
[1]生物医学数据分析中的深度学习方法应用[J]. 李渊,骆志刚,管乃洋,尹晓尧,王兵,伯晓晨,李非.  生物化学与生物物理进展. 2016(05)
[2]基于稀疏类别保留投影的基因表达数据降维方法[J]. 王文俊.  电子学报. 2016(04)
[3]第3讲 深度学习中的经典网络模型及训练方法[J]. 韩伟,张雄伟,张炜,吴从明,吴燕军.  军事通信技术. 2016(01)
[4]第2讲 深度学习基本理论概述[J]. 陈栩杉,张雄伟,乔林,王健,李治中.  军事通信技术. 2015(04)
[5]一种基于稀疏主成分的基因表达数据特征提取方法[J]. 沈宁敏,李静,周培云,庄毅.  计算机科学. 2015(S1)
[6]深度学习技术及其在肿瘤分类中的应用[J]. 雷成,叶小勇,李小波.  智能计算机与应用. 2014(06)
[7]基于PCA和LDA方法的肿瘤基因表达谱数据分类[J]. 李志文,蔡先发,韦佳,周怡.  北京生物医学工程. 2014(01)
[8]基于鉴别主成份分析的基因表达数据特征提取[J]. 廖海斌,徐洪章.  燕山大学学报. 2010(05)

博士论文
[1]基因表达数据的相似性度量和特征提取研究[D]. 王文俊.西安电子科技大学 2011

硕士论文
[1]基于深度学习的癌症分类模型研究[D]. 叶永盛.华中科技大学 2015



本文编号:3240364

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3240364.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1e992***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com