基于字典学习的肿瘤基因表达谱分类算法研究
发布时间:2024-03-01 22:16
肿瘤是一种严重威胁人体生命健康的疾病。长期以来,研究人员一直都在探寻治愈肿瘤的最佳手段。然而肿瘤类型众多,即使是同一种肿瘤也可以分为许多不同的亚型,而不同亚型肿瘤的治疗手段是不同的。因此,准确而快速地对肿瘤分类能最大程度地发挥治疗效果,延长甚至挽救病人的生命。利用肿瘤基因表达谱对肿瘤进行分类是当前一种比较新的肿瘤分类手段,该方法速度快,分类过程自动化,能节省大量的人力物力资源,已经成为当前肿瘤分类领域的研究热点。但当前大部分传统机器学习方法对肿瘤基因表达谱的分类准确率普遍较低,需要设计更适合的分类算法。为了提升分类准确率,本文主要做了如下三方面工作:1.基于判别投影的字典学习分类算法。字典学习分类算法是一种比较适合处理基因表达谱数据的算法,但一般的字典学习模型只注重提升所训练的字典对样本的重构能力,而忽视了其对样本的鉴别能力。针对该问题,本文设计了基于判别投影的字典学习分类模型。在训练过程中,该模型为每一类训练样本都训练出一组子字典,每类子字典都只能对同类样本进行低误差同构。在训练字典的同时,还训练出一个投影矩阵,利用该投影矩阵对测试样本进行投影能拉大不同类别样本之间的距离。最后利用字...
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
本文编号:3915904
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图1.1基因表达谱制备过程
国防科技大学研究生院硕士学位论文第3页的一类却只有4个样本。总体上,基因表达谱数据的这些特性增加了数据分析的难度,设计合适的基因表达谱分类算法不仅可以提高分类准确率,增强鲁棒性,还能在很大程度上节省计算资源,提高计算速度。因此,设计和优化针对基因表达谱的分类算法已经成为当今生物信....
图2.1基因表达谱数据提取过程
国防科技大学研究生院硕士学位论文第9页第二章基因表达谱数据及其常见分类方法本章主要介绍基因表达谱数据的生物学意义、特点,数据预处理方法以及几种常用的分类算法。2.1基因表达谱数据2.1.1肿瘤与基因表达谱肿瘤是人类健康的重大威胁。近几十年的医学研究表明,肿瘤是机体在物理、化学、生....
图2.2支持向量机的最优超平面
国防科技大学研究生院硕士学位论文第14页2.3常见分类算法一个好的分类器对于最终的分类效果具有决定性的作用,本文的主要工作重心也放在了设计一种能进一步提高基因表达谱分类准确率的算法。在文献中常见的肿瘤基因表达谱分类算法有支持向量机、K最邻近算法、稀疏表示分类算法等,作为与本文方法....
图2.3KNN算法原理
国防科技大学研究生院硕士学位论文第16页对求出的欧式距离进行排序,选择距离最小的前K个样本,然后比较这K个已知标签的样本在哪一类别中分布更多便判断待分类样本也是属于哪一类别。如图2.3所示,在与待判别样本Y最邻近的K(图中为4)个样本中有三个属于类别1,有一个属于类别3,我们就认....
本文编号:3915904
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3915904.html