当前位置:主页 > 科技论文 > 自动化论文 >

基于对抗迁移学习的少样本基因表达谱癌症分类

发布时间:2021-07-08 03:36
  得益于深度学习强大的特征学习能力,深度学习在近年来获得了广泛的研究与应用。相对于传统机器学习方法,深度学习能够自动学习数据的高阶特征,节省了手工设计特征的工作。但是,当训练样本较少时,深度学习方法的过拟合问题严重,导致深度学习难以取得满意的效果。例如,在基因表达谱癌症分类任务上,由于基因表达谱数据的获取成本很高,使得可用的训练样本十分有限,导致直接在少样本的基因表达谱数据上使用深度学习进行癌症分类效果不佳。因此,本文以多个相关的基因表达谱数据集为研究对象,利用迁移学习挖掘多个基因表达谱数据的知识,有效提升了少样本基因表达谱癌症分类的效果。本文主要完成了以下两个工作:(1)大部分癌症基因表达谱数据集之间存在天然的联系,如急性白血病和慢性白血病,因此为了挖掘癌症基因表达谱数据集的知识来帮助另一个癌症基因表达谱进行分类,本文针对基因表达谱癌症分类任务,提出了一种新型的基于生成对抗网络的迁移学习模型(Adversarial Transfer Learning for Gene Expression Profile,ATL-GEP)。通过引入生成对抗网络,ATL-GEP模型能够自动地去除源领域表... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

基于对抗迁移学习的少样本基因表达谱癌症分类


结构化数据:人脸类任务设计而成

基因表达谱,非结构化数据,领域


哈尔滨工业大学工学硕士学位论文图1-1结构化数据:人脸图1-2非结构化数据:基因表达谱类任务设计而成。该模型通过对抗学习的方式将从源领域数据集学到的知识迁移到目标领域的分类模块中。该方法分两阶段,第一阶段是源领域分类模块学习阶段,从能够通过源领域分类模块获取源领域的知识或者表征;第二阶段固定源领域分类模块的参数,通过生成对抗网络的对抗学习方式将获取到的源领域表征结融合到由目标领域分类任务学到的本地表征中,同时目标领域分类任务学出本地和共享表征的权重,让目标领域分类任务自行学习出共享表征的权重参数以决定表征迁移的程度,丰富目标领域的表征以提升目标领域分类模块的学习能力。(2)为了利用多个相关基因表达谱领域的知识,本文在ATL-GEP的基础上,提出了一个新的对抗多任务学习模型(AdversarialMulti-taskLearningforGeneEx-pressionProfile,AMTL-GEP),该模型同样基于生成对抗网络并能够结合多份领域的数据互相迁移并共同提升学习能力。AMTL-GEP模型对领域判别器做出改进,使得领域判别器能够判别处理多个领域的表征。共享表征也与本地表征加权融合,各个领域的分类任务各自学出权重参数以决定迁移的程度,并将迁移学习的两阶段学习合并成一阶段学习,使得所有领域的分类模块能够学到其他领域的知识共同提升学习能力。1.4本文的结构安排本文主要研究如何利用迁移学习提升少样本学习能力的问题,共包含4个章节,本篇论文组织结构如下:第一章为绪论,首先介绍迁移学习和生成对抗网络的研究背景,迁移学习解决少样本问题的研究意义。然后对迁移学习、生成对抗网络和少样本领域的的国内外研究现状进行了总结,接着概述本文针对少样本领域中的基因表达谱癌症分类问题进行的主要研究工作,最后给出本论文的组织

基因表达谱,数据


哈尔滨工业大学工学硕士学位论文第2章基因表达谱及对抗迁移学习相关技术介绍本章首先介绍基因表达谱数据的相关背景,之后介绍迁移学习和生成对抗网络的背景、定义和使用场景,最后介绍本文中使用到的技术。2.1基因表达谱基因表达谱是一种在分子生物学领域,借助cDNA、表达序列标签或寡核苷酸芯片来测定细胞或组织的基因表达情况的生物数据,其中基因表达情况包括特定基因是否表达、表达丰度、不同组织、不同发育阶段以及不同生理状态下的表达差异。基因表达谱的数据挖掘,对于癌症的治疗与诊断、病理分析与研究具有重要意义。其中基因表达谱数据通过DNA微阵列实验来获龋DNA微阵列由一个个已知序列的基因探针排列而成,将其和将样本的核苷酸序列进行杂交,通过红绿荧光标记可以得到实验样本的基因表达水平。图2-1基因表达谱数据展示2.1.1基因表达谱数据获取一次DNA微阵列实验的最主要目的是获取实验样本的基因表达水平信息。DNA微阵列实验将实验样本用红色荧光标记,之后将对照样本用绿色荧光标记,两者标记完成后将其混合,之后将混合的样本和DNA微阵列的探针序列进行杂交并洗脱,最后使用专业仪器可以检测到不同种类的荧光强度。基因的表达水平用红、绿荧光强度的比值来表示。基因表达谱数据的可视化如图2-1所示,其中红色代表该基因点实验样本表达水平较高,绿色代表对照样本基因表达水平较低,黄色表示两者表达水平相当,黑色表示两者均不表达。实验流程如图2-2所示。-7-

【参考文献】:
期刊论文
[1]前列腺增生经尿道电切术近期出血的原因和处理[J]. 葛校军,周伟民,宗益平,吴盘芳.  现代泌尿外科杂志. 2010(05)
[2]基因表达谱芯片杂交影响因素的初步研究[J]. 祝骥,马文丽,李凌,毛向明,郑文岭.  生命科学研究. 2004(02)



本文编号:3270774

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3270774.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1a42b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com