当前位置:主页 > 科技论文 > 基因论文 >

基于landmark基因集的深度学习基因表达预测方法

发布时间:2020-11-05 22:46
   大规模的基因表达分析已经被广泛用于表征在各种疾病条件、遗传扰动等条件下的细胞状态。随着科技的发展,虽然全基因组表达值的成本已经逐步下降,但是要生成一个成千上万的样本的基因表达值仍然是非常昂贵的。认识到基因表达通常是高度相关的,美国国立卫生研究院LINCS项目的研究人员开发了一种经济有效的方案,他们挑选出了大约1000个左右的landmark基因,并证实这些挑选的基因能捕捉到80%左右的信息。那么就可以利用这些较少的基因,使用一些机器学习的知识,在较短的时间内以较高的准确度进行模拟全基因组的基因表达值分析。机器学习的方法有较多,常见的如线性回归、决策树、神经网络、支持向量机以及一些聚类方法等。其中,LINCS项目组使用了基于线性回归的方法;Yifei Chen,Yi Li等人使用了深度学习的方法。但是上面两种方法仍然存在一定的缺陷,线性回归不能捕捉到基因表达间复杂的非线性的关系,所以准确度不高;而深度学习的方法虽然在准确度上比线性回归好,但是过于复杂,花费的时间较长。综合线性回归和深度学习这两种算法各自的优缺点,本文提出一种基于卷积神经网络的深度学习的基因表达预测方法。通过自组织特征映射神经网络SOM将原始数据集转换成区域内相似的二维数据,然后将转换的数据利用卷积神经网络的方法做训练。由于数据集数据量大而且网络结构复杂,不使用GPU加速会严重影响训练速度,因此需要通过GPU加速深度学习速度,最后验证结果。为验证基于卷积神经网络的基因表达预测算法的可行性与预测准确度,本文分别使用了GEO、GTEx、1000G三种数据集进行实验,并与以上两种算法做对比分析。
【学位单位】:吉林大学
【学位级别】:硕士
【学位年份】:2017
【中图分类】:TP18
【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题背景和意义
    1.2 领域研究现状
    1.3 本文主要工作
    1.4 本文组织结构
第2章 研究背景介绍
    2.1 生物背景介绍
    2.2 相关算法及结果评估介绍
        2.2.1 线性回归
        2.2.2 岭回归
        2.2.3 Lasso回归
        2.2.4 反向传导算法
        2.2.5 自组织特征映射神经网络SOM
        2.2.6 实验结果评价标准
    2.3 深度学习及其配置环境介绍
        2.3.1 深度学习的背景及发展过程
        2.3.2 神经元模型
        2.3.3 神经网络的分类
        2.3.4 卷积神经网络
        2.3.5 CUDA及GPU加速介绍
    2.4 本章小结
第3章 基于卷积神经网络的深度学习的基因表达预测方法
    3.1 数据来源
    3.2 基于深度学习的基因表达预测方法介绍
        3.2.1 算法理论
        3.2.2 算法流程
    3.3 基于卷积神经网络的深度学习的基因表达预测方法及流程介绍
        3.3.1 算法思考背景及思想
        3.3.2 算法架构
        3.3.3 算法流程
        3.3.4 程序伪代码
    3.4 本章小结
第4章 实验结果及分析
    4.1 GEO数据集上的结果与分析
    4.2 GTEX数据集上的结果与分析
    4.3 本章小结
第5章 总结与展望
    5.1 总结
    5.2 展望
参考文献
作者简介及在学期间取得的科研成果
致谢

【相似文献】

相关期刊论文 前6条

1 蔡瑞初;王美华;郝志峰;温雯;;基于最大间隔的基因表达规则筛选[J];计算机工程与应用;2011年26期

2 索文莉;李长国;;高维基因表达数据集分类规则组的确定[J];天津理工大学学报;2013年06期

3 罗万春;易东;;胎儿小脑基因表达多尺度降噪的y~n曲线模型[J];计算机工程与应用;2011年07期

4 李传星,李霞,郭政,宫滨生,屠康;调控通路内基因表达的相关性分析[J];遗传;2004年06期

5 梁文快;李毅;;改进的基因表达算法对航班优化排序问题研究[J];计算机技术与发展;2014年07期

6 刘岭;程迪祥;陈洪;陈品一;易东;;诊断性基因表达谱模式可信区间图示法[J];激光杂志;2011年06期


相关博士学位论文 前10条

1 李利;绵羊胚胎发育后期骨骼肌中转录组水平基因表达分析及基因网络的构建[D];中国农业科学院;2012年

2 Samuel Jerry Cobbina;[D];江苏大学;2015年

3 周宁;锌对水貂毛色基因表达及生产性能的影响[D];延边大学;2015年

4 章琳;基于基因表达秩序关系识别癌症预后与早期诊断标志[D];电子科技大学;2014年

5 丁艳芬;玉米ZmCPK11在ABA诱导的抗氧化防护中的功能分析[D];南京农业大学;2012年

6 姜海燕;肠道菌对旋毛虫存活、繁殖及蛋白表达变化影响的研究[D];吉林大学;2016年

7 苏文霞;人类胚胎干细胞中表观遗传修饰与基因表达的相关研究[D];内蒙古大学;2016年

8 张云霞;FHL3与MyoD和pCREB蛋白相互作用差异调控MyHC各亚型基因表达的分子机制[D];华中农业大学;2015年

9 郭绪涛;联合检测初治急性髓系白血病患者MDR1、BAALC基因表达及MDR1基因在诱导化疗中的价值[D];南方医科大学;2016年

10 刘艳霞;CREG抑制高糖高脂诱导人脐静脉内皮细胞凋亡的机制研究[D];第三军医大学;2016年


相关硕士学位论文 前10条

1 蔡佳;新型凝胶多糖纳米粒子的制备及体外递送siRNA研究[D];内蒙古大学;2015年

2 刘翔宇;不同电场条件处理柠条种子对干旱条件下幼叶基因表达的影响[D];内蒙古大学;2015年

3 苏运聪;基于MIAME的基因表达数据融合方法设计及应用实践[D];浙江大学;2015年

4 张宝修;活性氧对鼠早期胚胎抗氧化酶基因表达的影响[D];延边大学;2015年

5 周瑜;Egr-1对APP基因表达的调控作用[D];宁夏医科大学;2015年

6 李珊;衰老相关的外周全血基因表达与DNA甲基化标志物的可重复性[D];电子科技大学;2014年

7 王利华;预照射联合siRNA抑制小鼠肺癌survivin基因表达的研究[D];青岛大学;2015年

8 董柏余;采后ASM处理调控厚皮甜瓜果实活性氧代谢及抗性相关酶的分子和生化机理[D];甘肃农业大学;2015年

9 伍丹;恢复SFRP1基因表达对MGC803细胞增殖迁移的影响[D];南华大学;2015年

10 夏双双;二甲酸钾对断奶仔猪胃功能及相关功能基因表达的影响[D];南京农业大学;2014年



本文编号:2872293

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/2872293.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2e03a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com