当前位置:主页 > 医学论文 > 生物医学论文 >

基因表达预测深度学习平台构建与研究

发布时间:2020-09-29 23:56
   随着机器学习和深度学习的发展,越来越多的算法开始被应用到生物信息领域,近些年由于微阵列技术的蓬勃发展,人体基因信息逐渐被挖掘出来。经过调查研究,人体内已经有两万多条基因被发现,虽然现在的基因技术在不断的发展,但是进行一次人体的全基因组成本还是非常昂贵的。经过美国国立卫生院研究表明,人体内的基因表达通常都是高度相关的,由此他们发现人体内的大约1000个标志性基因包含了人体内其余80%基因的信息。为了有效利用这些标志性基因,可以把这大约1000个标志性基因作为输入,利用机器学习或深度学习的算法进行建模,去预测剩余的基因表达数据。然而目前很少有用于基因表达预测的平台,使用机器学习深度学习算法对基因表达预测进行建模并建立可供相关研究者和学习者使用的基因预测表达平台,是本文要解决的主要问题。机器学习中的回归算法主要有线性回归、核岭回归、支持向量回归等,深度学习主要采用神经网络去做回归。LINCS项目组的成员采用线性回归进行基因表达预测。Yifei Chen等人也使用深度学习算法。但是其深度学习算法模型受限于当时的机器设备配置,建立了两个神经网络进行基因表达预测,尽管准确度上表现不错,但是在训练和预测需要耗费大量的时间。在本研究中,主要使用深度学习模型,并辅之以机器学习模型,如线性回归、核岭回归和支持向量回归,并搭建基因表达预测平台,用户只需要输入少部分的基因表达值,即标志性基因的表达值,然后平台使用后台已经训练好的模型对基因表达进行预测,并将输出的9520个基因表达值反馈给用户。在对基因数据集进行预处理后,使用scikit-learn学习包建立线性回归、核岭回归和支持向量回归模型,使用多层全连接神经网络,并采用Drop Out等技巧进行参数调优,建立深度学习模型,对模型参数进行调优后把模型保存到本地,以供平台加载使用。本文对平台所使用的模型原理、建模过程和使用进行详细阐述,并针对用户不同的输入进行分析,如本地化Blast序列比对。最后采用Django框架对基因表达预测平台进行搭建开发,并将相关数据持久化保存到My Sql数据库中。本研究旨在更好的帮助相关研究者和学习者进行使用,从而对基因表达研究起到辅助作用。
【学位单位】:吉林大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:Q811.4;TP181
【部分图文】:

岭迹,式子


图 2-1 岭迹图示例用主要有可以观察最佳的 值,同时也可以观察变量间是的选取,可以通过选取岭迹图的喇叭口,也就是刚靠近平英文全称时 Kernel Ridge Regression。核岭回归就是使用行训练的数据不可线性回归的情况时,这时候一般可以使用回归所求得的w的式子中,使用 ( )i i x代替 ,在这种,这时候使用是一个技巧让我们可以对式子进行一个转换1 1 1 1 1( ) ( )T T T TP B R B B R PB BPB R + + …………式应用到 的式子中,则:1 1( ) ( )T Td nw I y I y + + …………

前馈神经网络,多隐层,输入层,隐层


1( ) ( ) ( , )i i iif x K x x +b……………...……(2.3.17)其中 ( , ) ( ) ( )Ti i jK x x x x为核函数。2.3.4 多隐层前馈神经网络神经网络是深度学习中的一种算法,起源于模仿动物神经行为特征,网络内部是很复杂的,可以通过一些手段调整层与层之间神经元之间的连接关系,从而对数据信息进行有效的处理计算[20]。前馈神经网络是深度学习中最常见的神经网络模型,它的第一层是输入层,最后一层是输出层。当中间的隐藏层有多个的时候,就称为多隐层前馈神经网络[21]。下面对前馈神经网络的结构进行介绍。在多隐层前馈神经网络中,网络中相邻层之间的神经元是全连接的,同层内或跨层的神经元是无连接的,如图 2-2 所示。

基因表达预测深度学习平台构建与研究


Blast安装成功

【相似文献】

相关期刊论文 前10条

1 周庆;赵沛荣;;探析“基因表达”概念教学中的若干疑难问题[J];生物学教学;2016年12期

2 杜维波;郜瑞;;浅谈模型建构在基因表达计算中的运用[J];中学生物教学;2017年15期

3 老白;;返老还童的一道坎儿[J];课堂内外(科学Fans);2017年01期

4 黄欣;陈少华;杨力建;沈琦;查显丰;李

本文编号:2830447


资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/swyx/2830447.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b7a88***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com