当前位置:主页 > 科技论文 > 基因论文 >

基于机器学习的Pan-cancer基因通路以及染色质绝缘子调控元件研究

发布时间:2021-04-09 03:54
  随着DNA测序技术的发展,人们获得DNA序列和基因表达数据的手段越来越多,影响生物信息技术发展的瓶颈,是开发优质的数据挖掘算法从大量的生物序列数据中挖掘出有价值的信息。传统的序列数据分析通过对比,映射等,分析序列的突变以及在基因组中空间结构信息,对于表达数据,则是分析不同基因的差异表达,试图找出规律。然而,这些方法只能获取数据本身的属性,对隐藏的规律无法很好的挖掘和展现。近年来,机器学习在数据挖掘,个性化推荐,自然语言处理,图像识别等领域得到了广泛的运用,通过不同种类的监督方式,对特征加权,提取出高泛化程度的特征。在此之前,机器学习分析生物信息学数据主要是以问题为导向,解决数据的分类问题。但是机器学习算法和生物学意义之间一直无法相互联系,只能通过分类的评价指标来判断模型对生物数据的泛化性能,在本文中,设计了两组实验(TCGA基因表达数据预测泛癌症基因通路预测和绝缘子序列预测)对不同的生物数据进行数据挖掘,并通过生物学意义来验证算法对生物数据的泛化性能。癌症基因图谱(The Cancer Genome Atlas,TCGA)收集了 33种常见的癌症11000多个癌症患者的表达数据,变异数... 

【文章来源】:云南大学云南省 211工程院校

【文章页数】:60 页

【学位级别】:硕士

【部分图文】:

基于机器学习的Pan-cancer基因通路以及染色质绝缘子调控元件研究


图2-1序列数据自编码网络特征提取流程??深度自编码网络包含两个部分,编码阶段函数&?=?/(4和解码重构输入阶段??

示意图,网络原理,自编,降噪


数据的完整特征。??2.5降噪自编码器的原理??降噪自编码的示意图如图(图2-2)所示,Denoising?Autoencoder与人的感知??机理类似[16],当人看物体时,即使物体一小部分被修改了或者被遮挡,我们依??然能够识别出具体的物体。以修改的数据的数据去计算2/,计算并将z与原始z??做误差迭代,这样,网络就学习了这个破损(Corruputed)的数据。从而获得的??特征不容易收到数据质量的影响。?????OT1?C^D??(v?1)j??(Vf^JL^xxxf^?OX?XX?X?))??X?3C??图2-2降噪自编吗网络原理??2.6卷积神经网络原理及序列特征(motif)提取??卷积核[28]是一个小的权值矩阵,通过在大的矩阵上滑动,将重合部分与卷??积核做矩阵乘法,从而达到探测与卷积核特征相似的特征,下面用一个图来解释??这个过程:??2?0?3?0???1????5?0??????2?0?3?0???30?0?45?????5?0=???2?0?3?0???30?〇?45??—????5?0??????2?0?3?0?????图2-3卷积操作原理??如图2-3所示,在原矩阵中,有列分布的特征,并且特征的大小有差别,如??果我们使用列特征的卷积核去对原矩阵进行卷积操作,我们将得到分布相同的结??果

示意图,操作原理,卷积


数据的完整特征。??2.5降噪自编码器的原理??降噪自编码的示意图如图(图2-2)所示,Denoising?Autoencoder与人的感知??机理类似[16],当人看物体时,即使物体一小部分被修改了或者被遮挡,我们依??然能够识别出具体的物体。以修改的数据的数据去计算2/,计算并将z与原始z??做误差迭代,这样,网络就学习了这个破损(Corruputed)的数据。从而获得的??特征不容易收到数据质量的影响。?????OT1?C^D??(v?1)j??(Vf^JL^xxxf^?OX?XX?X?))??X?3C??图2-2降噪自编吗网络原理??2.6卷积神经网络原理及序列特征(motif)提取??卷积核[28]是一个小的权值矩阵,通过在大的矩阵上滑动,将重合部分与卷??积核做矩阵乘法,从而达到探测与卷积核特征相似的特征,下面用一个图来解释??这个过程:??2?0?3?0???1????5?0??????2?0?3?0???30?0?45?????5?0=???2?0?3?0???30?〇?45??—????5?0??????2?0?3?0?????图2-3卷积操作原理??如图2-3所示,在原矩阵中,有列分布的特征,并且特征的大小有差别,如??果我们使用列特征的卷积核去对原矩阵进行卷积操作,我们将得到分布相同的结??果


本文编号:3126863

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3126863.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bc9d9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com