当前位置:主页 > 管理论文 > 统计学论文 >

基于Bagging Dtrace模型的基因差异网络分析

发布时间:2020-12-26 01:33
  不同病理状态下的基因调控网络模式发生改变,表明其对应的基因连接关系已改变。本文尝试寻找那些连接关系改变的关键基因,以区分不同亚型的癌症。从研究历史文献发现,通常采用直接法和间接法来估计差异网络。当考虑到时间花度和预测精度时,我们一般选择直接估计法。由于样本数据较少,因而,这些差异网络估计法可能未能充分的利用其样本信息。基于此,文本提出采用Bagging算法集成直接估计法来估计差异网络,通过有放回的采样,增加了数据的多样性以及对数据的充分利用。在模拟数据上,将本文提出的模型与Dtrace模型进行对比分析,模拟实验结果显示本文提出的模型比Dtrace模型效果更优。在真实数据集分析,将我们的方法应用到不同亚型乳腺癌基因表达数据的分析上,采用稳定性选择算法选择调优参数,最后模型确定了5个关键基因。通过调查研究文献发现,本文找到的5个关键基因对区分不同亚型的乳腺癌有非常重要的作用。 

【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校

【文章页数】:33 页

【学位级别】:硕士

【部分图文】:

基于Bagging Dtrace模型的基因差异网络分析


图1:对差异网络的间接估计与直接估计,间接估计是分别计算两个差异网络,再来计算最后差??异网络;直接估计是直接计算得到一个差异网络??

区域图,图形表示,和约,变量选择


选择变量方面的效果较差。而Lasso的提出,则克服了以上方法的不足。??Lasso是通过加入对各系数的A范数惩罚,使系数向量产生稀疏,从而达到??变量选择的作用。通过图形直观理解见图2丨17],用红色环线表示目标最小二乘函??5??

病理状态,新模型,数据采样,异网


在数据推动下,本文将不同病理状态下的基因表达数据与静态基因调控网络??数据有机结合,构建了新的差异网络分析模型一一应用Bagging?Dtrace模型推断??基因差异网络,模型结构见图3。本章将详细介绍Bagging算法应用到差异网络推??断以及参数选择中,本文的算法的整体框架如算法3所示:??12??


本文编号:2938775

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2938775.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cae87***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com