当前位置:主页 > 医学论文 > 病理论文 >

融合数据内部结构信息的贝叶斯标志基因筛选

发布时间:2017-04-12 15:18

  本文关键词:融合数据内部结构信息的贝叶斯标志基因筛选,由笔耕文化传播整理发布。


【摘要】:高通量的“组学”数据中蕴含着与疾病相关的生物标志物,为深入研究疾病的发生发展机制带来了前所未有的机遇。但是,如何从高维高通量的组学数据中发现生物标志物是生物数据分析的重点和难点。本研究针对目前生物标志物筛选中通用的过滤式(如方差分析、秩和检验等)和封装式(如LASSO,支持向量机等)等方法的局限和不足,提出了一个在广义线性模型框架下通过集成数据内部结构信息来筛选标记基因的策略。模型筛选效果评价通过模拟实验进行,并采用析因设计方差分析从样本容量、总体阳性率、信噪比、基因间关联强度以及致病基因效应强度五个方面对模型进行影响因素分析。结果显示,五个影响因素中,变异贡献大小依次为:信噪比样本容量总体阳性率基因间关联程度效应强度。先验信息的设置也会对贝叶斯变量选择模型的筛选效果产生影响。我们利用高斯图模型和最大相关系数法提取数据的内部结构特征作为模型的先验信息,为了探讨不同内部结构信息对模型筛选准确性的影响,我们针对这两种数据挖掘方法各设置了三类共6种内部结构形式,也通过模拟实验考察其筛选效果。结果显示,这几种内部结构形式与模型融合后筛选效果比较理想,其中,高斯图模型提取的偏相关系数矩阵与最大相关系数法提取的最大相关系数等级矩阵与模型融合的筛选效果最好。因此,我们认为高斯图模型与最大相关系数法提取的内部结构信息均能在一定程度上反映数据的内部结构特征,并建议在利用高斯图模型时,可采用未离散化的内部结构形式与本研究筛选模型进行融合;而在利用最大相关系数法时,则最好采用离散化的内部结构形式进行融合。在模拟实验得出的结论基础上,以乳腺癌基因数据为例进行实证研究。利用融合偏相关系数矩阵和最大相关系数等级矩阵的模型进行基因筛选,并列出了后验概率最高的前15个基因。通过文献查验,确证其中一些基因与乳腺癌具有一定的生物学联系。
【关键词】:贝叶斯变量选择 基因筛选 高斯图模型 最大相关系数
【学位授予单位】:重庆医科大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:Q811.4;R3416
【目录】:
  • 英汉缩略语名词对照5-6
  • 中文摘要6-8
  • 英文摘要8-10
  • 1 前言10-13
  • 1.1 研究背景10
  • 1.2 贝叶斯变量选择方法在基因筛选中的应用10-11
  • 1.3 基因表达数据的内部结构信息11-13
  • 1.4 研究内容13
  • 2 融合内部结构的贝叶斯变量选择模型13-24
  • 2.1 广义线性模型下的贝叶斯变量选择策略13-14
  • 2.2 基因关系图的构建以及数据的模拟14-19
  • 2.3 模型筛选效果比较及影响因素分析19-24
  • 3 当前数据内部结构信息的提取及其与BVS方法的融合24-38
  • 3.1 两种高维数据挖掘方法介绍25-27
  • 3.2 内部结构信息的提取27-29
  • 3.3 模拟实验29-38
  • 4 实证研究38-41
  • 4.1 分析步骤38-39
  • 4.2 筛选结果39-41
  • 结论41-44
  • 参考文献44-47
  • 文献综述47-53
  • 参考文献50-53
  • 致谢53-54
  • 硕士期间发表的论文54

【相似文献】

中国期刊全文数据库 前1条

1 陈大业,王秀文;华北几次中强地震前太原台地倾斜异常特征[J];内陆地震;1991年02期


  本文关键词:融合数据内部结构信息的贝叶斯标志基因筛选,由笔耕文化传播整理发布。



本文编号:301571

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/binglixuelunwen/301571.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0882e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com