基于基因表达谱的肿瘤放疗敏感基因识别方法研究
本文关键词:基于基因表达谱的肿瘤放疗敏感基因识别方法研究
更多相关文章: 基因芯片 肿瘤放疗敏感基因 放射治疗 通路富集分析
【摘要】:数以万计的生物体活细胞中的基因在正常情况下会沿着对应的固定模式进行基因表达,但是细胞进入疾病状态时,基因发生突变,基因的表达模式出现异常化,这就是所谓的基因差异表达。探索肿瘤细胞中的差异表达基因可以获得基因中蕴含的丰富的信息。基因芯片技术被广泛应用到生物医学研究领域,它可以同时获得成千上万的基因在不同情况不同状态下的基因表达谱,该基因表达谱数据中蕴含着丰富的基因活动信息。目前临床上治疗肿瘤的有效手段之一就是放射治疗,例如大约有70%的癌症病人在癌症治疗的过程中需要使用放射治疗,其中大约有40%的癌症可以用放疗根治。大量研究发现,肿瘤患者对放疗的反应情况主要是取决于患者个体固有的放射敏感性,肿瘤本身固有的放射敏感性与辐射诱导的基因表达和基因调控有关系。所以,找到的肿瘤放疗敏感基因可以确定哪些病人适合放疗和所应用的放射的剂量,从而大大提高肿瘤放射治疗的效果。肿瘤基因表达谱数据具有高维度和小样本的特点。识别放疗敏感基因,不仅可以挖掘潜在的基因信息,而且有助于我们了解癌症等疾病的发病发展机制,也能在临床上提高肿瘤放疗疗效。本论文侧重于识别放疗敏感基因的计算方法,主要工作体现在如下几个方面:首先,我们开发了两个基于约束回归的方法,非负最小二乘法(NNLS)、弹性网法(Elastic Net),两个基于网络的方法,KEGGSDRW、PPISDRW方法,来识别肿瘤放疗敏感基因。考虑到基因表达的非负性,通过NNLS得到的非负最小二乘解比普通最小二乘的解更有意义。Elastic Net是近来发展起来的一种回归方法,Elastic Net的惩罚项同时包含L1惩罚项和L2惩罚项,既能实现变量压缩又能处理共线性的参数估计问题。基于先验网络信息的KEGGSDRW方法和PPISDRW方法,是结合定向随机游走(DRW)与Spearman相关系数来建立的。DRW遍历整个网络,其可以评估网络拓扑结构中每个基因的重要性。第二,在NCI-60基因表达数据上,我们应用上述方法得到肿瘤放疗敏感基因。对各个方法分类性能预测进行研究,结果表明Elastic Net、KEGGSDRW和PPISDRW方法识别的基因的分类性能预测较佳。第三,基于超几何分布进行通路富集分析。结果显示基于先验网络信息的方法在疾病相关通路富集性方面表现出较大优势,即基于网络的方法得到的显著富集通路大多数是集中在人类疾病功能模块。为了进一步验证结果的有效性和可靠性,我们对上述方法识别出来的肿瘤放疗敏感基因进行关联富集分析。结果表明通过这些方法识别出来的肿瘤放疗敏感基因的基因相关性是显著富集的。本文最后对文章做出总结,指出了目前肿瘤放疗敏感基因检测分析研究中存在的一些问题和以后研究中需要做的工作。
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R730.55;TP391.4
【参考文献】
中国期刊全文数据库 前6条
1 苏伟;董瑞新;刘昊;;脱氧核苷酸横向电输运特性的理论计算[J];计算物理;2010年03期
2 孙阿萍,吕晓平,张秋迟,吕学诜;细胞凋亡过程中核糖体蛋白质S3a水平变化的研究(一)──应用GST基因融合蛋白系统制备核糖体蛋白质S3a(RPS3a)[J];黑龙江医药科学;2001年03期
3 邓怀勇;;基于MapReduce的分布式Bi-Clustering算法在基因工程中的研究与应用[J];科技通报;2013年12期
4 荀鹏程;赵杨;易洪刚;柏建岭;于浩;陈峰;;Permutation Test在假设检验中的应用[J];数理统计与管理;2006年05期
5 余鑫煜;许正平;;蛋白质相互作用数据库及其应用[J];中国生物化学与分子生物学报;2008年03期
6 胡四新;张剑波;;“遗传的分子基础”专题复习[J];试题与研究;2012年33期
中国硕士学位论文全文数据库 前4条
1 卢颖;广义线性模型基于Elastic Net的变量选择方法研究[D];北京交通大学;2011年
2 张礼;寻找差异基因的概率方法研究[D];南京航空航天大学;2010年
3 李艳芳;基因表达数据的缺失值估计研究[D];哈尔滨工业大学;2011年
4 王峰;利用转录组序列信息精确识别Affymetrix基因芯片探针集转录本靶标[D];上海交通大学;2007年
,本文编号:1223738
本文链接:https://www.wllwen.com/yixuelunwen/fangshe/1223738.html