基于多组学数据的癌症生物标志物识别算法研究

发布时间：2021-03-05 16:18

　　癌症不仅给患者带来极大的痛苦,还给无数家庭乃至整个国家带来沉重的经济负担。早期诊断是有效治疗癌症的关键所在。生物标志物在癌症早期诊断中具有重要价值。生物标志物是指那些能够客观检测和评价癌症发生、发展和预后的指示因子,如基因、microRNA和遗传突变等。一些癌症相关的生物标志物已被发现,但大多数仍然不能用于癌症的精准预测、诊断和预后评估。其中一个原因在于癌症病理机制极其复杂,患同一癌症的不同病人之间标志物不尽相同,同一标志物可能存在于多种癌症中。越来越多的研究表明癌症是多个基因、microRNA等突变、转录后修饰及其之间复杂调控关系的紊乱,以及环境因素等共同作用的结果。因此,新的生物标志物识别方法亟待提出。实验手段识别癌症生物标志物非常昂贵且效率低,基于计算方法的癌症生物标志物识别能够大大降低成本和缩短识别周期。随着测序技术的发展,基因组学、转录组学、蛋白组学与代谢组学等多种组学数据海量涌现,为系统了解癌症的病理病因提供了可能,也为基于计算方法的癌症生物标志物识别提供了坚实的数据基础。如何整合多组学数据设计并实现高效的癌症生物标志物识别算法,找出更多更有价值的癌症生物标志物,以供研究人...

【文章来源】：吉林大学吉林省 211工程院校 985工程院校教育部直属院校

【文章页数】：139 页

【学位级别】：博士

【部分图文】：

图２．１组学技术及其内在联系??

算法流程图

４．?ＭＣＤＧＰＡ算法是少数基于功能模块算法中与本文算法思想较为相近的综合考虑，我们选择这三个算法进行介绍。???Ｅｎｄｅａｖｏｕｒ?算法??Ｅｎｄｅａｖｏｕｒ１７１１?算法（ｈｔｔｐｓ：／／ｅｎｄｃａｖｏｕｒ．ｃｓａｔ．ｋｕｌｅｕｖｃｎ．ｂｃ／）的基本原理是收集大量??因相关的注释数据，通过计算候选基因与己知癌症相关基因在数据集上的相??从而得到潜在的癌症相关基因。该算法基于如下假设：参与同一疾病或生物??中的基因比基因组的其他基因具有更高的相似性．该相似性可以是序列相似胞定位相同、共表达和有相同的调控因子等。２０１６年，Ｅｎｄｅａｖｏｕｒ开发团队??ｎｄｅａｖｏｕｒ进行了升级｜７｜］，新版本的Ｅｎｄｅａｖｏｕｒ集成了?７５种基因相关的数据??。算法的基本流程如图２．２所示：??〇?■?Ｏ?）?．＇?０??

算法,示意图,拉普拉斯,差异表达

图２．３?ＰＩＮＴＡ算法示意图??具体而言，该算法主要包含如下四个过程：??１．利用ＳＴＲＩＮＧ蛋白互作网络，结合拉普拉斯指数扩散核函数（公式２．６）??算得到一个全局的距离网络。在该距离网络中数值表示从另一个节点开始随机??走后在某个时间点到达下一个节点的概率。??Ｋ?＝?＼＼ｍＵ?＋?—）ｎ?＝ｅｐＬ??（２．６）??？—＞〇〇?ｙｊ??中，Ｌ是带权无向图Ｇ的拉普拉斯矩阵，４是扩散参数，／是单位矩阵，ｎ是??点个数。??２．通过使用微阵列表达数据，结合正常和患病样本得到基因的差异表达水??平（ｆｏｌｄ－ｃｈａｎｇｅ）。对于每？个候选基因，通过其邻居节点的差异表达水平得到??—个重要性值，因此，候选基因的所有邻居节点的差异表达水平越高，候选基因??的打分越高。??

【参考文献】：
期刊论文
[1]Role of microRNAs in translation regulation and cancer[J]. Stefania Oliveto,Marilena Mancino,Nicola Manfrini,Stefano Biffo. World Journal of Biological Chemistry. 2017(01)
[2]Wnt signaling in disease and in development[J]. Roel NUSSE. Cell Research. 2005(01)

本文编号：3065491

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3065491.html

上一篇：Windows系统的缺陷检测及自动化利用方法研究
下一篇：基于工作流模型的检察院档案管理信息系统的设计与实现

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|