当前位置:主页 > 医学论文 > 实验医学论文 >

基于蛋白质网络的人类遗传致病基因预测算法研究

发布时间:2018-11-14 18:19
【摘要】: 人类遗传疾病基因的预测是目前生物信息学研究中的一个热点问题。随着基因组测序的完成和新一代测序技术的发展,基因以及蛋白质相互作用网络数据不断增长。通过这些数据来分析预测致病基因给人类破译疾病的遗传基础和分子基础带来了新的方法,对基因组学和医学都具有重要的现实意义。 本文依据遗传疾病临床描述与蛋白质相互作用网络的关联关系,获取相关数据,首先对人类遗传疾病在线数据库进行文本挖掘,通过向量空间模型的方法,计算遗传疾病表型之间的重叠关系,其次利用蛋白质相互作用关系数据计算相互作用评分,加上疾病-蛋白质关联关系数据,共同构建了一系列生物网络,对疾病表型和蛋白质网络数据进行分析,基于这些网络数据对疾病的候选致病基因进行打分和排序,来预测疾病基因。本文提出了两种新的基于网络的人类遗传疾病基因预测方法。第一种在传统的二维关联概率模型的基础上,提出了基于多维随机变量的两种新的概率模型——中心概率模型和外形概率模型,在此基础上,提出了基于多概率融合的致病基因预测数学模型。还有一种是使用过滤函数的回归分析预测,通过观察网络和概率模型数据,总结数据规律,加入生物学假设,使用过滤函数融合回归分析进行候选基因的排序。 基于多概率融合的预测模型通过综合利用联合概率、中心概率和外形概率,在多个层面上反映了表型相似性与蛋白质相互作用之间的关联规律,与传统的基于单一概率的模型相比,该数学模型更好地反映了生物系统的真实面貌,具有更强的疾病基因预测能力。而另一个使用过滤函数融合回归分析的预测模型,根据合理的生物学假设,反映疾病表型重叠中蕴含的基因关联关系,可以有效的将很多非致病基因排在队列的后面,有效增强了预测方法的效率。
[Abstract]:Gene prediction of human genetic diseases is a hot issue in bioinformatics. With the completion of genome sequencing and the development of new generation sequencing technology, the data of gene and protein interaction network are increasing. These data are used to analyze and predict the genetic basis and molecular basis of human disease, which is of great practical significance to genomics and medicine. In this paper, according to the relationship between clinical description of genetic diseases and protein interaction network, we obtain relevant data. Firstly, we mine the online database of human genetic diseases by vector space model. The overlapping relationship between phenotypes of genetic diseases was calculated, and then a series of biological networks were constructed by using protein interaction relation data to calculate interaction score and disease protein correlation data to construct a series of biological networks. The disease phenotypes and protein network data were analyzed and the candidate disease genes were ranked and sequenced based on these network data to predict disease genes. In this paper, two new genetic prediction methods for human genetic diseases based on network are proposed. First, based on the traditional two-dimensional correlation probability model, two new probabilistic models based on multidimensional random variables, the central probabilistic model and the shape probabilistic model, are proposed. A mathematical model for predicting pathogenic genes based on multi-probability fusion is proposed. The other is regression analysis with filter function. By observing the data of network and probability model, summarizing the rule of data, adding biological hypothesis, the candidate gene is sorted by filtering function fusion regression analysis. The prediction model based on multi-probability fusion reflects the correlation law between phenotypic similarity and protein interaction on many levels by making comprehensive use of joint probability, center probability and shape probability. Compared with the traditional model based on single probability, the mathematical model can better reflect the real appearance of the biological system and has a stronger ability to predict disease genes. Another predictive model using filter function fusion regression analysis, based on reasonable biological assumptions, reflects the genetic association in disease phenotypic overlap, and can effectively rank many non-pathogenic genes at the back of the queue. The efficiency of the prediction method is improved effectively.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:R394

【相似文献】

相关期刊论文 前10条

1 龚瑶琴;陈丙玺;姜源;郑红;魏建军;邵常顺;郭亦寿;;假性肥大型肌营养不良症散发频率分析[J];中华医学遗传学杂志;1993年05期

2 ;十年后,你发胖的概率有多大[J];家庭护士;2006年05期

3 马继宏;医学统计学基本概念简介(续完) 临床研究中对概率的理解与应用[J];中国中医眼科杂志;1995年03期

4 王新春;标记关联资料的疾病风险计算—血色病风险个体的应用[J];国际遗传学杂志;1985年06期

5 张艳娥,孙建平,曹艳霞;临床诊断中的概率思想[J];数理医药学杂志;1999年02期

6 邱维勤;;单基因遗传病[J];实用医学杂志;1982年01期

7 张玮祥;于佳;高谦;;从海分枝杆菌菌落形态变化筛选与毒力相关基因的方法[J];复旦学报(医学版);2009年05期

8 曹惠兰;;不该生男孩的家庭[J];婚育与健康;1999年02期

9 张树忠,周庆文,梅长林;常染色体显性遗传型多囊肾病常用的基因诊断技术[J];中华肾脏病杂志;2000年04期

10 ;遗传性乳光牙本质致病基因的鉴定[J];中华医学信息导报;2002年02期

相关会议论文 前10条

1 伍淑瑜;梁美婵;;三水近52年暴雨频数的统计分析[A];第26届中国气象学会年会灾害天气事件的预警、预报及防灾减灾分会场论文集[C];2009年

2 齐琳;李慧;陈英和;;双奖励模型中儿童期望值判断的发展特点[A];第十一届全国心理学学术会议论文摘要集[C];2007年

3 岳治国;王利民;李晶;唐永顺;;德尔菲法在工业园区环境风险评价中的应用[A];2008中国环境科学学会学术年会优秀论文集(下卷)[C];2008年

4 陈小林;孔东民;王玉涛;;事务所规模、可操控应计额与股票的知情交易概率[A];中国会计学会2011学术年会论文集[C];2011年

5 董杏燕;曹艳艳;;宁波市雷暴、强对流天气潜势概率预报[A];第26届中国气象学会年会灾害天气事件的预警、预报及防灾减灾分会场论文集[C];2009年

6 顾晓琳;胡培亮;宋文涛;;多媒体DS-CDMA系统话音视频业务性能分析[A];2002海峡两岸三地无线科技研讨会论文集[C];2002年

7 刘德朋;孙启美;;一种变异概率的遗传算法[A];第六届中国青年运筹与管理学者大会论文集[C];2004年

8 赵希人;彭秀艳;尹中凤;;船舶横向运动姿态及受扰卡尔曼估计的鲁棒性能概率建模[A];第三届全国信息获取与处理学术会议论文集[C];2005年

9 连传杰;吴戈;;走向长壁开采时水平移动规律的新研究[A];水电与矿业工程中的岩石力学问题——中国北方岩石力学与工程应用学术会议文集[C];1991年

10 王琮;赵冬岩;罗超;;基于概率的锚泊撞击对海底管道埋深影响分析[A];2010年度海洋工程学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 刘 杰;中旬发动行情概率加大[N];证券日报;2003年

2 长江期货 高华;LLDPE继续走强概率大[N];中国证券报;2010年

3 证券时报记者 岩雪;CPI温和上扬 近期加息概率不大[N];证券时报;2010年

4 本报记者 林铭铭;近三月获利概率90% 市场为“锂”疯狂[N];21世纪经济报道;2010年

5 西部证券 张炜玲;近期市场蓄势整理概率较大[N];上海证券报;2009年

6 渤海证券 徐华;央行大幅降息概率增大[N];证券时报;2008年

7 记者 张忠安;市场短期回调概率加大[N];广州日报;2009年

8 宋薇萍;金价创新高的概率达60%[N];市场报;2008年

9 唐永梅 记者 张旗;从“概率瞄准”到“精确打分”[N];解放军报;2009年

10 刘静静 本报记者 刘传江;四舍五入 入比舍多一成概率[N];中国消费者报;2010年

相关博士学位论文 前10条

1 张伟强;法律制度的信息费用问题[D];山东大学;2010年

2 于忠义;人类早期不确定性推断思想研究[D];天津财经学院;2004年

3 胡艺;基于空间模型的小概率地理健康事件生态学研究[D];中国地质大学(北京);2012年

4 林鹏飞;遗传性痉挛性截瘫和Charcot-Marie-Tooth病家系的临床及致病基因分析[D];山东大学;2011年

5 弓树宏;电磁波在对流层中传输与散射若干问题研究[D];西安电子科技大学;2008年

6 邓慧琼;电网连锁故障预测分析方法及其应用研究[D];华北电力大学(北京);2007年

7 葛根;矩形薄板振动的随机分岔和可靠性研究[D];天津大学;2009年

8 周昀箐;家族性先天性心脏病的致病基因研究[D];复旦大学;2012年

9 唐立;Dirichlet问题的概率数值方法[D];中南大学;2003年

10 韩红臣;价格系统的非线性动力学研究与随机梯度回归分析[D];天津大学;2009年

相关硕士学位论文 前10条

1 王宗尧;基于蛋白质网络的人类遗传致病基因预测算法研究[D];哈尔滨工业大学;2010年

2 杨帆;共享网络中的实时任务可执行概率研究[D];国防科学技术大学;2011年

3 潘沁;卡尔纳普概率确证理论探讨[D];华中师范大学;2003年

4 束加庆;深埋隧洞工程区初始地应力场研究及围岩稳定分析[D];河海大学;2006年

5 张晓琴;江苏省高校毕业生就业焦虑预测因素分析[D];苏州大学;2005年

6 李丹;学习型文化对知识转移过程的影响研究[D];大连理工大学;2007年

7 马艳英;主成分趋势面方法在地质异常中的应用[D];吉林大学;2008年

8 颜丙香;基于因子分析的商业银行绩效比较研究[D];中国海洋大学;2007年

9 赖俊昆;江西省政府招商引资研究与对策分析[D];暨南大学;2008年

10 王开源;城市生活垃圾热值计算模型研究[D];华中科技大学;2007年



本文编号:2331934

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/2331934.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户488aa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com