基于蛋白质网络的人类遗传致病基因预测算法研究
[Abstract]:Gene prediction of human genetic diseases is a hot issue in bioinformatics. With the completion of genome sequencing and the development of new generation sequencing technology, the data of gene and protein interaction network are increasing. These data are used to analyze and predict the genetic basis and molecular basis of human disease, which is of great practical significance to genomics and medicine. In this paper, according to the relationship between clinical description of genetic diseases and protein interaction network, we obtain relevant data. Firstly, we mine the online database of human genetic diseases by vector space model. The overlapping relationship between phenotypes of genetic diseases was calculated, and then a series of biological networks were constructed by using protein interaction relation data to calculate interaction score and disease protein correlation data to construct a series of biological networks. The disease phenotypes and protein network data were analyzed and the candidate disease genes were ranked and sequenced based on these network data to predict disease genes. In this paper, two new genetic prediction methods for human genetic diseases based on network are proposed. First, based on the traditional two-dimensional correlation probability model, two new probabilistic models based on multidimensional random variables, the central probabilistic model and the shape probabilistic model, are proposed. A mathematical model for predicting pathogenic genes based on multi-probability fusion is proposed. The other is regression analysis with filter function. By observing the data of network and probability model, summarizing the rule of data, adding biological hypothesis, the candidate gene is sorted by filtering function fusion regression analysis. The prediction model based on multi-probability fusion reflects the correlation law between phenotypic similarity and protein interaction on many levels by making comprehensive use of joint probability, center probability and shape probability. Compared with the traditional model based on single probability, the mathematical model can better reflect the real appearance of the biological system and has a stronger ability to predict disease genes. Another predictive model using filter function fusion regression analysis, based on reasonable biological assumptions, reflects the genetic association in disease phenotypic overlap, and can effectively rank many non-pathogenic genes at the back of the queue. The efficiency of the prediction method is improved effectively.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:R394
【相似文献】
相关期刊论文 前10条
1 龚瑶琴;陈丙玺;姜源;郑红;魏建军;邵常顺;郭亦寿;;假性肥大型肌营养不良症散发频率分析[J];中华医学遗传学杂志;1993年05期
2 ;十年后,你发胖的概率有多大[J];家庭护士;2006年05期
3 马继宏;医学统计学基本概念简介(续完) 临床研究中对概率的理解与应用[J];中国中医眼科杂志;1995年03期
4 王新春;标记关联资料的疾病风险计算—血色病风险个体的应用[J];国际遗传学杂志;1985年06期
5 张艳娥,孙建平,曹艳霞;临床诊断中的概率思想[J];数理医药学杂志;1999年02期
6 邱维勤;;单基因遗传病[J];实用医学杂志;1982年01期
7 张玮祥;于佳;高谦;;从海分枝杆菌菌落形态变化筛选与毒力相关基因的方法[J];复旦学报(医学版);2009年05期
8 曹惠兰;;不该生男孩的家庭[J];婚育与健康;1999年02期
9 张树忠,周庆文,梅长林;常染色体显性遗传型多囊肾病常用的基因诊断技术[J];中华肾脏病杂志;2000年04期
10 ;遗传性乳光牙本质致病基因的鉴定[J];中华医学信息导报;2002年02期
相关会议论文 前10条
1 伍淑瑜;梁美婵;;三水近52年暴雨频数的统计分析[A];第26届中国气象学会年会灾害天气事件的预警、预报及防灾减灾分会场论文集[C];2009年
2 齐琳;李慧;陈英和;;双奖励模型中儿童期望值判断的发展特点[A];第十一届全国心理学学术会议论文摘要集[C];2007年
3 岳治国;王利民;李晶;唐永顺;;德尔菲法在工业园区环境风险评价中的应用[A];2008中国环境科学学会学术年会优秀论文集(下卷)[C];2008年
4 陈小林;孔东民;王玉涛;;事务所规模、可操控应计额与股票的知情交易概率[A];中国会计学会2011学术年会论文集[C];2011年
5 董杏燕;曹艳艳;;宁波市雷暴、强对流天气潜势概率预报[A];第26届中国气象学会年会灾害天气事件的预警、预报及防灾减灾分会场论文集[C];2009年
6 顾晓琳;胡培亮;宋文涛;;多媒体DS-CDMA系统话音视频业务性能分析[A];2002海峡两岸三地无线科技研讨会论文集[C];2002年
7 刘德朋;孙启美;;一种变异概率的遗传算法[A];第六届中国青年运筹与管理学者大会论文集[C];2004年
8 赵希人;彭秀艳;尹中凤;;船舶横向运动姿态及受扰卡尔曼估计的鲁棒性能概率建模[A];第三届全国信息获取与处理学术会议论文集[C];2005年
9 连传杰;吴戈;;走向长壁开采时水平移动规律的新研究[A];水电与矿业工程中的岩石力学问题——中国北方岩石力学与工程应用学术会议文集[C];1991年
10 王琮;赵冬岩;罗超;;基于概率的锚泊撞击对海底管道埋深影响分析[A];2010年度海洋工程学术会议论文集[C];2010年
相关重要报纸文章 前10条
1 刘 杰;中旬发动行情概率加大[N];证券日报;2003年
2 长江期货 高华;LLDPE继续走强概率大[N];中国证券报;2010年
3 证券时报记者 岩雪;CPI温和上扬 近期加息概率不大[N];证券时报;2010年
4 本报记者 林铭铭;近三月获利概率90% 市场为“锂”疯狂[N];21世纪经济报道;2010年
5 西部证券 张炜玲;近期市场蓄势整理概率较大[N];上海证券报;2009年
6 渤海证券 徐华;央行大幅降息概率增大[N];证券时报;2008年
7 记者 张忠安;市场短期回调概率加大[N];广州日报;2009年
8 宋薇萍;金价创新高的概率达60%[N];市场报;2008年
9 唐永梅 记者 张旗;从“概率瞄准”到“精确打分”[N];解放军报;2009年
10 刘静静 本报记者 刘传江;四舍五入 入比舍多一成概率[N];中国消费者报;2010年
相关博士学位论文 前10条
1 张伟强;法律制度的信息费用问题[D];山东大学;2010年
2 于忠义;人类早期不确定性推断思想研究[D];天津财经学院;2004年
3 胡艺;基于空间模型的小概率地理健康事件生态学研究[D];中国地质大学(北京);2012年
4 林鹏飞;遗传性痉挛性截瘫和Charcot-Marie-Tooth病家系的临床及致病基因分析[D];山东大学;2011年
5 弓树宏;电磁波在对流层中传输与散射若干问题研究[D];西安电子科技大学;2008年
6 邓慧琼;电网连锁故障预测分析方法及其应用研究[D];华北电力大学(北京);2007年
7 葛根;矩形薄板振动的随机分岔和可靠性研究[D];天津大学;2009年
8 周昀箐;家族性先天性心脏病的致病基因研究[D];复旦大学;2012年
9 唐立;Dirichlet问题的概率数值方法[D];中南大学;2003年
10 韩红臣;价格系统的非线性动力学研究与随机梯度回归分析[D];天津大学;2009年
相关硕士学位论文 前10条
1 王宗尧;基于蛋白质网络的人类遗传致病基因预测算法研究[D];哈尔滨工业大学;2010年
2 杨帆;共享网络中的实时任务可执行概率研究[D];国防科学技术大学;2011年
3 潘沁;卡尔纳普概率确证理论探讨[D];华中师范大学;2003年
4 束加庆;深埋隧洞工程区初始地应力场研究及围岩稳定分析[D];河海大学;2006年
5 张晓琴;江苏省高校毕业生就业焦虑预测因素分析[D];苏州大学;2005年
6 李丹;学习型文化对知识转移过程的影响研究[D];大连理工大学;2007年
7 马艳英;主成分趋势面方法在地质异常中的应用[D];吉林大学;2008年
8 颜丙香;基于因子分析的商业银行绩效比较研究[D];中国海洋大学;2007年
9 赖俊昆;江西省政府招商引资研究与对策分析[D];暨南大学;2008年
10 王开源;城市生活垃圾热值计算模型研究[D];华中科技大学;2007年
,本文编号:2331934
本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/2331934.html