当前位置:主页 > 医学论文 > 病理论文 >

蛋白质编码基因及遗传疾病相关基因的预测

发布时间:2019-04-17 14:39
【摘要】: 蛋白质编码基因结构及疾病相关基因预测对于发现新基因、了解基因组结构规律、寻找疾病基因具有重要作用,是各类基因组计划的重要内容。 对于蛋白质编码基因结构预测而言,准确识别剪接位点从而精确定位基因外显子的边界是其中的难点和关键问题之一。目前广泛使用的方法是基于剪接位点附近的保守序列这一信号特征建立预测模型,如权重阵列模型(WAM)。在此基础上进一步挖掘了可用于剪接位点识别的其它多个特征(包括剪接位点上、下游序列的碱基组成,剪接位点信号和上、下游序列的碱基组成随位点邻近序列C+G含量的变化等统计特征),建立了描述这些特征的模型,设计了能有效融合这些特征对剪接位点进行识别的对数线性模型,并开发了剪接位点识别程序SpliceKey。对比测试结果表明,SpliceKey识别剪接位点的精度不仅较WAM方法有显著的提高,而且也优于国际上最新发布的剪接位点识别软件DGSplice。 同时,为充分利用已有疾病研究成果及基因注释信息预测疾病基因,设计一种新的基于GO注释的功能相似度算法,该算法充分考虑了GO本身的结构特点,可以有效根据基因的GO注释评价基因与疾病表型的关联,因而取得较好的预测效果。在此基础上开发了人类遗传疾病基因预测系统DCGene。用1057种疾病对本方法分别在染色体区域与全基因组水平上进行测试。测试结果表明,在染色体区域与全基因组水平上本方法的预测性能优于国际同类方法与软件。DCGene不仅可以对多种已经定位但未确定致病基因的人类遗传疾病进行分析,而且在全基因组上的预测结果也可以为复杂疾病的连锁定位提供重要线索。
[Abstract]:......
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:R394

【参考文献】

相关期刊论文 前2条

1 ;Prediction of eukaryotic gene structures based on multilevel optimization[J];Chinese Science Bulletin;2004年04期

2 ;Predicting disease genes for familial dilated cardiomyopathy based on the codon usage bias[J];Chinese Science Bulletin;2005年18期



本文编号:2459533

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/binglixuelunwen/2459533.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户64aca***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com