当前位置:主页 > 理工论文 > 生物学论文 >

外显子预测方法研究与实现

发布时间:2020-07-24 03:17
【摘要】:大数据时代来临,生物学相关数据随之大量涌现,数据的激增促进了生物信息学的迅速发展。基因研究是生物信息学重要的一部分,外显子预测在基因研究领域有着重要作用。例如,在蛋白质形成过程中外显子先转录成mRNA,然后mRNA翻译成蛋白质;基因的保守区域通常与外显子有关,因此外显子也能用来分析生物之间的演化关系和构建演化树;在近几年,全外显子测序技术迅速发展,该技术能有效找到致病突变,因此准确预测外显子意义重大。然而基因中外显子含量低,并与内含子交替连接,外显子特征不明显,预测外显子成为了生物信息学中的重难点。目前,外显子的预测方法可分为2种,一种是基于序列比对的外显子预测方法,另一种是基于统计分析的外显子预测方法。本文针对两种方法分别进行了研究,并提出了基于BLAST双序列比对的外显子预测算法与基于特征统计的外显子预测方法,本论文的主要研究工作概括如下。(1)根据BLAST的双序列比较算法,提出了基于BLAST算法的外显子预测算法。BLAST是一种启发式算法,在对两个序列进行比较时会产生过多的局部最优比对片段,并且预测结果的边界也是模糊的。本文提出的改进算法是对DNA序列与mRNA序列多次进行序列比对,每一次比对后,根据比对结果对DNA序列进行优化,逐步缩小比对范围。再根据外显子特征对最终比对结果的边界进行分割,分割结果即为预测的外显子序列。(2)根据统计得到的外显子特征,提出了改进的基于特征统计外显子预测算法。在特征统计阶段,下载了来自NCBI网站GenBank数据库中的100条人类基因和基因对应的1224条外显子信息,从中提取了11个基因和外显子的特征。在算法设计阶段,对基因进行重复序列分析,将基因中的非重复序列片段分割出来,根据统计阶段得到的特征,逐步确定外显子在非重复序列中的位置,输出预测外显子。
【学位授予单位】:淮北师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP311.13;Q811.4
【图文】:

外显子预测方法研究与实现


本文组织与结构

动态规划,决策过程,求解过程


动态规划决策过程

算法流程


BLAST算法流程

【相似文献】

相关期刊论文 前10条

1 王进科;冯萍;康继昌;陈亚东;;基于布尔逻辑的双序列比对协处理器的设计与实现[J];西北工业大学学报;2011年01期

2 张永;王瑞;;生物信息学中的序列比对算法[J];电脑知识与技术;2008年01期

3 张涛涛;郭茂祖;邹权;;参数序列比对算法研究(英文)[J];生物信息学;2008年02期

4 唐玉荣;生物信息学中一个优化的全局双序列比对算法[J];计算机应用;2004年S1期

5 张敏;生物序列比对算法研究现状与展望[J];大连大学学报;2004年04期

6 单路超;王建章;许德森;李东垣;赵鹏;王国相;褚腾飞;;基于局部序列比对的漏洞挖掘技术研究[J];微型机与应用;2017年03期

7 杨洁;刘海;;生物序列比对算法的研究现状[J];中国科技信息;2011年09期

8 叶笑春;林伟;范东睿;张浩;;蛋白质序列比对算法在众核结构上的并行优化[J];软件学报;2010年12期

9 骆嘉伟;陈斐;彭东海;;基于混合行为的蚁群双序列比对方法[J];计算机工程与应用;2009年11期

10 吴德敏;陈俊;;双序列比对的算法研究[J];计算机工程与应用;2008年36期

相关会议论文 前8条

1 王盛;吴长刚;孙慰迟;;带约束星形序列比对复杂性的研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年

2 方慧生;陈凯先;;一个有效解决远距离同源蛋白质结构预测及序列比对的有效方法[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

3 许龙飞;段敏;陈孝卫;冉丽;朱婵;;生物DNA序列比对算法研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

4 陈婷婷;郭婷婷;李林;安冬;;基于生物信息学的功能蛋白基因序列分类研究[A];2011年全国通信安全学术会议论文集[C];2011年

5 颜朗;曹庆华;张义正;王海燕;;基于转录组的甘薯转座元件搜寻及转座酶基因表达分析[A];中国遗传学会第九次全国会员代表大会暨学术研讨会论文摘要汇编(2009-2013)[C];2013年

6 尹荣岭;陈巨莲;刘勇;程登发;孙京瑞;Claude Bragard;Frederic FRANCIS;;CMV蚜传相关蛋白CP基因的克隆与变异分析[A];植保科技创新与病虫防控专业化——中国植物保护学会2011年学术年会论文集[C];2011年

7 叶t@;张静淑;李岭;;脊椎动物脑容量相关基因的进化分析[A];中国的遗传学研究——遗传学进步推动中国西部经济与社会发展——2011年中国遗传学会大会论文摘要汇编[C];2011年

8 赵培宝;任爱芝;李多川;;轮枝镰孢两蛋白激酶基因的克隆及功能研究[A];中国植物病理学会2009年学术年会论文集[C];2009年

相关博士学位论文 前10条

1 程昊宇;面向大规模测序数据集的序列比对算法研究[D];中国科学技术大学;2019年

2 朱香元;大规模生物序列比对算法及其并行化研究[D];湖南大学;2014年

3 唐玉荣;生物信息学中的序列比对算法研究[D];中国农业大学;2004年

4 李玉岗;生物大分子序列比对和蛋白质结构分类算法[D];中国科学院研究生院(计算技术研究所);2004年

5 陈科;最优化方法在生物序列比对中的应用与研究[D];电子科技大学;2010年

6 向旭宇;基因序列与结构的信息分析及应用算法研究[D];湖南大学;2010年

7 马爽;多功能雷达电子情报信号处理关键技术研究[D];国防科学技术大学;2013年

8 刘广臣;若干统计计算模型研究及其在生物医学信息处理中的应用[D];山东大学;2016年

9 李想;多重序列比对上的RNA相互作用问题[D];南开大学;2013年

10 曹永忠;新城疫病毒生物信息分析系统的构建及其全基因组的比较研究[D];扬州大学;2009年

相关硕士学位论文 前10条

1 宋思怡;面向三代测序的序列比对算法研究与优化[D];中国科学技术大学;2019年

2 刘顺;基于网络协议逆向的序列比对算法研究[D];兰州大学;2019年

3 肖枫;外显子预测方法研究与实现[D];淮北师范大学;2019年

4 吴泓邵;基于Xeon Phi的超长序列比对算法设计与实现[D];山东大学;2019年

5 张彩华;模糊隐马氏模型及其在生物序列比对中的应用[D];山东大学;2018年

6 黄丹青;基于混合化学反应优化算法的序列比对研究[D];湖南大学;2014年

7 张吉凯;基于英特尔多核及众核平台的全局序列比对算法研究[D];山东大学;2018年

8 郭睿东;基于变长种子的找全测序序列比对算法研究及优化[D];中国科学技术大学;2018年

9 宁维迪;基于正余弦策略的粒子群算法的研究及应用[D];湖南大学;2018年

10 司雨佳;一个基于GPU的快速序列比对软件的设计与实现[D];华中科技大学;2017年



本文编号:2768238

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2768238.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户27e5c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com