基于后缀树的DNA序列进化树构建研究
发布时间:2021-12-18 06:38
生物序列比较是近年来迅速发展起来的一门学科,主要用来应对由分子生物学飞速发展所产生的巨大数据等问题。生物序列比较的常见方法有2种:序列的比对方法和序列的非比对方法。然而由于生物的全基因组序列比较长,比对方法计算量较大,我们利用序列的比对方法来直接分析序列间相似性在一些情况下是不可行的。序列的非比对方法不是具体的比较基对,而是将序列看成是一个整体并将其转化为数学对象,最终借助于数学工具对其进行分析比较。在本文中,我们使用序列的非比对方法来进行生物序列相似性的研究。后缀树模型是用来存储生物序列中每个位置处的后缀标识,它的提出为多方面的研究提供了高效率的保证。很多领域的国内外学者都从事过有关后缀树模型在实际应用方面的研究。后缀树模型在生物序列比较方面也有着重要的应用,例如Leimeister CA等人利用后缀树模型查找最长公共子串的位置来近似求取k个错配下最长公共子串的长度。本文基于后缀树模型提出了2种新的相异度量。第一种相异度量是基于每个后缀标识集在序列中对应的位置集。取两条生物序列后缀标识集的交集,对交集中所有后缀对应的位置集取并集,并求每条序列的并集中含有位置个数与序列长度的比值,最后...
【文章来源】:辽宁师范大学辽宁省
【文章页数】:40 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
引言
1 物种进化分析简介
1.1 研究背景与意义
1.2 非比对方法介绍
2 后缀树模型定义及建立
2.1 后缀树模型
2.2 后缀树算法
2.3 后缀树在生物信息方面的应用
3 本文的相异度量模型
3.1 相异度量1
3.2 相异度量2
3.3 在生物序列进化分析中的应用
3.3.1 数据集1 的进化分析
3.3.2 数据集2 的进化分析
3.3.3 数据集3 的进化分析
结论
参考文献
致谢
【参考文献】:
博士论文
[1]DNA序列比较的K-词非频率模型研究及应用[D]. 杨希武.大连理工大学 2013
[2]无参考基因组的比较基因组学研究[D]. 易会广.复旦大学 2013
[3]生物信息学中多序列比对等算法的研究[D]. 张敏.大连理工大学 2005
本文编号:3541837
【文章来源】:辽宁师范大学辽宁省
【文章页数】:40 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
引言
1 物种进化分析简介
1.1 研究背景与意义
1.2 非比对方法介绍
2 后缀树模型定义及建立
2.1 后缀树模型
2.2 后缀树算法
2.3 后缀树在生物信息方面的应用
3 本文的相异度量模型
3.1 相异度量1
3.2 相异度量2
3.3 在生物序列进化分析中的应用
3.3.1 数据集1 的进化分析
3.3.2 数据集2 的进化分析
3.3.3 数据集3 的进化分析
结论
参考文献
致谢
【参考文献】:
博士论文
[1]DNA序列比较的K-词非频率模型研究及应用[D]. 杨希武.大连理工大学 2013
[2]无参考基因组的比较基因组学研究[D]. 易会广.复旦大学 2013
[3]生物信息学中多序列比对等算法的研究[D]. 张敏.大连理工大学 2005
本文编号:3541837
本文链接:https://www.wllwen.com/yixuelunwen/swyx/3541837.html