DNA序列中串联重复体查找算法研究
本文选题:串联重复体 + LZ分解 ; 参考:《西安电子科技大学》2009年硕士论文
【摘要】:在DNA序列分析中,串联重复体查找是一个重要的基础性问题。人类DNA序列50%以上是由串联重复体组成的。串联重复体在基因表达、调控和遗传等方面起着十分重要的作用,同时它是产生多种疾病的病因。另外以串联重复体为基础的“DNA指纹技术”在法医学等领域广泛应用。因此关于串联重复的研究具有十分重要的意义。本文主要研究串联重复体查找算法。 1)针对精确串联重复体提出了一种基于LZ分解查找串联重复体的算法。对于存储在后缀树上的字符串S,该算法能在线性的时间找到所有出现在S中的串联重复体。为了进一步提高算法的效率,我们对后缀树进行了改进,给中间节点加入了叶子信息数组,这样就避免了算法对子树的遍历。 2)引入了一种新类型的近似串联重复体—进化串联重复体,由于以前提出的算法都不能解决进化串联重复体的查找问题,因此提出了基于海明距离的查找算法。对于给定的重复单元的长度l,该算法的时间复杂度为O(ln2),解决了进化串联重复体的查找问题。 为了说明算法的正确性和有效性,本文将这两种分别应用于实际的基因组DNA序列,结果表明基于LZ分解的查找串联重复体方法能找到更多的串联重复体,基于海明距离的查找方法则解决了进化串联重复体的查找问题。
[Abstract]:In DNA sequence analysis, tandem repeat finding is an important basic problem. More than 50% of human DNA sequences are composed of tandem repeats. Tandem repeats play an important role in gene expression, regulation and heredity. In addition, DNA fingerprinting based on tandem repeats is widely used in forensic science and other fields. Therefore, the study of tandem repetition is of great significance. In this paper, we mainly study the algorithm of tandem repeat lookup. 1) an algorithm based on LZ decomposition is proposed to find the exact tandem repeats. For the string S stored in the suffix tree, the algorithm can find all concatenated repeating bodies in S at linear time. In order to further improve the efficiency of the algorithm, we improve the suffix tree by adding a leaf information array to the middle node, thus avoiding the traversal of the algorithm to the subtree. 2) A new type of approximate tandem repeats, evolutionary tandem repeats, is introduced. Because the previous algorithms can not solve the problem of searching evolutionary tandem repeats, a search algorithm based on hamming distance is proposed. For a given length of repetition unit, the time complexity of this algorithm is Oan ln2n 2, which solves the problem of searching evolutionary tandem repeats. In order to illustrate the correctness and validity of the algorithm, this paper applies these two methods to the actual genomic DNA sequences. The results show that the LZ decomposition based tandem repeat finding method can find more tandem repeats. The search method based on hamming distance solves the problem of searching evolutionary tandem repeats.
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:R346
【相似文献】
相关期刊论文 前10条
1 张德彰;翟滇;;现场DNA生物检材的提取及注意事项[J];云南警官学院学报;2011年03期
2 梁小虎;唐焕文;刘林华;;环境毒物对聚腺苷二磷酸核糖聚合酶表达影响[J];中国职业医学;2011年03期
3 刘杰;陶健;;抗肿瘤药物的现状及发展趋势[J];科技致富向导;2011年23期
4 范晶;;聚丙烯酰胺凝胶中DNA银染色检测方法的改进及其效果比较[J];中国医药导报;2011年19期
5 孔敏敏;李艳华;董宇辉;王文雅;袁其朋;;大肠杆菌DNA复制相关蛋白PriC的初步研究[J];中医学报;2011年06期
6 安群星;李翠莹;陈蕤;陈晓鹏;穆士杰;;人类血小板抗原基因分型参考品的制备及鉴定[J];中国输血杂志;2011年05期
7 吴蓉;张隆;华玲;戴俊华;刘丽丽;康向东;;尿液中大肠埃希菌实时荧光定量聚合酶链反应检测方法的建立[J];检验医学;2011年06期
8 刘炜;张琼梅;;岩白菜素与DNA相互作用的光谱研究[J];海南师范大学学报(自然科学版);2011年02期
9 贾立永;郑磊;干宁;王前;;基于碳纳米管修饰的无酶型新型甲胎蛋白安培免疫传感器研究[J];热带医学杂志;2011年05期
10 高苏亚;范涛;杨莉宁;王黎;李华;;姜黄素-Fe~(2+)稳定常数的测定及其与鲑鱼精DNA的相互作用研究[J];分析试验室;2011年08期
相关会议论文 前10条
1 刘海英;陈刚;步宇翔;;碱基对的多铜修饰对DNA导电性的增强作用[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年
2 赵宏远;李俊杰;桑润滋;;单细胞凝胶电泳技术检测不同处理山羊精子DNA损伤[A];中国畜牧兽医学会动物繁殖学分会第十五届学术研讨会论文集(下册)[C];2010年
3 刘玲;付强;朱化彬;彭秀丽;郝海生;杜卫华;赵学明;王栋;;牛毛囊基因组DNA制备方法的比较研究[A];中国畜牧兽医学会动物繁殖学分会第十五届学术研讨会论文集(上册)[C];2010年
4 梁春柳;;一个新的筛选化合物与DNA交互作用的简便方法[A];2010年全国药物毒理学学术会议论文集[C];2010年
5 张文众;李永宁;方瑾;梁春来;张倩男;;体外新评价方法——完整细胞核DNA检测板[A];全国生化/工业与卫生毒理学学术会议论文集[C];2010年
6 邹丹丹;汪海林;;基于DNA甲基化结合蛋白MBD的甲基化分析[A];中国化学会第28届学术年会第2分会场摘要集[C];2012年
7 张晔;杜智;杨斌;高英堂;;检测外周血中游离DNA的应用前景(综述)[A];天津市生物医学工程学会第29届学术年会暨首届生物医学工程前沿科学研讨会论文集[C];2009年
8 赵淑珍;刘光珍;;DNA免疫吸附治疗狼疮性肾炎的临床观察[A];第十一届全国中西医结合肾脏病学术会议论文汇编[C];2010年
9 陈士林;;中药DNA条形码鉴定体系[A];第十届全国药用植物及植物药学术研讨会论文摘要集[C];2011年
10 陆佳飞;周克隆;王缦;;磁珠法快速提取乙型肝炎病毒DNA的研究及其在诊断试剂中的应用[A];第五次全国免疫诊断暨疫苗学术研讨会论文汇编[C];2011年
相关重要报纸文章 前10条
1 记者 李含;“DNA之父”詹姆斯·沃森做客清华论坛[N];新清华;2008年
2 ;英国:含冤入狱27年,DNA助他洗脱罪名[N];新华每日电讯;2009年
3 李志晖 秦亚洲 曹国厂;我国大规模利用DNA技术“打拐”[N];中国改革报;2009年
4 本报驻特拉维夫记者 陈克勤;DNA伪造带来的震动[N];光明日报;2009年
5 本报记者 张巍巍;DNA样本也能作假[N];科技日报;2009年
6 记者 郑晓春;可区分真伪DNA的检测技术问世[N];科技日报;2009年
7 沈建民;企业公民DNA从何而来[N];21世纪经济报道;2009年
8 记者 魏萍;做DNA鉴定不用去外地[N];宁夏日报;2010年
9 日报记者 曾繁华 闫友明 通讯员 刘晓颖;DNA:我的应用很广泛[N];柳州日报;2010年
10 韦崇结 刘晓颖;DNA,让作恶之徒现原形[N];广西政协报;2010年
相关博士学位论文 前10条
1 郭晓兰;端粒功能异常诱导的DNA损伤反应及其在肿瘤发生中的作用与分子机制[D];重庆医科大学;2010年
2 陈志健;1.8 GHz微波对X射线和阿霉素致淋巴细胞DNA损伤修复及对蛋白表达的影响[D];浙江大学;2010年
3 朱慧芳;Y家族DNA聚合酶对化学致癌物MNNG应答的转录调控研究[D];浙江大学;2009年
4 万超;抗猪瘟嵌合DNA疫苗及TRIF的DNA疫苗佐剂效应研究[D];武汉大学;2009年
5 孙晓南;融合多肽靶向DNA蛋白激酶自主磷酸化的放射增敏实验研究[D];浙江大学;2011年
6 赵丽霞;克隆绵羊印记相关基因的DNA甲基化研究[D];内蒙古农业大学;2010年
7 沈美龙;基于DNA免疫的乙型肝炎病毒表面抗原大中小蛋白的免疫原性研究[D];南京医科大学;2010年
8 徐铁刚;细菌DNA磷硫酰化修饰与限制[D];上海交通大学;2008年
9 高鹏;特异性介导DNA转导的多结构域嵌合蛋白的构建、表达及鉴定[D];吉林大学;2011年
10 康大伟;DNA分子器件场效应理论研究[D];山东大学;2010年
相关硕士学位论文 前10条
1 李芳;基于磁性微粒的法医样本DNA纯化[D];西北大学;2011年
2 黎君;1,2-二氯乙烷对人外周血淋巴细胞DNA损伤的人群调查和实验室研究及神经行为功能测试研究[D];浙江大学;2011年
3 芦丽淦;柚皮素及聚乙二醇增强乙肝DNA疫苗免疫效果的研究[D];河南大学;2010年
4 杨锦艳;六种香豆素有效成分与DNA相互作用的研究[D];山西医科大学;2010年
5 林启凰;用于乳腺蛋白标志基因检测的DNA电化学生物传感器的研究[D];福建医科大学;2010年
6 于文静;亚麻韧皮部特异启动子克隆与26份种质DNA指纹图谱构建[D];中国农业科学院;2010年
7 Rebecca Simisola Agboola;硼(B)和氯化钠胁迫处理诱导高粱(Sorghum bicolor)自交系发生形态和DNA甲基化的变异[D];东北师范大学;2010年
8 石微;溴氰菊酯致大鼠DNA损伤及损伤后修复功能的影响[D];青岛大学;2010年
9 张诺;DNA-纳米羟基磷灰石修饰电极的制备及在生物分析中的应用[D];济南大学;2010年
10 郭珈辰;基于图形表示的DNA相似性分析及进化树构建算法研究[D];湖南大学;2010年
,本文编号:1905426
本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/1905426.html