筛选必要基因预测的训练集及细菌致病菌药物靶点的识别
本文关键词:筛选必要基因预测的训练集及细菌致病菌药物靶点的识别
【摘要】:近些年,随着生物信息学、基因组学、统计学等领域的快速发展,以及各种数据库内容的积累,为研究必要基因以及利用必要基因研究致病菌的潜在药物靶点提供了有利的数据资源基础。必要基因是指对维持生物生存和发育至关重要的基因,如果敲除了这个基因,便会导致物种的死亡。对必要基因的研究具有重大的意义,能够为理论和实践提供重要的信息。对必要基因的研究一直以来都是生物学科及相关学科的重要研究对象。通过已知或已被证实的必要基因可以预测未研究物种中的必要基因,而预测结果的精确性受到了多种因素的影响,包括训练集的筛选。为了提高预测必要基因的预测精确性,本研究对预测必要基因的训练集筛选方面进行了相关研究。大多数传染病是由细菌致病菌造成的,而细菌致病菌引发的传染病造成的死亡率也在增长,从而导致对新的药物靶点的需求也越来越多,所以识别分析细菌致病菌的潜在药物靶点非常必要。因此,本研究使用生物信息学方法识别了九种人类的细菌致病菌的潜在药物靶点。本论文将从以下两个部分展开研究和探讨。第一部分:利用贝叶斯分类器对所研究的21个物种的必要基因进行了相互预测和验证,以此研究训练集的筛选对于预测必要基因的影响。结果显示出训练集筛选很大程度上影响了预测的准确性。我们由此确定了四个筛选训练集的标准:(1)训练集中的必要基因来源要可靠;(2)训练集和预测集中的物种的生长条件应该相一致;(3)用作训练集的物种要与靶物种的亲缘关系近。(4)作为训练集和预测集的物种要有相似或相近的表型或生活方式。然后又分析了不完备的训练集和整合的训练集分别对预测精度的影响。我们发现训练集的大小至少要占到全基因组的10%才能得到准确的预测结果。另外,整合的训练集比单一的训练集在预测的稳定性和准确性上明显更好。最后,比较了符合四个标准的整合训练集与随机选择的整合训练集的预测效果。发现按照我们的筛选标准得到的训练集比随机选择的训练集的实验结果有了很大改善。所以,我们的结果为预测全基因组的必要基因提供了训练集筛选方面的一些经验指导。第二部分:利用人类和9种人类的细菌致病菌的必要基因及同源基因,通过将其进行比较分析,识别出了这9种细菌致病菌共有的4个潜在的广谱性的药物靶点,并找到了其相应的小分子抑制剂。在筛选药物靶点的过程中,我们根据前人在药物靶点识别分析方面的相关研究,提出了3个用于识别广谱性的药物靶点的标准:(1)应该是所研究的致病菌共有的同源基因;(2)应该是必要基因,即对所研究的致病菌的生存都必要的基因;(3)人类中不存在同源基因,避免对人体造成细胞毒副作用。我们的结果能够为药物的设计提供一些有用的信息。
【关键词】:必要基因 训练集 药物靶点
【学位授予单位】:西北农林科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:Q811.4;R378
【目录】:
- 摘要5-7
- ABSTRACT7-11
- 第一章 文献综述11-18
- 1.1 必要基因预测的研究现状11-12
- 1.2 药物靶点的研究现状12-16
- 1.3 研究内容及意义16-18
- 第二章 预测必要基因的训练集筛选18-34
- 2.1 材料与方法18-20
- 2.1.1 获取必要基因以及其他相关的数据18
- 2.1.2 收集相关特征18-20
- 2.1.3 确定蛋白质是否具有同源关系的BLAST标准20
- 2.2 结果与分析20-32
- 2.2.1 不同的训练集预测相同的预测集的精确性有差异20-21
- 2.2.2 训练集中的必要基因来源应可靠21-22
- 2.2.3 训练集和预测集中的物种的生长条件应相同22-23
- 2.2.4 训练集和预测集中的物种之间的进化距离应近23-25
- 2.2.5 训练集与预测集中的物种的表型和生活方式应相同25-26
- 2.2.6 训练集的大小应占到全基因组的 10%26-29
- 2.2.7 整合多个物种的训练集比单一物种的训练集的预测效果更佳29-31
- 2.2.8 按照标准的整合训练集比随机的整合训练集的预测效果更优31-32
- 2.3 结论与讨论32-34
- 第三章 利用必要基因识别致病菌的潜在的药物靶点34-40
- 3.1 材料与方法34-36
- 3.1.1 选取九种细菌致病菌34-35
- 3.1.2 必要基因以及基因序列的获取35
- 3.1.3 获得致病菌和人类的同源基因35-36
- 3.1.4 本研究的流程图36
- 3.2 结果及分析36-38
- 3.2.1 比较得到非人类的同源基因36-37
- 3.2.2 比较得到非人类的同源必要基因37-38
- 3.2.3 寻找致病菌的广谱药物靶点的小分子抑制剂38
- 3.3 结论与讨论38-40
- 第四章 总结与展望40-41
- 参考文献41-46
- 致谢46-47
- 作者简介47
【相似文献】
中国期刊全文数据库 前2条
1 王春丽;张世强;;利用支持向量机预测G蛋白偶联受体中潜在的药物靶点[J];生物物理学报;2013年06期
2 ;[J];;年期
中国重要会议论文全文数据库 前7条
1 王学健;;一场关于药物靶点的纷争[A];新观点新学说学术沙龙文集23:新药发现——寻找维护人类健康的武器[C];2008年
2 杜冠华;;药物靶点的发现和确证研究[A];中国科协第二十三届新观点新学说学术沙龙论文集[C];2008年
3 杜冠华;;药物靶点研究现状[A];新观点新学说学术沙龙文集23:新药发现——寻找维护人类健康的武器[C];2008年
4 周文霞;;组合药物靶点研究[A];新观点新学说学术沙龙文集23:新药发现——寻找维护人类健康的武器[C];2008年
5 杜冠华;;抗AD药物靶点和药物发现研究进展[A];2009全国抗衰老与老年痴呆学术会议论文汇编[C];2009年
6 陈一岳;;药物靶点与新药开发——看制药工业药理的发展未来[A];中国药理学会第九届制药工业药理学术会议论文摘要汇编[C];2000年
7 刘扬中;;蛋白质内含子—结核杆菌的新药物靶点及其抑制作用[A];中华医学会结核病学分会2010年学术年会论文汇编[C];2010年
中国重要报纸全文数据库 前10条
1 本报记者 闫松;药物靶点研究和新药研发亟待创新[N];大众科技报;2008年
2 木易;有多少药物靶点值得期待?[N];中国医药报;2007年
3 本报记者 洪天语;一个靶点成就一个产业[N];医药经济报;2006年
4 毛宇;美合成出普适性埃博拉药物靶点[N];科技日报;2014年
5 曹颖新;专家研讨药学发展前沿问题[N];学习时报;2008年
6 刘伯宁;基因组学研究推进新药研发[N];中国医药报;2011年
7 中科院上海生命科学院神经所 李帅;镇痛之痛[N];文汇报;2011年
8 本报记者 白毅;医园药苑竞争春(上)[N];中国医药报;2011年
9 马艳红;探索AD分子机制 全面开展“靶点”研究[N];中国医药报;2003年
10 本报记者 陈铮;新药研发困境催生新的研发特性[N];中国医药报;2011年
中国硕士学位论文全文数据库 前4条
1 赵丽;筛选必要基因预测的训练集及细菌致病菌药物靶点的识别[D];西北农林科技大学;2015年
2 韩绪军;HCV核酸检测方法建立及药物靶点变异分析[D];昆明理工大学;2009年
3 王春丽;利用SVM挖掘GPCR中潜在的药物靶点[D];重庆医科大学;2013年
4 陈廷威;基于公共数据库的药物靶点相互作用网络研究[D];山东大学;2012年
,本文编号:891373
本文链接:https://www.wllwen.com/yixuelunwen/binglixuelunwen/891373.html