抗癌天然产物数据库的构建及其应用
本文关键词:抗癌天然产物数据库的构建及其应用,由笔耕文化传播整理发布。
【摘要】:分析化学和天然产物化学经过数十年的巨大发展,科研工作者已经成功地发现和提取了大量的具有抗癌活性的天然产物。尽管近年来国内外开发了大量癌症研究相关的数据库,然而却没有数据库系统性地收录这些抗癌天然产物信息及其生物活性信息。而且绝大多数抗癌天然产物的ADME(吸收、分布、代谢和排泄)性质和作用靶标没有被全面测定,造成其抗癌分子机制不明确,这阻碍了临床抗癌药物的研发。为解决这一问题,我们开发了一个基于系统药理学的抗癌草药数据库CancerHSP。通过文本挖掘方法,目前该数据库共收录了2439种抗癌草药、3575个抗癌活性化合物,并提供了每种化合物的分子结构和基于492种不同细胞系的抗癌活性数据。通过运用相关计算软件和先进的机器学习模型计算或预测了9种关键的药理学ADME相关参数,其中涉及相对分子质量、脂水分配系数的对数值、氢键受体的数量、氢键供体的数量、可旋转键数、拓扑极性表面积、口服生物利用度、Caco-2细胞渗透率以及血脑屏障通透性。运用目前先进的蛋白靶标预测模型对数据库内的所有化合物分子进行靶标预测,获得了平均每个化合物12个蛋白质靶标。再将该数据存入网站后台MySQL数据库并构建界面友好的搜索网站(http://lsp.nwsuaf.edu.cn/CancerHSP.php)以便用户免费搜索查阅。目前该数据库提供了搜索、浏览和下载所有数据三种途径供用户获取数据信息。通过分析数据库中的紫杉醇的相关数据进行药物来源发现及抗癌机理探究,发现数据库中所有含有紫杉醇的植物都属于松杉目植物,在今后探索含有紫杉醇的药用植物发现上,从松杉目植物中探索含有紫杉醇的药用原材料可能会有更高的成功可能性;紫杉醇可通过参与类固醇代谢、药物反应、微管蛋白聚合和解聚调节等相关生物学过程以及作用于生物合成、ABC转运体、药物代谢等通路,参与抑制癌细胞的过程或造成特定的副作用。基于CancerHSP数据库药物敏感性数据,本文构建了一个基于随机森林算法的预测A549细胞系敏感化合物的数学模型,该模型有着72%的预测准确率。通过该模型的预测,CancerHSP数据库中有大约7%的抗癌天然产物对A549细胞系具有高敏感性。以这些先导化合物研发新的抗肺癌药物,将会有更高的研发价值和成功几率。该数据库提供的抗癌天然产物及其ADME性质、抗癌活性和靶标信息不仅能为抗癌药物机理研究奠定基础,还能为抗癌药物的研发提供基础数据支持。
【关键词】:CancerHSP数据库 癌症 草药 天然产物 系统药理学
【学位授予单位】:西北农林科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R979.1
【目录】:
- 摘要6-7
- ABSTRACT7-11
- 第一章 文献综述11-17
- 1.1 前言11
- 1.2 癌症研究相关数据库11-16
- 1.2.1 癌症组学相关数据库11-12
- 1.2.2 癌症相关基因或标记物数据库12-13
- 1.2.3 抗癌成分数据库13-14
- 1.2.4 其他数据库14-16
- 1.3 本文研究意义和主要研究内容16-17
- 第二章 CancerHSP数据库的构建17-28
- 2.1 CancerHSP的设计原理17
- 2.2 开发流程17-22
- 2.2.1 数据收集18
- 2.2.2 化合物信息获取18-19
- 2.2.3 靶标预测19
- 2.2.4 药物ADME参数计算19-20
- 2.2.5 数据库存储结构设计20-22
- 2.2.6 数据库后台和网页的构建22
- 2.3 CancerHSP的使用22-24
- 2.3.1 搜索22-23
- 2.3.2 浏览23
- 2.3.3 下载和更新23-24
- 2.4 CancerHSP的数据统计24-26
- 2.4.1 化合物的ADME参数分布24-25
- 2.4.2 细胞系的组织分布25-26
- 2.4.3 CancerHSP的用户访问统计26
- 2.5 本章小结26-28
- 第三章 以紫杉醇为例分析天然产物药物开发及抗癌机制28-36
- 3.1 含有紫杉醇的植物28-29
- 3.2 紫杉醇ADME参数分析29-30
- 3.3 紫杉醇蛋白质靶标30-33
- 3.3.1 GO富集分析32
- 3.3.2 通路(Pathway)富集分析32-33
- 3.4 紫杉醇抗癌活性分析33-35
- 3.4.1 对癌细胞的敏感性分析33-34
- 3.4.2 紫杉醇敏感细胞的组织定位34-35
- 3.5 本章小结35-36
- 第四章 基于CancerHSP数据集预测药物对癌细胞系的敏感性36-42
- 4.1 实验材料36-37
- 4.1.1 实验数据集36
- 4.1.2 分子描述符计算36-37
- 4.2 实验方法和技术路线37-39
- 4.2.1 数据分割37
- 4.2.2 训练集和测试集构建37-38
- 4.2.3 随机森林建模算法(Random Forest)38
- 4.2.4 模型评价38-39
- 4.3 结果和讨论39-41
- 4.3.1 模型性能39-41
- 4.3.2 预测CancerHSP中化合物对A549细胞系的敏感度41
- 4.4 本章小结41-42
- 第五章 结论与展望42-44
- 参考文献44-50
- 附录50-61
- 致谢61-63
- 作者简介63-64
【相似文献】
中国期刊全文数据库 前9条
1 江涛,刘金民,王玉来,尹岭,唐大fE;建立中西结合脑病数据库的探索[J];中医药学刊;2005年02期
2 陈阳生;使用数据库对学术论文统计需注意问题的探讨[J];医学信息;2003年12期
3 ;解放军医学图书馆数据库研究与开发部数据库产品2005年度订单[J];河南预防医学杂志;2005年01期
4 张亮,王大猷;处方数据库在药物应用研究中的作用[J];中国药物应用与监测;2005年02期
5 颜世刚,刘春延,李丹亚,胡铁军;CMCC数据库的特点及用途[J];医学情报工作;1995年02期
6 管进;1990~2001年有关MEDLINE数据库研究的文献分析[J];广东医学院学报;2002年01期
7 刘茜,刘敬苍,刘婷婷,万玲;CBMdisc与CMCC数据库的比较[J];实用医药杂志;2003年09期
8 周永;王伊龙;吴敌;赵性泉;王拥军;;卒中患者院前转运与延误现况调查——一项来自中国七城市卒中事件急诊登记数据库研究(CARDs)[J];中国全科医学;2009年02期
9 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 刘连芳;李陶深;;前言[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 范明;乐嘉锦;;前言[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 范明;乐嘉锦;;前言[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
4 刘连芳;李陶深;;前言[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
5 ;前言[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年
6 周继红;邱俊;姚远;李国灵;王正国;;创伤数据库研究[A];第七届全国创伤学术会议暨2009海峡两岸创伤医学论坛论文汇编[C];2009年
7 ;前言[A];第十六届全国数据库学术会议论文集[C];1999年
8 万常选;李战怀;;前言[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
9 万常选;李战怀;;前言[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 胡学钢;王志海;王漫;;数据库中异常事例的分析[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
中国重要报纸全文数据库 前5条
1 张s,
本文编号:308583
本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/308583.html