当前位置:主页 > 管理论文 > 管理理论论文 >

草鱼基因组信息管理系统及其关键技术研究

发布时间:2020-04-02 22:37
【摘要】:随着草鱼全基因组序列图谱的完成,进一步探索草鱼身上具有经济价值的分子机制引起了研究人员的广泛关注。而研究这样的分子机制往往又需要从全基因组范围内展开。建立一个基因组信息管理系统来管理存储这些异构的数据,并且在系统中针对性的对数据进行可视化,来使科研工作者更加方便直观的浏览、获取并研究这些数据是研究全基因组数据的基础。异构数据带来了数据管理及存储上的问题。为此本文系统整理了需要存储管理的草鱼基因组注释数据,分析了草鱼基因组数据注释信息之间的相互关系和目前国际通用的几种基因数据文件组织方式,设计了一个基于GFF3格式的基因组数据注释模型来管理异构数据。可通过数据模型里存储的各种属性实现对数据库的简单和高级检索。此外,本文创建了若干数据格式转换脚本,自动地将各种格式的基因组数据文件转换为GFF3格式来实现异构数据的统一管理。随着测序数据的持续增长,为了减少存储空间的消耗,以及便于DNA序列数据的传输,本文还针对DNA数据的压缩算法进行了相关研究,分析了目前DNA压缩算法研究现状及存在的瓶颈,结合草鱼DNA数据的特点,在设计的压缩算法里引入了草鱼序列的生物信息学特征,相比传统算法达到了更好的压缩效果,有效的降低了数据存储及传输的成本。在课题研究过程中,本文开发了一个管理存储草鱼基因组数据的信息管理系统,设计并实现了基于JBrowse的基因注释数据集成接口,使用开源JBrowse模块作为可视化组件用于可视化相关注释数据。针对无法用JBrowse可视化的部分数据,本文在系统中使用了SVG图形格式来实现这些数据的可视化。通过可视化数据以及加强与其他生物数据库的关联,并配以丰富的检索功能以进一步提高研究人员的数据挖掘的效率。本信息管理系统能够有效实现数据之间的比较和共享,针对性的可视化方案能更好的从海量数据中挖掘更有意义的数据,这对推动生物基因学发展提供了有效的途径。设计的DNA压缩算法BioGenCompress应用在草鱼DNA数据上达到了良好的压缩效果,节省了存储空间,降低了传输成本。本文中的相关方法对其他基因组数据平台的建设能够提供一定的参考价值。
【图文】:

基因结构,草鱼,单核苷酸


图 2-1 草鱼基因结构图Fig.2-1 Gene structure of grass carp)基因组变异核生物个体基因组之间差异通常很小具有独特性。只有少数变异会对生影响,甚至致病。大部分变异对个体几乎没影响。基因组变异一般性单核苷酸变异、短插入缺失、拷贝数变异以及结构变异。单核苷酸碱基水平上某个核苷酸发生突变所导致的 DNA 序列的多态性[36],且单多数变异属于单核苷酸变异。图 2-2 给出了基因组变异的常见类型。对的研究能大大促进全基因组疾病关联研究。

变异类型,基因组,单核苷酸


所以说,,这些特异性结构在基因表达的过程起到潜移默化的作用。图 2-1 草鱼基因结构图Fig.2-1 Gene structure of grass carp(2)基因组变异真核生物个体基因组之间差异通常很小具有独特性。只有少数变异会对生产生影响,甚至致病。大部分变异对个体几乎没影响。基因组变异一般可态性单核苷酸变异、短插入缺失、拷贝数变异以及结构变异。单核苷酸多指碱基水平上某个核苷酸发生突变所导致的 DNA 序列的多态性[36],且单个大多数变异属于单核苷酸变异。图 2-2 给出了基因组变异的常见类型。对基异的研究能大大促进全基因组疾病关联研究。
【学位授予单位】:上海海洋大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP315;S917.4

【相似文献】

相关期刊论文 前10条

1 杨亮,宁瑛惠;基因组信息学简介[J];生物学教学;2000年09期

2 陈志宏,严壮志;人工神经网络在基因组信息学中的应用[J];国外医学.生物医学工程分册;2002年04期

3 吴诗光;基因组信息学[J];生物学通报;2001年09期

4 周宝森,何钦成;生物信息学在后基因组时代的发展与展望[J];医学情报工作;2001年06期

5 吴诗光,任雪平;基因组信息学[J];周口师范高等专科学校学报;2001年02期

6 李晓哲,李霞,郭政;基因组信息学及有关的分子生物学数据库[J];数理医药学杂志;1999年04期

7 李敏;Y染色体特异DNA序列及应用[J];生物工程进展;1989年06期

8 齐国隆;张超;孔令人;;基因组信息在医院信息系统中表达方式的探讨[J];暨南大学学报(自然科学版);2007年01期

9 齐国隆;张超;孔令人;;基因组信息在医院信息系统中的表达方式[J];医疗设备信息;2007年09期

10 郝鲁江,梁泉峰;生物信息学的发展及其应用[J];山东轻工业学院学报(自然科学版);2000年02期

相关会议论文 前7条

1 王萌;夏光敏;施卫明;;利用全基因组信息挖掘小麦营养逆境响应的重要基因[A];第七届长三角植物科学研讨会暨青年学术报告会摘要集[C];2018年

2 王萌;施卫明;夏光敏;刘树伟;;利用全基因组信息挖掘小麦特异耐盐重要基因[A];第十届全国小麦基因组学及分子育种大会摘要集[C];2019年

3 施阳;燕亚莉;王维;齐晓花;徐强;陈学好;;基于全基因组重测序的黄瓜抗白粉病基因探究[A];第七届长三角园艺论坛论文集[C];2016年

4 郑思;李姣;;基因组数据挖掘在肿瘤研究中的应用[A];中华医学会第二十一次全国医学信息学术会议论文汇编[C];2015年

5 刘祥瑞;田英杰;;精准营养于疾病预防和干预的重要性[A];中国营养学会第十次特殊营养学术会议论文集[C];2017年

6 吴栋杨;孙啸;;构建基于R语言的生物信息学研究平台[A];第十次中国生物物理学术大会论文摘要集[C];2006年

7 王师;吕佳;窦锦壮;刘平平;张玲玲;包振民;;扇贝基因组学研究关键技术方法的建立及应用[A];2016年中国水产学会学术年会论文摘要集[C];2016年

相关重要报纸文章 前10条

1 赵学明;未来可“量体裁衣”构造微生物[N];科学时报;2011年

2 实习生 刘雨亭;基因组序列太深奥?用这套工具能读懂[N];科技日报;2018年

3 张乐 徐嫣嫣;我着手培养首批基因组信息学专业人才[N];光明日报;2001年

4 ;世界级基因组信息学中心在我国崛起[N];光明日报;2001年

5 毛裕民;健康产业发展新趋势[N];人民政协报;2009年

6 记者 李晶晶;海南将建精准医疗五大区域检验中心[N];海口日报;2016年

7 Wang Johson译;重量级药物研究道路荆棘[N];中国高新技术产业导报;2002年

8 记者 尹鸿祝;利用科技场馆 普及科技知识[N];中国教育报;2001年

9 清华大学医学院 田埂;2亿美元“精确医疗计划”卖的是啥药?[N];北京科技报;2015年

10 本报记者 陈怡;“精准医学”过热需要冷思考[N];上海科技报;2015年

相关博士学位论文 前1条

1 王安慧;基因组信息的计算机可视化若干关键技术研究[D];东北大学;2010年

相关硕士学位论文 前7条

1 唐敏;草鱼基因组信息管理系统及其关键技术研究[D];上海海洋大学;2019年

2 徐聪;结直肠癌中应用基因组信息分析探究ZFHX4的作用机制[D];大连医科大学;2016年

3 徐海东;红球菌PD630全基因组代谢网络重构的研究[D];中国石油大学(北京);2016年

4 李红梅;基于基因组信息的大黄鱼(Pseudosciaena crocea)微卫星标记开发及应用[D];浙江海洋学院;2014年

5 葛元弘;个人基因组信息管理及可视化技术研究[D];哈尔滨工业大学;2011年

6 计博婧;代谢网络社团结构研究[D];南京邮电大学;2012年

7 苏海林;全基因组选择简化模拟方法研究和贝类育种网络评估分析系统的开发[D];山东农业大学;2010年



本文编号:2612531

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/glzh/2612531.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户18553***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com