当前位置:主页 > 理工论文 > 生物学论文 >

基于深度迁移学习的赖氨酸乙酰化位点预测问题的研究

发布时间:2020-05-09 04:21
【摘要】:蛋白质翻译后修饰是计算生物领域最重要的问题之一,通过将碳、氧、氮原子上引入乙酰基CH3CO-,以及功能基团添加到一个及以上的氨基酸上改变蛋白质的性质的反应被称为乙酰化。乙酰化一直以来,是最重要的翻译后修饰之一,在许多生物机制中发挥重要作用,例如转录调节机制,细胞凋亡以及细胞的因子信号传导。研究某个氨基酸残基是否会发生乙酰化反应,以及对乙酰化机制的探索和学习对理解细胞的遗传信息表达、生物机理的调控有重要意义。用于鉴定蛋白质乙酰化位点的现有方法可以分为两大类:质谱法和计算方法。基于质谱的实验方法可以发现来自真核生物的乙酰化位点,但是可能耗时且昂贵。因此,有必要开发能够有效且准确地鉴定蛋白质乙酰化位点的计算方法。现有的计算方法通常依赖特征工程,数据收集、特征提取的好坏严重影响乙酰化位点判断的准确,多余的特征和不相关的特征将分别导致冗余和判断失误。基于这些问题,本文使用深度学习框架帮助乙酰化位点预测,它能够通过多层网络和非线性映射操作从大规模训练数据集挖掘潜在特征。在这项研究中,本文提出了双模型深度学习架构帮助乙酰化位点的预测。首先从蛋白质赖氨酸修饰数据库(PLMD)中收集数据,包括泛物种乙酰化数据以及三个物种的乙酰化数据,并划分为训练集、验证集和独立测试集。再从数据中提取两类特征,一是蛋白质序列信息,二是理化属性。针对两类特征,先训练了两个不同的网络,再将两个网络融合增加预测位点的准确性,并使用贝叶斯方法进行调参优化。为了预测数据集规模较小的物种特异性数据,利用迁移学习,将网络迁移到特定物种数据集上进行乙酰化位点预测,也取得了好的效果。实验结果显示了本文网络的有效性,准确率为70.8%,敏感性为72.3%,特异性为70.7%,MCC值为0.251。在物种特异性数据上也取得了比其他工具好的表现,说明本网络可以适用于乙酰化位点预测。
【图文】:

基于深度迁移学习的赖氨酸乙酰化位点预测问题的研究


蛋白质乙酰化修饰过程

基于深度迁移学习的赖氨酸乙酰化位点预测问题的研究


One-hotKey编码示意图
【学位授予单位】:东北师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q811.4;TP18

【相似文献】

相关期刊论文 前10条

1 郑弦;;数据集采器在临床护理工作中的应用价值探讨[J];基层医学论坛;2017年12期

2 Long-xiang WANG;Xiao-she DONG;Xing-jun ZHANG;Yin-feng WANG;Tao JU;Guo-fu FENG;;TextGen:用于新型存储系统基准测试的真实文本数据集生成方法(英文)[J];Frontiers of Information Technology & Electronic Engineering;2016年10期

3 刘娟;朱翔鸥;刘文斌;;基于交互信息的数据集特征结构研究[J];模式识别与人工智能;2014年01期

4 沈雯漪;;大型数据集数据挖掘算法研究[J];计算机光盘软件与应用;2014年16期

5 职为梅;郭华平;范明;叶阳东;;非平衡数据集分类方法探讨[J];计算机科学;2012年S1期

6 吴克寿;曾志强;;非平衡数据集分类研究[J];计算机技术与发展;2011年09期

7 付优;;非平衡数据集的分类[J];电力学报;2010年04期

8 张缨;周红俊;李建军;刘根林;郑樱;郝春霞;王一吉;康海琼;卫波;;国际脊髓损伤数据集之核心数据集[J];中国康复理论与实践;2009年09期

9 高嘉伟;梁吉业;;非平衡数据集分类问题研究进展[J];计算机科学;2008年04期

10 苗卿;单立新;裘昱;;信息熵在数据集分割中的应用研究[J];电脑知识与技术(学术交流);2007年05期

相关会议论文 前10条

1 缪国宇;刘洪鹏;苏文学;刘荣生;赵相东;;基于数据仓库的企业指标分析系统[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年

2 王子恒;齐勇刚;刘军;;路面交通标志检测调研:数据集及算法[A];2018中国汽车工程学会年会论文集[C];2018年

3 郭景峰;杜京;马倩;邹晓红;;一种基于数据集性质的快速等差模式聚类算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

4 孟烨;张鹏;宋大为;王雷;;信息检索系统性能对数据集特性的依赖性分析[A];需将论文集名称修改为“第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集[C];2013年

5 田捷;;三维医学影像数据集处理的集成化平台[A];2003年全国医学影像技术学术会议论文汇编[C];2003年

6 冷传良;;飞机化铣成样板划线数据集设计方法探索[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年

7 范明;魏芳;;挖掘基本显露模式用于分类[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

8 刘通;张宇献;;基于加权平均数的模糊聚类有效性函数[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年

9 林荔;林铖;;福建省小时风速数据集研制及应用[A];第35届中国气象学会年会 S20 深度信息化:应用支持与智能发展[C];2018年

10 于爱荣;刘晓明;曹雷;王俊;;NET Web Services数据集在Delphi中的处理与研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年

相关重要报纸文章 前10条

1 记者 张梦然;最大规模婴儿微生物组数据集建立[N];科技日报;2018年

2 记者 张梦然;癌症学研究公布最新数据集[N];科技日报;2018年

3 记者 王莉英;行政审批网上全流程办理率年底超80%[N];深圳特区报;2017年

4 记者 金昶 通讯员 陈斯音;我国发布首款全球海洋Argo网格数据集产品[N];中国海洋报;2017年

5 中国青年报·中青在线记者 谢宛霏;为AI领域“造血”[N];中国青年报;2017年

6 记者 罗旭;全球人工智能挑战赛开赛[N];光明日报;2017年

7 记者 刘钊 通讯员 徐文慧 杨溯;自主研发数据集显示今年上半年最热[N];中国气象报;2015年

8 冉瑞奎 刘晓林 戴艳萍;均一化历史气温数据集问世[N];中国气象报;2006年

9 通讯员廖雅琴记者冯竞;“国人数字化可视人体数据集”完成[N];科技日报;2003年

10 记者 张梦然;科学家以图片数据集揭秘“生命奥秘”[N];科技日报;2015年

相关博士学位论文 前10条

1 陈迪;耕地数量与质量时空变化遥感监测研究[D];中国农业科学院;2019年

2 孙秀宝;基于CMA-LSAT v1.0数据集的近百年全球陆表气温变化研究[D];南京信息工程大学;2018年

3 刘皓;基于深度学习的行人再识别问题研究[D];合肥工业大学;2017年

4 王建培;聚类有效性分析及其在电学层析成像中的应用[D];天津大学;2017年

5 杨勋;跨视域行人再识别若干问题研究[D];合肥工业大学;2017年

6 纳赛尔 阿里 穆罕默德 巴拉卡特;复杂化学数据的知识发现新型化学计量学算法研究[D];湖南大学;2005年

7 李宏;面向应用领域的分类方法研究[D];中南大学;2007年

8 余雳;虚拟可视鼠样品制备技术研究[D];华中科技大学;2006年

9 李超;高阶多数据集建模新方法与应用研究[D];哈尔滨工程大学;2017年

10 申彦;大规模数据集高效数据挖掘算法研究[D];江苏大学;2013年

相关硕士学位论文 前10条

1 杨壮;面向Bin Picking的虚拟数据集构建及智能识别方法的研究[D];华东理工大学;2019年

2 连志康;面向动态数据集的隐性知识外显案例属性约简研究[D];郑州大学;2019年

3 翁飘;复杂环境下路面裂缝分割算法研究[D];郑州大学;2019年

4 赵越;自然场景下行人再识别技术研究及实现[D];北京邮电大学;2019年

5 刘子微;深度学习模型及数据集托管平台设计与实现[D];北京邮电大学;2019年

6 潘国峰;基于生成对抗网络的语义分割方法研究[D];南昌航空大学;2019年

7 魏红霞;拉曼激光雷达多参数数据集的构建与应用研究[D];西安理工大学;2019年

8 孙元元;基于改进的CURE聚类的原型选择算法及其应用研究[D];西安理工大学;2019年

9 韦玉梅;基于无人车辅助系统的交通标志检测与识别研究[D];上海师范大学;2019年

10 张晓峰;深度对抗式数据增强技术在小规模数据集上的应用研究[D];中国科学技术大学;2019年



本文编号:2655587

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2655587.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户78e7c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com