当前位置:主页 > 理工论文 > 生物学论文 >

基于序列的蛋白质金属离子和自由基离子位点预测问题研究

发布时间:2020-07-02 11:26
【摘要】:在人类基因组计划完成后,以研究蛋白质间相互作用与识别为核心的蛋白质组学(Proteomics)迅速兴起。其中蛋白质-配体对接方法是研究蛋白质之间相互作用与识别的主要内容之一,它可以对研究细胞中蛋白质序列-结构-功能的关系提供重要的理论参考价值,对蛋白质交互作用的研究、蛋白质复合物预测以及计算机辅助药物设计具有重要意义。目前使用基于蛋白质序列的方法来预测蛋白质-蛋白质和蛋白质-配体离子结合位点已经有了较为完善的方法。特别是随着蛋白质结构预测精度的不断提高,研究人员可以获得更高精度的蛋白质三维空间结构。进而可以构建精确的蛋白质结合位点预测模型。特征提取与选择是特征成功表示的重要一步,也是后续构建有效模型的关键组成部分。为了更有效的表达蛋白质序列信息,本文从特征提取和特征选择两方面对蛋白质金属离子和自由基离子信息表示的方法进行研究。本文通过提取蛋白质序列的PSSM打分矩阵、二级结构、氨基酸组成、CKSAAP结构信息、溶剂可及表面积、正负电荷等14种特征,然后通过串联方式将所有特征合并在一起得到一个高维、稀疏的矩阵来表达蛋白质序列的特征信息。接着本文提出一个加权特征选择方法(Weighted Feature Selection,WFS)对特征进行选择,并通过特征选取方法删去冗余和不相关的特征来进一步降维,减少算法运行时间。由于本文处理的数据集样本数量差别很大,为最大限度的提高特征选择的质量,最后本文分别使用卡方检验特征选择、sfm特征选择、随机森林特征选择、WFS特征选择四种方法对不同的数据集使用动态的选择策略。实验证明该策略有比较好的效果。在提取特征后,为了构建更为有效的预测模型,本文提出了一个基于Tscore得分和分类器不一致度量得分的多分类器动态选择集成模型。该模型分类两个阶段,单分类器排序和多分类器动态选择集成。在第一个阶段中首先使用分类器池中的单分类器分别对训练集进行训练,每个分类器得到一个Tscore得分,然后依据此得分对所有的分类器进行降序排列。在第二个阶段中依次在集成分类器池中选择单分类器,如果当前的集成分类器Tscore得分大于上一步的得分并且分类器不一致性度量指标大于某个阈值,则继续添加分类器,否则停止集成。最后将本文提出的方法应用到蛋白质金属离子和自由基离子结合位点预测的问题中,通过在公开数据集上进行实验,得到了较好的预测效果;然后与经典预测算法进行对比,验证了本文方法的有效性。
【学位授予单位】:东北师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q51

【相似文献】

相关期刊论文 前10条

1 李敏;李华;程茂华;;一种自适应子融合集成多分类器方法[J];计算机测量与控制;2019年04期

2 黎平;刘萍;张巡;范郁锋;;基于分类器的身份证号码识别研究[J];贵州科学;2018年01期

3 王忠民;王科;贺炎;;一种基于多分类器融合的人体运动行为识别模型[J];计算机科学;2016年12期

4 邹洪侠;陶硕;;一种代价敏感的三类分类器评估方法的研究与应用[J];通化师范学院学报;2017年08期

5 牛明昂;王强;崔希民;赵康年;柴鹏辉;;多分类器融合与单分类器影像分类比较研究[J];矿山测量;2016年04期

6 赵艺淞;王保云;黎晓路;王婷;;基于多分类器组合的城市不透水面提取研究[J];城市地理;2017年04期

7 何舒炜;;《垃圾分类器》[J];辅导员;2016年11期

8 李健苹;游中胜;;一种新的多分类器融合方法[J];西南师范大学学报(自然科学版);2014年01期

9 兰远东;曾树洪;;动态加权投票的多分类器聚合[J];现代计算机(专业版);2014年05期

10 林煜明;朱涛;王晓玲;周傲英;;面向用户观点分析的多分类器集成和优化技术[J];计算机学报;2013年08期

相关会议论文 前10条

1 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年

2 刘希玉;徐志敏;段会川;;基于支持向量机的创新分类器[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年

3 翟静;李海宏;唐常杰;陈敏敏;李智;;可验证对象集分类器的再训练演进[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

4 冯军;李夕海;祁树锋;;基于差异性度量的多分类器融合及其在核爆地震识别中的应用[A];国家安全地球物理丛书(七)——地球物理与核探测[C];2011年

5 夏俊士;杜培军;张伟;;遥感影像多分类器集成系统的设计与实现[A];中国测绘学会2010年学术年会论文集[C];2010年

6 于丽丽;丁德鑫;曲维光;陈小荷;石民;;基于多分类器集成的古代汉语词义消歧[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

7 陈继航;刘家锋;赵巍;唐降龙;;联机手写识别笔段特征分类器的学习方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年

8 胡茂福;侯整风;;一种高效流分类加速器的设计与实现[A];第四届中国智能计算大会论文集[C];2010年

9 彭涛;左万利;赫枫龄;;基于链接上下文的分类器主题爬行技术(英文)[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

10 权维俊;叶彩华;赵新平;郭文利;唐广;;专家分类器在京白梨农业气候区划中的应用[A];中国气象学会2007年年会生态气象业务建设与农业气象灾害预警分会场论文集[C];2007年

相关重要报纸文章 前5条

1 记者 邱凌;电子积木搭出“垃圾分类器”[N];扬州日报;2019年

2 黄明;精子分类器决定生男生女[N];广东科技报;2000年

3 南方日报记者 曹斯 徐林 实习生 谭钦允 张艳玲 通讯员 江澜;miRNA分类器:提早一年“揪出”肝癌[N];南方日报;2015年

4 记者 姜靖;能“社交”的机器人助理问世[N];科技日报;2016年

5 记者 姜晓凌 见习记者 王毅俊;原来,科技也能如此美丽[N];上海科技报;2007年

相关博士学位论文 前10条

1 孙宸;PolSAR图像大间隔学习分类器设计及应用[D];西安电子科技大学;2017年

2 于爱华;基于压缩感知人脸识别技术的研究[D];浙江工业大学;2017年

3 雷浩川;多分类器集成的遥感影像分类研究[D];中国地质大学(北京);2018年

4 冯晓东;基于软概率的分类器动态集成方法研究[D];重庆大学;2018年

5 陈木生;基于欠采样和不平衡集成分类的垃圾网页检测研究[D];南昌大学;2018年

6 陈海霞;面向数据挖掘的分类器集成研究[D];吉林大学;2006年

7 王卫东;高维小样本数据的特征提取及分类器算法研究[D];南京理工大学;2007年

8 刘杰;乘员类型的自动识别及其在智能乘员约束系统中的应用[D];吉林大学;2007年

9 吴尉林;可移植的稳健口语理解方法研究[D];上海交通大学;2007年

10 章军;小生境粒子群优化算法及其在多分类器集成中的应用研究[D];中国科学技术大学;2007年

相关硕士学位论文 前10条

1 王谦;行人检测的研究与实现[D];西南科技大学;2019年

2 孙怡;类标签驱动的多阶段贝叶斯网络学习框架[D];吉林大学;2019年

3 陆瑶;基于差异性度量的选择性集成方法[D];河南理工大学;2018年

4 李蓉;基于SVM矿井环境无线多模信号的检测识别[D];西安科技大学;2019年

5 孙帅;广播频段频谱信号处理的机器学习算法研究[D];武汉理工大学;2018年

6 张中岩;基于集成分类器的微傅情感分类研究[D];厦门大学;2017年

7 吴倩;基于视频分析的奶牛关键部位提取及跛行检测研究[D];西北农林科技大学;2019年

8 张婕;基于级联多分类器融合的宫颈癌细胞识别技术的研究[D];哈尔滨理工大学;2019年

9 戴伟聪;基于多分类器融合的长期目标跟踪算法研究[D];中国科学院大学(中国科学院长春光学精密机械与物理研究所);2019年

10 严佳;稳定的最近邻分类器及其统计性质[D];中国科学技术大学;2019年



本文编号:2738141

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2738141.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户27fd6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com