基于多特征信息融合的癌症凝集素的鉴定方法研究
发布时间:2021-06-08 11:00
随着后基因时代的来临,越来越多的未知功能的蛋白质序列也在被迅速的被发现,预测蛋白质的功能是后基因时代的主要挑战之一。癌症凝集素是一种在肿瘤细胞分化和转移中发挥重要作用的蛋白质,准确鉴定出癌症凝集素有助于明确癌症治疗发展的方向。然而,传统的生物化学实验方法既费钱又耗时,现有的基于计算机的鉴定方法也不尽如人意。鉴定效果不够好的主要原因是输入分类模型的特征没能很好的表达出蛋白质的复杂性与序列多样性。因此,本文提出了一种将多特征信息相融合的特征表达算法来区分癌症和非癌症凝集素,主要内容如下:(1)基于多信息融合的两步特征提取算法。具体地,基于几种常用的单特征表达算法进行融合:包含序列信息的三肽组成(Tripeptide Composition,TipC)、包含序列信息和物理化学信息的联合三元组(conjointtriad)和包含功能信息的基因本体论(Gene Ontology,GO)注释。两部特征提取算法结合了序列信息与GO注释信息:首先使用将TipC和蛋白相互作用网络(PPI网络)融合的DeepGO算法得到GO注释,然后将所得GO注释转化为特征向量。实验结果表明,相对于单特征表达,该方法包含...
【文章来源】:云南大学云南省 211工程院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2.1癌症凝集素鉴定一般流程图??
2.4.2K近邻算法(KNN)??KNN是一种非参数算法,用于处理分类和回归问题。在分类中,KNN使用k个最近??邻居提供的信息来预测新实例的类。如图2.?2所示,红色圆点为测试样本;训练样共有??,?v?j测试样本??丨破??'、、、一:???????图2.2?K近邻分类器示意图??14??
数据集上分别使用BLAST和DeepGO进行对比实验,即第一步特征提取结果的比较;??其次,使用分别基于BLAST和DeepGO的GO注释特征的提取,即第二步特征提取结??果的比较。具体实验流程图如图3.1所示。??3.4.?1不同特征表达的性能对比??首先,我们针对上述两步特征提取模型中的第一步进行实验。表3.3展示了同为预??22??
【参考文献】:
期刊论文
[1]基于SVM的蛋白质亚细胞定位预测[J]. 刘清华,赖裕平,丁洪伟,杨志军,崔晓龙. 计算机工程与应用. 2019(11)
[2]蛋白亚细胞定位与肿瘤关系的研究进展[J]. 宋勇飞,张衍梅,方梦蝶,王孝举. 肿瘤. 2017(06)
博士论文
[1]高维生物数据的分类与预测研究[D]. 王彤.上海交通大学 2009
硕士论文
[1]分枝杆菌蛋白质亚细胞定位的预测研究[D]. 丁辰.电子科技大学 2013
本文编号:3218304
【文章来源】:云南大学云南省 211工程院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2.1癌症凝集素鉴定一般流程图??
2.4.2K近邻算法(KNN)??KNN是一种非参数算法,用于处理分类和回归问题。在分类中,KNN使用k个最近??邻居提供的信息来预测新实例的类。如图2.?2所示,红色圆点为测试样本;训练样共有??,?v?j测试样本??丨破??'、、、一:???????图2.2?K近邻分类器示意图??14??
数据集上分别使用BLAST和DeepGO进行对比实验,即第一步特征提取结果的比较;??其次,使用分别基于BLAST和DeepGO的GO注释特征的提取,即第二步特征提取结??果的比较。具体实验流程图如图3.1所示。??3.4.?1不同特征表达的性能对比??首先,我们针对上述两步特征提取模型中的第一步进行实验。表3.3展示了同为预??22??
【参考文献】:
期刊论文
[1]基于SVM的蛋白质亚细胞定位预测[J]. 刘清华,赖裕平,丁洪伟,杨志军,崔晓龙. 计算机工程与应用. 2019(11)
[2]蛋白亚细胞定位与肿瘤关系的研究进展[J]. 宋勇飞,张衍梅,方梦蝶,王孝举. 肿瘤. 2017(06)
博士论文
[1]高维生物数据的分类与预测研究[D]. 王彤.上海交通大学 2009
硕士论文
[1]分枝杆菌蛋白质亚细胞定位的预测研究[D]. 丁辰.电子科技大学 2013
本文编号:3218304
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3218304.html