基于深度学习网络的剪接位点及蛋白质相互作用预测方法研究
发布时间:2021-10-29 08:00
生物学中心法则包括DNA转录、RNA翻译和蛋白质表达。选择性剪接是转录后期的关键步骤,剪接过程的正确执行很大程度在于剪接位点的正确识别,它使得一种编码蛋白质的基因可以产生多种转录变体。因此,错误的剪接位点经常会导致各种疾病的发生。选择性剪接通过产生不同的剪接变体翻译成不同特定生物功能的蛋白产物,而蛋白质的变异或者某些蛋白质发生异常相互作用也同样会导致疾病甚至癌症的发生。鉴于剪接位点及蛋白质相互作用预测在生物领域的重要性,本论文着重基于深度学习技术来研究剪接位点和蛋白质相互作用这两个问题的预测方法,主要内容包括:1.剪接位点及剪接模式的探索对于理解基因转录过程非常重要。现有的计算方法在剪接位点预测问题上取得了较大成功,但是不可避免存在特征提取、模型可解释性差等缺点,由此本文提出基于深度卷积神经网络来预测剪接位点,该网络主要由剪接位点预测模块和揭示剪接位点序列模式的模型解释模块组成。和传统机器学习方法相比,剪接位点预测模块在六个不同公共供体/受体剪接位点数据源上取得了更精确的分类性能。此外,为了解释深度学习的识别过程,模型解释模块对卷积特征进行了可视化,展现了特征映射从底层到高层的抽象过程...
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
图3.1DeepSS模型的框架图
图3.2?12个数据集上的不同深度框架的10折交叉验证结果??Figure?3.2?The?performance?of?different?depth?architectures?with?10-flod?cross?validation?on??12?datasets??表3.2?DeepSS-C在平衡受体/供体数据集上的实验结果??Table?3.2?Performance?of?DeepSS-C?with?balanced?acceptor/donor?datasets??HS-D?CE?NN269??Measure?Acceptor?Donor?Acceptor?Donor?Acceptor?Donor??AUC-ROC?98.50±0.42?98.89±0.41?99.32±0.49?99.19±0.54?98.98±0.51?98.47±0.65??AUC-PR?98.22土0?70?98.79±0.52?99?27±0.63?99?I5±0.72?98.87±0?66?98?20±0.96??表3.3?DeepSS-C在非平衡受体/供体数据集上的实验结*??Table?3.3?Perfonnance?of?DeepSS-C?with?imbalanced?acceptor/donor?datasets??HS-D?CE?NN269??Measure??Acceptor?Donor?Acceptor?Donor?Acceptor?Donor??
?100??AUC?PR??图3.6各数据集上的不同长度序列对剪接位点预测的AUC-PR值的影响(1代表原始??序列的长度)??Figure?3.6?The?effect?o
【参考文献】:
期刊论文
[1]面向微博短文本分类的文本向量化方法比较研究[J]. 李心蕾,王昊,刘小敏,邓三鸿. 数据分析与知识发现. 2018(08)
[2]基于卷积神经网络模型的互联网短文本情感分类[J]. 刘小明,张英,郑秋生. 计算机与现代化. 2017(04)
[3]基于特征融合的选择性剪切外显子预测[J]. 袁芳,范金坪. 计算机与数字工程. 2014(11)
硕士论文
[1]基于机器学习方法的可变剪接位点预测研究[D]. 郭倩含.云南大学 2015
[2]真核基因剪接位点识别算法研究[D]. 吕俊杰.哈尔滨工程大学 2010
本文编号:3464281
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
图3.1DeepSS模型的框架图
图3.2?12个数据集上的不同深度框架的10折交叉验证结果??Figure?3.2?The?performance?of?different?depth?architectures?with?10-flod?cross?validation?on??12?datasets??表3.2?DeepSS-C在平衡受体/供体数据集上的实验结果??Table?3.2?Performance?of?DeepSS-C?with?balanced?acceptor/donor?datasets??HS-D?CE?NN269??Measure?Acceptor?Donor?Acceptor?Donor?Acceptor?Donor??AUC-ROC?98.50±0.42?98.89±0.41?99.32±0.49?99.19±0.54?98.98±0.51?98.47±0.65??AUC-PR?98.22土0?70?98.79±0.52?99?27±0.63?99?I5±0.72?98.87±0?66?98?20±0.96??表3.3?DeepSS-C在非平衡受体/供体数据集上的实验结*??Table?3.3?Perfonnance?of?DeepSS-C?with?imbalanced?acceptor/donor?datasets??HS-D?CE?NN269??Measure??Acceptor?Donor?Acceptor?Donor?Acceptor?Donor??
?100??AUC?PR??图3.6各数据集上的不同长度序列对剪接位点预测的AUC-PR值的影响(1代表原始??序列的长度)??Figure?3.6?The?effect?o
【参考文献】:
期刊论文
[1]面向微博短文本分类的文本向量化方法比较研究[J]. 李心蕾,王昊,刘小敏,邓三鸿. 数据分析与知识发现. 2018(08)
[2]基于卷积神经网络模型的互联网短文本情感分类[J]. 刘小明,张英,郑秋生. 计算机与现代化. 2017(04)
[3]基于特征融合的选择性剪切外显子预测[J]. 袁芳,范金坪. 计算机与数字工程. 2014(11)
硕士论文
[1]基于机器学习方法的可变剪接位点预测研究[D]. 郭倩含.云南大学 2015
[2]真核基因剪接位点识别算法研究[D]. 吕俊杰.哈尔滨工程大学 2010
本文编号:3464281
本文链接:https://www.wllwen.com/projectlw/swxlw/3464281.html