基于多尺度CNN和BiLSTM的植物ncRNA相互作用预测研究
发布时间:2024-01-31 03:24
非编码RNA之间相互调控机制在很多动植物生命活动中发挥着重要作用,如细胞生长、分化和增殖。目前,在动物和人类疾病方面,miRNA与lncRNA互作关系的研究相对较多,它为动物和人类疾病的诊治提供新的解决方案,而在植物方面的研究相对较少,因此,植物miRNA与lncRNA互作关系的研究既能深入分析基因间生物学功能,又可为植物遗传育种提供新思路。传统方法有生物鉴定和特征工程方法,但生物鉴定代价高、周期长,且不能大批量同时鉴定;特征工程则涉及过多人工干预且提取过程繁杂。因此,利用深度学习方法预测植物非编码RNA有无互作关系具有巨大优势。本文提出一种引入注意力机制的多尺度CNN和BiLSTM的植物非编码RNA互作关系预测模型(MCMPLA),其利用多尺度CNN和多池化操作丰富特征多样性,并借助BiLSTM解决信息长期依赖缺失问题,同时引入注意力机制来获取关键特征实现高效准确预测互作关系的目的。首先,在负集上进行聚类欠采样处理以保证正负集均衡;为保存相邻核苷酸之间的依赖联系,对序列进行k-mers编码;然后,利用多尺度卷积核和多池化操作的CNN代替单尺度情况,以此提取不同长度的主题特征,从而丰富...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文研究内容及结构
2 ncRNA相互作用预测相关技术
2.1 相互作用预测中的深度学习技术
2.1.1 MSCGRU预测模型
2.1.2 HOCNN网络架构
2.2 miRNA-lncRNA相互作用预测工具与方法
2.2.1 RNAHybrid预测工具
2.2.2 CBiLSTM分类模型
2.2.3 CIRNN分类模型
2.3 本章小结
3 基于特征工程的miRNA-lncRNA相互作用预测模型
3.1 数据集预处理
3.1.1 数据集来源
3.1.2 数据集构建及预处理
3.2 基于特征工程的预测模型构建
3.2.1 特征提取
3.2.2 特征选择算法
3.2.3 机器学习算法
3.3 实验结果和分析
3.3.1 交叉验证
3.3.2 性能评价指标
3.3.3 基于不同特征选择方法的分类性能
3.3.4 基于不同机器学习方法的分类性能
3.5 本章小结
4 多尺度CNN-BiLSTM的相互作用预测模型
4.1 数据集处理及编码
4.1.1 数据集预处理
4.1.2 编码方式
4.2 基于注意力机制的多尺度CNN-BiLSTM集成模型
4.2.1 嵌入阶段
4.2.2 多尺度卷积池化阶段
4.2.3 BiLSTM阶段
4.2.4 注意力机制阶段
4.2.5 MCMPLA模型架构
4.3 不同架构下的深度学习模型
4.3.1 不同架构下的多尺度CNN
4.3.2 多尺度CNN与 BiLSTM的集成模型
4.3.3 多尺度CNN与 Attention的集成模型
4.4 实验结果和分析
4.4.1 不同k-mers编码方式的性能比较
4.4.2 不同编码方式的性能比较
4.4.3 多卷积和多池化对模型的改善效果
4.4.4 BiLSTM和 Attention对模型的改善效果
4.4.5 MCMPLA与特征工程及现有方法的比较
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
本文编号:3890873
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文研究内容及结构
2 ncRNA相互作用预测相关技术
2.1 相互作用预测中的深度学习技术
2.1.1 MSCGRU预测模型
2.1.2 HOCNN网络架构
2.2 miRNA-lncRNA相互作用预测工具与方法
2.2.1 RNAHybrid预测工具
2.2.2 CBiLSTM分类模型
2.2.3 CIRNN分类模型
2.3 本章小结
3 基于特征工程的miRNA-lncRNA相互作用预测模型
3.1 数据集预处理
3.1.1 数据集来源
3.1.2 数据集构建及预处理
3.2 基于特征工程的预测模型构建
3.2.1 特征提取
3.2.2 特征选择算法
3.2.3 机器学习算法
3.3 实验结果和分析
3.3.1 交叉验证
3.3.2 性能评价指标
3.3.3 基于不同特征选择方法的分类性能
3.3.4 基于不同机器学习方法的分类性能
3.5 本章小结
4 多尺度CNN-BiLSTM的相互作用预测模型
4.1 数据集处理及编码
4.1.1 数据集预处理
4.1.2 编码方式
4.2 基于注意力机制的多尺度CNN-BiLSTM集成模型
4.2.1 嵌入阶段
4.2.2 多尺度卷积池化阶段
4.2.3 BiLSTM阶段
4.2.4 注意力机制阶段
4.2.5 MCMPLA模型架构
4.3 不同架构下的深度学习模型
4.3.1 不同架构下的多尺度CNN
4.3.2 多尺度CNN与 BiLSTM的集成模型
4.3.3 多尺度CNN与 Attention的集成模型
4.4 实验结果和分析
4.4.1 不同k-mers编码方式的性能比较
4.4.2 不同编码方式的性能比较
4.4.3 多卷积和多池化对模型的改善效果
4.4.4 BiLSTM和 Attention对模型的改善效果
4.4.5 MCMPLA与特征工程及现有方法的比较
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
本文编号:3890873
本文链接:https://www.wllwen.com/projectlw/swxlw/3890873.html
教材专著