基于机器学习方法预测环形RNA编码蛋白的潜能
发布时间:2023-08-08 18:39
环形RNA是一类广泛存在于真核细胞中的内源性RNA分子,没有5’末端帽子和3’末端polyA尾巴,以共价键连接形成封闭环状结构.一直以来,环形RNA被认为是一类不能翻译的非编码RNA.然而近年来有研究报道,环形RNA能够编码蛋白质从而调控重要的生命活动,引起了研究者们的注意.运用机器学习的方法,基于环形RNA的序列与结构特征,使用XGBoost、随机森林和支持向量机组合而成的综合分类模型,预测环形RNA编码蛋白的潜能,平均预测准确率达到86.66%,为实验研究人员提供可靠的参考,有助于发现更多可编码蛋白的环形RNA.
【文章页数】:9 页
【文章目录】:
1 环形RNA序列与结构特征的计算
1.1 ORF的计算
1.2 IRES的预测
1.3 序列保守性的计算
1.4 m6A修饰的预测
1.5 其他特征的计算
2 预测模型的构建
2.1 数据来源
2.2 特征筛选
3 模型性能的评估
3.1 逻辑回归模型的性能评估
3.2 支持向量机模型的性能评估
3.3 随机森林模型的性能评估
3.4 XGBoost模型的性能评估
3.5 小结与讨论
4 结语
本文编号:3840276
【文章页数】:9 页
【文章目录】:
1 环形RNA序列与结构特征的计算
1.1 ORF的计算
1.2 IRES的预测
1.3 序列保守性的计算
1.4 m6A修饰的预测
1.5 其他特征的计算
2 预测模型的构建
2.1 数据来源
2.2 特征筛选
3 模型性能的评估
3.1 逻辑回归模型的性能评估
3.2 支持向量机模型的性能评估
3.3 随机森林模型的性能评估
3.4 XGBoost模型的性能评估
3.5 小结与讨论
4 结语
本文编号:3840276
本文链接:https://www.wllwen.com/projectlw/swxlw/3840276.html
教材专著