基于特征整合及KNN-SVM的老鼠肿瘤致病基因预测
发布时间:2021-04-25 04:26
利用已知的生物学数据去发现致病基因是理解疾病机理、研制治疗药物、确定医疗方案的关键,尤其是通过一些相互作用网络来呈现疾病与基因的关系,为致病基因的预测提供了强有力的理论支撑。由于目前致病基因的预测多是仅仅通过网络的拓扑特征,并没有系统的挖掘致病基因的特征,所以本文把网络特征、GO(gene ontology)特征和进化保守性特征结起来预测老鼠肿瘤的致病基因。本文首先分别从老鼠肿瘤相关的microRNA和未知的老鼠microRNA表达量着手,对数据进行t-test和false discovery rate(FDR)校验等处理,计算其相关性,比较 Pearson,Spearman,Kendall,Covariance along a Generating Curve 和 Correlation along a Generating Curve(CorGc/CovGc),最大信息系数(MaximalInformationCoefficient,MIC),互信息(MutualInformation,MI)六种相关性的效果,并构建网络,分析网络特征(度、介数、聚类系数等),然后挖掘出GO特性和进...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.1.1 肿瘤致病基因的生物学研究
1.1.2 肿瘤生物信息学数据库
1.2 研究意义
1.3 论文的组织结构
第二章 老鼠肿瘤致病基因数据整合与预处理
2.1 致病基因预测问题的描述
2.2 老鼠肿瘤致病基因和未知的老鼠基因的特征数据
2.2.1 老鼠相关基因数据收集
2.2.2 老鼠相关基因数据预处理
2.3 老鼠肿瘤致病基因和未知的老鼠基因相关性计算
2.4 数据处理结果与分析
2.5 本章小结
第三章 老鼠肿瘤基因特征的挖掘
3.1 老鼠基因网络特征的挖掘
3.1.1 网络结构参数的计算
3.1.2 老鼠肿瘤致病基因与未知老鼠基因结构参数实验比较
3.2 老鼠基因GO特征的提取
3.3 老鼠基因进化保守性特征的挖掘
3.4 实验结果与分析
3.5 本章小结
第四章 基于机器学习算法的老鼠肿瘤致病基因的预测
4.1 基于KNN和SVM算法的老鼠肿瘤致病基因预测
4.1.1 基于SVM算法的老鼠肿瘤致病基因的预测
4.1.2 SVM核函数的选择
4.1.3 基于KNN算法的老鼠肿瘤致病基因预测算法
4.2 基于KNN-SVM算法的老鼠肿瘤致病基因预测
4.2.1 KNN-SVM的传统算法
4.2.2 改进的KNN-SVM算法模型
4.3 实验结果和实例分析
4.3.1 实验数据
4.3.2 十折交叉验证法
4.3.3 对比实验结果分析
4.3.4 ROC曲线分析方法结果
4.3.5 方法评价
4.4 本章小结
第五章 总结
5.1 总结
5.2 进一步工作
参考文献
攻读硕士学位期间的科研成果
致谢
【参考文献】:
期刊论文
[1]信息披露质量与股权资本成本关系研究[J]. 周慧琴,朱亚娜. 北京邮电大学学报(社会科学版). 2016(01)
[2]统计相关性分析方法研究进展[J]. 樊嵘,孟大志,徐大舜. 数学建模及其应用. 2014(01)
[3]生物基因组非蛋白质编码转录组学及研究进展[J]. 姜宁,陈启军. 中国基础科学. 2009(06)
硕士论文
[1]基于模块归一化及自适应跳转随机游走的疾病基因预测[D]. 袁杰.华中师范大学 2016
[2]一种Renyi熵的正交小波变换盲均衡算法及DSP仿真[D]. 张树艳.安徽理工大学 2011
[3]基于改进互信息的医学图像配准方法研究[D]. 刘青芳.山西大学 2010
本文编号:3158699
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.1.1 肿瘤致病基因的生物学研究
1.1.2 肿瘤生物信息学数据库
1.2 研究意义
1.3 论文的组织结构
第二章 老鼠肿瘤致病基因数据整合与预处理
2.1 致病基因预测问题的描述
2.2 老鼠肿瘤致病基因和未知的老鼠基因的特征数据
2.2.1 老鼠相关基因数据收集
2.2.2 老鼠相关基因数据预处理
2.3 老鼠肿瘤致病基因和未知的老鼠基因相关性计算
2.4 数据处理结果与分析
2.5 本章小结
第三章 老鼠肿瘤基因特征的挖掘
3.1 老鼠基因网络特征的挖掘
3.1.1 网络结构参数的计算
3.1.2 老鼠肿瘤致病基因与未知老鼠基因结构参数实验比较
3.2 老鼠基因GO特征的提取
3.3 老鼠基因进化保守性特征的挖掘
3.4 实验结果与分析
3.5 本章小结
第四章 基于机器学习算法的老鼠肿瘤致病基因的预测
4.1 基于KNN和SVM算法的老鼠肿瘤致病基因预测
4.1.1 基于SVM算法的老鼠肿瘤致病基因的预测
4.1.2 SVM核函数的选择
4.1.3 基于KNN算法的老鼠肿瘤致病基因预测算法
4.2 基于KNN-SVM算法的老鼠肿瘤致病基因预测
4.2.1 KNN-SVM的传统算法
4.2.2 改进的KNN-SVM算法模型
4.3 实验结果和实例分析
4.3.1 实验数据
4.3.2 十折交叉验证法
4.3.3 对比实验结果分析
4.3.4 ROC曲线分析方法结果
4.3.5 方法评价
4.4 本章小结
第五章 总结
5.1 总结
5.2 进一步工作
参考文献
攻读硕士学位期间的科研成果
致谢
【参考文献】:
期刊论文
[1]信息披露质量与股权资本成本关系研究[J]. 周慧琴,朱亚娜. 北京邮电大学学报(社会科学版). 2016(01)
[2]统计相关性分析方法研究进展[J]. 樊嵘,孟大志,徐大舜. 数学建模及其应用. 2014(01)
[3]生物基因组非蛋白质编码转录组学及研究进展[J]. 姜宁,陈启军. 中国基础科学. 2009(06)
硕士论文
[1]基于模块归一化及自适应跳转随机游走的疾病基因预测[D]. 袁杰.华中师范大学 2016
[2]一种Renyi熵的正交小波变换盲均衡算法及DSP仿真[D]. 张树艳.安徽理工大学 2011
[3]基于改进互信息的医学图像配准方法研究[D]. 刘青芳.山西大学 2010
本文编号:3158699
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3158699.html
最近更新
教材专著