当前位置:主页 > 科技论文 > 软件论文 >

女性乳腺癌患者存活时间问题的降维及预测算法研究与开发

发布时间:2022-02-16 21:33
  乳腺癌是发生在乳腺上皮组织的一种恶性肿瘤,是危害女性健康的一种疾病,乳腺并不是维持生命体征的一种必不可少的组织器官,原位乳腺癌并不直接危害生命,但是一旦癌细胞丧失一般细胞特性,就会发生扩散,当癌细胞扩散到全身,严重的可能会危及生命。DNA甲基化是基因修饰的一种方式,在基因组Cp G上结合一个甲基基团,从而影响多个生物功能模块,包括DNA与蛋白质的相互作用方式、DNA的稳定性、DNA构象、染色质结构的改变、以及基因的表达。甲基化测序方法按照原理可以分为三大类,重亚硫酸盐测序,基于限制性内切酶的测序,和靶向富集甲基化位点测序。随着高通量测序技术的发展,甲基化数据的获得变得更为容易,在现代医学中,利用DNA甲基化数据对乳腺癌进行诊断成为一种很有效的方法。但DNA甲基化数据具有很高的数据维度,并且由于基因检测的成本过高,导致样本数量相对不多,也就是所谓的“大p小n”的问题出现,由于数据维度过高,如果直接用模型对原数据进行预测,一方面很大可能会导致过拟合现象的出现。即使在训练集中能够得到相对不错的效果,但是测试集的效果很差,导致模型的泛化能力不强。另一方面,要得到所有的DNA甲基化位点的数据,需... 

【文章来源】:吉林大学吉林省211工程院校985工程院校教育部直属院校

【文章页数】:52 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景和意义
    1.2 本课题研究现状
    1.3 主要工作和创新点
第2章 DNA甲基化数据挖掘方法
    2.1 DNA甲基化数据简介
    2.2 数据预处理
    2.3 特征选择算法
        2.3.1 过滤法
        2.3.2 包装法
        2.3.3 嵌入法
    2.4 分类回归算法
        2.4.1 回归算法
        2.4.2 分类算法
    2.5 性能评价
        2.5.1 交叉验证
        2.5.2 性能指标
    2.6 本章小结
第3章 乳腺癌患者存活时间预测系统设计
    3.1 系统结构设计
    3.2 二分类模型
    3.3 回归模型
    3.4 性能评价
        3.4.1 二分类模型性能对比
        3.4.2 回归模型性能对比
    3.5 文章小结
第4章 其他乳腺癌biomarker对比
    4.1 pam50
    4.2 乳腺癌指数
    4.3 Endopredict test
    4.4 对比实验
    4.5 文章小结
第5章 总结与展望
    5.1 本文工作总结
    5.2 展望
参考文献
作者简介及科研成果
致谢


【参考文献】:
期刊论文
[1]一种基于信息增益的特征优化选择方法[J]. 刘庆和,梁正友.  计算机工程与应用. 2011(12)
[2]DNA甲基化方法研究现状[J]. 沈佳尧,侯鹏,祭美菊,李松,陆祖宏,何农跃.  生命的化学. 2003(02)



本文编号:3628699

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3628699.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2b54a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com