当前位置:主页 > 医学论文 > 肿瘤论文 >

基于机器学习的肺癌预测方法的研究与实现

发布时间:2021-10-10 07:39
  肺癌是呼吸系统最常见的一种恶性肿瘤。在我国,肺癌的发病率和死亡率都高居第一位。肺癌的早期缺乏典型症状,一旦发现,患者大多处于中晚期且易伴随远处转移,治疗变得非常困难。肺癌死亡率较高的另一个原因是它预后较差,相当一部分患者会在治疗后出现复发,肺癌的早期诊断和预后分析在提高生存率方面具有重要意义。高通量测序技术的发展及分析方法的出现,为肺癌的预测和治疗带来了新的方向。在肿瘤的形成过程中,需要多种基因参与并相互作用,通过高通量测序技术可得到肺癌的全基因表达数据,利用分子学机制研究肺癌的发生和发展,可为肺癌的早期发现和预后诊断提供理论支持。本研究从TCGA(癌症基因组图谱)和GEO两个公共数据库中获取数据集作为研究对象,建立了一套肺癌的“诊断+预测”系统,该系统可以筛选出肺癌的易感基因,将其作为特征构建出肺癌的诊断模型,并判断出肺癌的亚型类型,同时,系统对肺癌患者的恶性程度及康复的可能性做出了预测,可达到较高的精度。针对肺癌的早期诊断,本研究提出了一套基于机器学习的肺癌易感基因筛选及亚型分类模型,首先从TCGA数据库中获取到肺癌的转录组数据及临床信息,运用R语言,结合limma、EdgeR及D... 

【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:104 页

【学位级别】:硕士

【部分图文】:

基于机器学习的肺癌预测方法的研究与实现


图2-1层次聚类过程??11??

决策树,树状结构,叶子


山东大学硕士学位论文??恨节点??1??2?3??叶子节点??4?5??叶子节点?_?7'??6?7??叶子节点叶子节点??图2-2决策树树状结构??决策树利用图2-2的树状结构进行决策分类,每一个叶子节点是决策的结果,??每一个非叶子节点是根据特征判断的条件,决策树的构建是一个逐渐分裂的过??程,采用自顶向下的递归方式,主要包括特征选择、决策树生成、剪枝三个步骤,??特征选择即从众多的特征中选择一个特征作为当前节点分裂的标准,决策树生成??过程以信息熵为衡量标准构建一颗熵值下降最快的树,根节点的熵值最大,到叶??子节点处熵值为0,剪枝是为了缩小树状结构的规模,防止过拟合。??2.4.4集成机器学习??集成机器学习方法是指通过构建多个学习器来完成学习任务1?1,通常可以获??得比最优的单个学习器更好的预测结果。集成机器学习的训练流程如图2-3所示:??学习滟1?字习雅2?字习雅M??I?I?I??橫?sa?m2?描?SDN??图2-3集成学习训练流程??15??

流程图,流程,叶子,决策树


山东大学硕士学位论文??恨节点??1??2?3??叶子节点??4?5??叶子节点?_?7'??6?7??叶子节点叶子节点??图2-2决策树树状结构??决策树利用图2-2的树状结构进行决策分类,每一个叶子节点是决策的结果,??每一个非叶子节点是根据特征判断的条件,决策树的构建是一个逐渐分裂的过??程,采用自顶向下的递归方式,主要包括特征选择、决策树生成、剪枝三个步骤,??特征选择即从众多的特征中选择一个特征作为当前节点分裂的标准,决策树生成??过程以信息熵为衡量标准构建一颗熵值下降最快的树,根节点的熵值最大,到叶??子节点处熵值为0,剪枝是为了缩小树状结构的规模,防止过拟合。??2.4.4集成机器学习??集成机器学习方法是指通过构建多个学习器来完成学习任务1?1,通常可以获??得比最优的单个学习器更好的预测结果。集成机器学习的训练流程如图2-3所示:??学习滟1?字习雅2?字习雅M??I?I?I??橫?sa?m2?描?SDN??图2-3集成学习训练流程??15??

【参考文献】:
期刊论文
[1]血清外泌体miR-184在非小细胞肺癌中的表达水平及其诊断效能[J]. 王蕾,欧宗兴.  兰州大学学报(医学版). 2018(03)
[2]非小细胞肺癌术后局部复发患者接受根治性放疗的生存及预后因素[J]. LiMa,Bo Qiu,Jun Zhang,Qi-WenLi,BinWang,Xu-HuiZhang,Meng-YunQiang,Zhao-LinChen,Su-PingGuo,Hui Liu.  癌症. 2018(04)
[3]肺癌诊治水平的进展与提高[J]. 李为民,刘丹,卢铀.  四川大学学报(医学版). 2014(02)
[4]机器学习及其相关算法综述[J]. 陈凯,朱钰.  统计与信息论坛. 2007(05)
[5]黏着斑激酶的结构与功能[J]. 袁一旻,姚真真,焦炳华.  生命的化学. 2006(05)
[6]肺癌早期发现有手段——荧光支气管镜技术[J]. 张蕾,王贵齐.  抗癌之窗. 2006(02)

硕士论文
[1]基于支持向量机的特征选择算法研究[D]. 严康.大连理工大学 2010



本文编号:3427944

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/zlx/3427944.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1da03***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com