基于R的分类器模型在多药耐药性逆转研究中的应用
发布时间:2021-06-14 10:34
本文主要基于数据挖掘中的决策树及支持向量机建立单分类器、组合分类器、随机组合分类器和支持向量分类机模型,对白血病细胞的多药耐药性数据进行分类,判断白血病细胞其多药耐药性是否得到逆转.研究主要内容包括.数据的降维处理.建立多种分类器模型、优化模型参数,降低模型预测误差,对比各模型预测精度,选取最优模型.本文先针对白血病细胞的多药耐药性在逆转剂的作用下的细胞特征数据进行预处理,然后在处理后的数据集上应用和比较决策树、支持向量机、随机森林模型等多种分类算法.数据预处理中,使用去除取值接近于常数的变量、去除高相关性的自变量、剔除异常值、数据标准化处理等方式降低数据维度以优化样本集.在预处理后的数据集上建立单棵决策树模型,比较C4.5、C5.0、CART、Rpart决策树模型预测精度,并可视化操作;建立组合分类器模型,使用Bagging、adaboost算法构建模型,比较构建模型的效率及预测精度,使用加权投票的方式来探究预测结果;建立随机组合分类器,使用随机森林分类算法,通过随机选取测试样本集及单棵决策树,对测试样本集进行预测;建立支持向量分类机模型,寻找一个超平面来对样本集进行分割,寻找到一个...
【文章来源】:云南师范大学云南省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
论文结构框架
第 2 章 多药耐药性数据及预处理定是异常值.采用盖帽法处理这些异常值,其原理是替换数据框里 99%以上和 1%以下,将 99%以上的点值变更为 99%的点值;小于 1%的点值变更为 1%的点值图 2.1、2.2 给出了前四个自变量采用盖帽法处理前后的箱线图.
将 99%以上的点值变更为 99%的点值;小于 1%的点值变更为 1%的点值图 2.1、2.2 给出了前四个自变量采用盖帽法处理前后的箱线图.图 2.1 前四个自变量箱线图
【参考文献】:
期刊论文
[1]芍药苷对慢性髓系白血病耐阿霉素细胞株K562/ADR多药耐药性的逆转作用及机制[J]. 朱聪,贾秀红,刘迎雪. 山东医药. 2018(47)
[2]基于R语言rpart包与party包的分类树建模研究[J]. 徐万佶,曾庆. 科技资讯. 2018(11)
[3]基于边际的组合分类器选择算法[J]. 魏涛,郭华平,季新生. 信阳师范学院学报(自然科学版). 2017(03)
[4]基于依赖决策熵的决策树分类算法[J]. 王希玲,江峰,张友强,刘国柱. 青岛科技大学学报(自然科学版). 2016(06)
[5]基于双属性节点部分匹配的决策树改进算法[J]. 何田中,黄再祥. 闽南师范大学学报(自然科学版). 2015(04)
[6]R软件3个常用决策树包的应用比较[J]. 帅健,张艳,方瑶,李丽萍. 伤害医学(电子版). 2015(03)
[7]基于随机森林方法的滑坡灾害危险性区划[J]. 李亭,田原,邬伦,刘亮. 地理与地理信息科学. 2014(06)
[8]一种新的组合分类器学习方法[J]. 郭华平,袁俊红,张帆,邬长安,范明. 计算机科学. 2014(07)
[9]随机森林模型在分类与回归分析中的应用[J]. 李欣海. 应用昆虫学报. 2013(04)
[10]用于分类的随机森林和Bagging分类树比较[J]. 马景义,谢邦昌. 统计与信息论坛. 2010(10)
硕士论文
[1]分类器在员工离职预测中的应用[D]. 刘婷婷.广西大学 2018
[2]决策树分类算法优化研究[D]. 陈沛玲.中南大学 2007
本文编号:3229650
【文章来源】:云南师范大学云南省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
论文结构框架
第 2 章 多药耐药性数据及预处理定是异常值.采用盖帽法处理这些异常值,其原理是替换数据框里 99%以上和 1%以下,将 99%以上的点值变更为 99%的点值;小于 1%的点值变更为 1%的点值图 2.1、2.2 给出了前四个自变量采用盖帽法处理前后的箱线图.
将 99%以上的点值变更为 99%的点值;小于 1%的点值变更为 1%的点值图 2.1、2.2 给出了前四个自变量采用盖帽法处理前后的箱线图.图 2.1 前四个自变量箱线图
【参考文献】:
期刊论文
[1]芍药苷对慢性髓系白血病耐阿霉素细胞株K562/ADR多药耐药性的逆转作用及机制[J]. 朱聪,贾秀红,刘迎雪. 山东医药. 2018(47)
[2]基于R语言rpart包与party包的分类树建模研究[J]. 徐万佶,曾庆. 科技资讯. 2018(11)
[3]基于边际的组合分类器选择算法[J]. 魏涛,郭华平,季新生. 信阳师范学院学报(自然科学版). 2017(03)
[4]基于依赖决策熵的决策树分类算法[J]. 王希玲,江峰,张友强,刘国柱. 青岛科技大学学报(自然科学版). 2016(06)
[5]基于双属性节点部分匹配的决策树改进算法[J]. 何田中,黄再祥. 闽南师范大学学报(自然科学版). 2015(04)
[6]R软件3个常用决策树包的应用比较[J]. 帅健,张艳,方瑶,李丽萍. 伤害医学(电子版). 2015(03)
[7]基于随机森林方法的滑坡灾害危险性区划[J]. 李亭,田原,邬伦,刘亮. 地理与地理信息科学. 2014(06)
[8]一种新的组合分类器学习方法[J]. 郭华平,袁俊红,张帆,邬长安,范明. 计算机科学. 2014(07)
[9]随机森林模型在分类与回归分析中的应用[J]. 李欣海. 应用昆虫学报. 2013(04)
[10]用于分类的随机森林和Bagging分类树比较[J]. 马景义,谢邦昌. 统计与信息论坛. 2010(10)
硕士论文
[1]分类器在员工离职预测中的应用[D]. 刘婷婷.广西大学 2018
[2]决策树分类算法优化研究[D]. 陈沛玲.中南大学 2007
本文编号:3229650
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/3229650.html