基于旋转森林的基因数据分类算法研究
本文关键词:基于旋转森林的基因数据分类算法研究
更多相关文章: 基因表达数据 决策树 旋转森林 核主成分分析 代价敏感
【摘要】:利用基因表达数据分类对癌症等恶性疾病进行识别,是数据挖掘技术在生物医学领域内的一个典型应用。决策树算法作为一种基础的机器学习算法,由于存在着理解性强,算法结构简单等优点被广泛运用,因此也产生了许多变体和集成方法。由于旋转森林算法在精度和集成度方面的优势而在近些年引起了研究者的关注。然而由于基因表达数据存在非线性和不平衡的特点,使得旋转森林算法的性能还需要进一步提高。当考虑到所有的样本存在不一样的分类代价时,除了追求分类精度外,对代价因素的处理也是一个必须面临的问题。针对以上问题,本文结合基因表达数据的特点,进行了以下方面的研究:(1)提出了一种基于核主成分分析的旋转森林算法(KPCA-Ro F)。利用核主成分分析实现数据从样本空间到特征空间的非线性变换以及数据的差异性变换。借鉴支持向量机的思想和旋转森林的集成方法,实现了基于核函数的旋转森林算法。选择高斯径向基核函数为映射函数,并且对其中的参数进行了分析和选择。实验证明基于核主成分分析的旋转森林在算法精度方面优于原始的算法,并且在较小的集成度时就可以达到良好的效果。(2)结合几种常用的代价因素类型,提出了嵌入代价敏感因素的旋转森林学习算法(CS-Ro F)。首先,通过改变EG2代价敏感决策树属性分裂的度量方法,嵌入误分类代价和测试代价;其次,在C4.5_cs代价敏感决策树的基础上嵌入拒识代价,形成了同时具有误分类代价和拒识代价的旋转森林算法。实验结论表明,代价敏感学习方法是解决数据不平衡性的良好途径;同时嵌入代价敏感因素可以降低平均分类代价并且保证了精度。
【学位授予单位】:中国计量大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:Q811.4;TP311.13;TP18
【相似文献】
中国期刊全文数据库 前10条
1 郑静静;王延光;杜磊;印兴耀;张广智;;基于概率核主成分分析的属性优化方法及其应用[J];石油地球物理勘探;2014年03期
2 李磊;金菊良;梁忠民;;核主成分分析的参数优化及其在水资源可持续利用综合评价中的应用[J];水利水电科技进展;2009年04期
3 陈高波;杨小红;;基于核主成分分析的大学生综合素质测评[J];科技信息;2010年07期
4 朱惠倩;;基于KPCA的中部六市综合经济实力评价[J];科技广场;2006年10期
5 陈斌;陆从德;刘光鼎;;基于核主成分分析的时间域航空电磁去噪方法[J];地球物理学报;2014年01期
6 李明月;任九泉;;基于核主成分分析和加权聚类分析的综合评价方法[J];统计与决策;2010年16期
7 陈永良;林楠;李学斌;;求解大样本核主成分分析模型的Lanczos算法[J];吉林大学学报(地球科学版);2010年01期
8 梁胜杰;张志华;崔立林;;主成分分析法与核主成分分析法在机械噪声数据降维中的应用比较[J];中国机械工程;2011年01期
9 万星火;郑俊玲;金永超;;基于KPCA的高校学业预警模型及其应用[J];数学理论与应用;2013年04期
10 彭令;牛瑞卿;赵艳南;邓清禄;;基于核主成分分析和粒子群优化支持向量机的滑坡位移预测[J];武汉大学学报(信息科学版);2013年02期
中国重要会议论文全文数据库 前3条
1 刘权;郭武;;基于核主成分分析的话题跟踪系统[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
2 薛永刚;朱靖波;魏刚;;基于核主成分分析的文本分类[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 徐扬;陈实;田玉敏;;基于核主成分分析的步态识别[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
中国博士学位论文全文数据库 前1条
1 杨胜凯;基于核主成分分析的特征变换研究[D];浙江大学;2014年
中国硕士学位论文全文数据库 前10条
1 徐东曙;蛋白质亚细胞定位中的非线性核熵成分分析和核主成分分析方法对比研究[D];云南大学;2016年
2 常燕芝;基于概率核学习方法的短期风电功率预测[D];兰州交通大学;2016年
3 刘亚卿;基于旋转森林的基因数据分类算法研究[D];中国计量大学;2016年
4 马文青;一种加权核主成分分析及其相关参数的选取[D];大连海事大学;2009年
5 刘素京;基于核主成分分析和支持向量机的飞机舱音信号的识别[D];南京航空航天大学;2009年
6 贾亚琼;基于核主成分分析的图像降噪方法研究[D];华南理工大学;2010年
7 万康康;基于核主成分分析的原像问题研究[D];南京理工大学;2014年
8 孙宗宝;基于软间隔支持向量机和核主成分分析的入侵检测研究[D];哈尔滨理工大学;2007年
9 王辉;基于核主成分分析特征提取及支持向量机的人脸识别应用研究[D];合肥工业大学;2006年
10 沈徐辉;基于核主成分与支持向量机的体内药物代谢预测[D];浙江大学;2011年
,本文编号:1166419
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1166419.html