一种基于决策森林的单调分类方法
本文选题:单调分类 + 决策树 ; 参考:《计算机研究与发展》2017年07期
【摘要】:单调分类问题是特征与类别之间带有单调性约束的有序分类问题.对于符号数据的单调分类问题已有较好的方法,但对于数值数据,现有的方法分类精度和运行效率有限.提出一种基于决策森林的单调分类方法(monotonic classification method based on decision forest,MCDF),设计采样策略来构造决策树,可以保持数据子集与原数据集分布一致,并通过样本权重避免非单调数据的影响,在保持较高分类精度的同时有效提高了运行效率,同时这种策略可以自动确定决策森林中决策树的个数.在决策森林进行分类时,给出了决策冲突时的解决方法.提出的方法既可以处理符号数据,也可以处理数值数据.在人造数据集、UCI及真实数据集上的实验数据表明:该方法可以提高单调分类性能和运行效率,缩短分类规则的长度,解决数据集规模较大的单调分类问题.
[Abstract]:Monotone classification is an ordered classification problem with monotonicity constraints between features and categories. There are good methods for monotone classification of symbolic data, but for numerical data, the classification accuracy and operational efficiency of the existing methods are limited. A monotone classification method based on decision forest (monotonic classification method based on decision forestMCDF) is proposed. Sampling strategy is designed to construct decision tree. It can keep the distribution of data subset consistent with the original data set, and avoid the influence of non-monotone data through sample weight. This strategy can automatically determine the number of decision trees in the decision-making forest. In the process of classification of decision-making forest, the solution of decision-making conflict is given. The proposed method can deal with both symbolic and numerical data. The experimental data on UCI and real data sets show that this method can improve the performance and efficiency of monotone classification, shorten the length of classification rules, and solve the problem of monotone classification with large scale of data sets.
【作者单位】: 山西大学计算机与信息技术学院;计算智能与中文信息处理教育部重点实验室(山西大学);山西财经大学应用数学学院;
【基金】:国家自然科学基金项目(61673249,61503229) 山西省回国留学人员科研基金项目(2016-004) 山西省研究生教育创新项目(2016BY003)~~
【分类号】:TP181
【参考文献】
相关期刊论文 前1条
1 ;Information entropy for ordinal classification[J];Science China(Information Sciences);2010年06期
相关硕士学位论文 前1条
1 车勋建;基于有序决策树的故障程度诊断研究[D];哈尔滨工业大学;2011年
【共引文献】
相关期刊论文 前10条
1 许行;王文剑;任丽芳;;一种基于决策森林的单调分类方法[J];计算机研究与发展;2017年07期
2 潘伟;佘X;;基于偏好不一致熵的有序决策[J];计算机应用;2017年03期
3 黄金晶;黄黎;;基于信息熵的网络课程学生分类模型研究[J];宁波职业技术学院学报;2016年05期
4 李敬;张盼盼;王利东;;基于拓扑邻域的序信息系统属性权重确定方法[J];数码设计;2016年02期
5 Lili MEI;Heyan HUANG;Xiaochi WEI;Xianling MAO;;A novel unsupervised method for new word extraction[J];Science China(Information Sciences);2016年09期
6 潘巍巍;宋彦萍;于达仁;;齿轮裂纹程度识别的有序分类算法[J];哈尔滨工业大学学报;2016年07期
7 陈建凯;王鑫;何强;王熙照;;区间值属性的单调决策树算法[J];模式识别与人工智能;2016年01期
8 李敬;王利东;李晓庆;;基于优势度的序信息系统属性重要性度量[J];琼州学院学报;2015年05期
9 潘巍巍;;基于排序熵的故障严重程度识别特征选择算法[J];厦门理工学院学报;2015年03期
10 赵春宇;刘景江;马伦;张伟君;;Monotonicity Evaluation Method of Monitoring Feature Series Based on Ranking Mutual Information[J];Journal of Shanghai Jiaotong University(Science);2015年03期
相关硕士学位论文 前3条
1 王鑫;基于FRMI的有序决策树算法及其比较研究[D];河北大学;2014年
2 陈建凯;基于排序熵的有序决策树高效算法研究[D];河北大学;2014年
3 周杨;滚动轴承性能退化评估技术研究[D];电子科技大学;2014年
【二级参考文献】
相关期刊论文 前2条
1 ;The information content of rules and rule sets and its application[J];Science in China(Series F:Information Sciences);2008年12期
2 ;Information granules and entropy theory in information systems[J];Science in China(Series F:Information Sciences);2008年10期
相关硕士学位论文 前4条
1 朱义;基于CHMM的设备性能退化评估方法研究[D];上海交通大学;2009年
2 刘雨;基于支持向量数据描述与信息融合的设备性能退化评估研究[D];上海交通大学;2009年
3 柴春胜;基于决策树的坦克故障诊断系统的设计与实现[D];大连理工大学;2006年
4 王惠莲;决策树算法在火电机组故障诊断中的应用[D];华北电力大学(北京);2006年
【相似文献】
相关期刊论文 前10条
1 张晓斌;魏永祥;韩德民;夏寅;李希平;原林;唐雷;王兴海;;数字化耳鼻咽喉数据集的采集[J];中华耳鼻咽喉头颈外科杂志;2005年06期
2 职为梅;郭华平;范明;叶阳东;;非平衡数据集分类方法探讨[J];计算机科学;2012年S1期
3 韩慧;王路;温明;王文渊;;不均衡数据集学习中基于初分类的过抽样算法[J];计算机应用;2006年08期
4 高嘉伟;梁吉业;;非平衡数据集分类问题研究进展[J];计算机科学;2008年04期
5 吴克寿;曾志强;;非平衡数据集分类研究[J];计算机技术与发展;2011年09期
6 颜杰,李彩霞,曾芳芳,方积乾;如何控制SAS结果的输出[J];中国卫生统计;2004年02期
7 王双成;冷翠平;李小琳;;小数据集的贝叶斯网络结构学习[J];自动化学报;2009年08期
8 李鹏;王晓龙;刘远超;王宝勋;;一种基于混合策略的失衡数据集分类方法[J];电子学报;2007年11期
9 王灿伟;于治楼;张化祥;;一种适合不平衡数据集的新型提升算法[J];计算机工程与应用;2011年28期
10 蔡娜;王俊英;刘惟一;;一种基于小数据集的贝叶斯网络学习方法[J];云南大学学报(自然科学版);2007年04期
相关博士学位论文 前7条
1 严远亭;不完整数据集的多视角集成分类研究[D];安徽大学;2016年
2 史荧中;耦合的支持向量学习方法及应用研究[D];江南大学;2016年
3 雒晓卓;基于联合稀疏和局部线性的极限学习机及应用[D];西安电子科技大学;2015年
4 孙汉昌;蛋白质组质谱数据处理关键问题与技术研究[D];国防科学技术大学;2011年
5 张景祥;迁移学习技术及其应用研究[D];江南大学;2015年
6 黄超;若干蛋白质种类鉴别的多标记预测问题研究[D];上海交通大学;2014年
7 李宏;面向应用领域的分类方法研究[D];中南大学;2007年
相关硕士学位论文 前10条
1 袁铭;基于R-SMOTE方法的非平衡数据分类研究[D];河北大学;2015年
2 程伟;基于半监督SVM的非平衡学习[D];西安电子科技大学;2014年
3 马蕊;基于触觉序列的物体分类方法[D];石家庄铁道大学;2015年
4 闫欣;综合过采样和欠采样的不平衡数据集的学习研究[D];东北电力大学;2016年
5 朱政;V-支持向量分类机中若干问题的研究[D];华东师范大学;2016年
6 蒋伟;基于特征的轨迹数据集化简研究[D];苏州大学;2016年
7 徐丽丽;面向不平衡数据集的分类算法研究[D];辽宁师范大学;2016年
8 王聪;基于深度学习的交通标志检测算法研究[D];北方工业大学;2017年
9 张贝贝;基于类别失衡数据集的改进支持向量机模型的研究[D];安徽理工大学;2017年
10 欧阳源怞;基于混合采样的非平衡数据集分类研究[D];重庆大学;2014年
,本文编号:2112407
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2112407.html