不一致数据上精确决策树生成算法
[Abstract]:In recent years, with the increasing amount of data in real life, inconsistent data appear more and more frequently, which makes the artificial correction of inconsistent data become more time-consuming. Moreover, there are inevitable human errors in the data correction method, so this method is no longer feasible. How to classify inconsistent data directly without repairing inconsistent data in advance is the core of this paper. The objective function of the decision tree generation algorithm is improved so that the inconsistent data can be classified directly and a better classification result is obtained. The influence of the feature in the constraint condition on the classification result is measured in many aspects, and the influence factor of the feature is adjusted to make the node segmentation of the decision tree more accurate and the classification effect better.
【作者单位】: 哈尔滨工业大学计算机科学与技术系;
【分类号】:TP301.6
【相似文献】
相关会议论文 前10条
1 陈长清;冯剑琳;向隆刚;冯玉才;;维之间带函数依赖关系的数据立方的有效计算[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 张忠平;曹顺良;李荣;朱扬勇;;基于约束的XML模式规范化研究[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
3 马垣;张小平;白雪;王旭;刘杨;杨鸿雁;;函数依赖作用域及分类规则的挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 赵相国;王国仁;张恩德;丁大斌;霍欢;;XML函数依赖的定义及分析[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 马垣;;动态Fuzzy函数依赖[A];第十二届全国数据库学术会议论文集[C];1994年
6 刘云峰;杨冬青;唐世渭;王腾蛟;;基于XML数据交换中的函数依赖转换方法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
7 张忠平;余靖;朱扬勇;;基于函数依赖的XML键的推理及其求解算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
8 张小峰;张福增;赵永升;李明;;基于函数依赖关系的约简算法研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 彭玉青;何华;顾军华;;基于粗集理论的归纳依赖关系的研究[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
10 岳昆;郭志懋;胥正川;周傲英;;从XML键到关系数据库函数依赖[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
相关重要报纸文章 前1条
1 记者 何屹;美籍华裔科学家获英计算机最高奖[N];科技日报;2008年
相关博士学位论文 前1条
1 吕腾;XML文档的规范化问题研究[D];复旦大学;2003年
相关硕士学位论文 前10条
1 吴佳;多态依赖蕴含判定方法的研究[D];北京工业大学;2015年
2 叶杰敏;不确定数据库及相关理论研究[D];东华大学;2014年
3 李高仕;XML数据库的规范化理论研究[D];湖南师范大学;2008年
4 闫渊;基于信息论和函数依赖的半监督学习[D];吉林大学;2013年
5 覃事东;基于函数依赖改进隐含朴素贝叶斯的性能和鲁棒性[D];吉林大学;2014年
6 苏杰;基于编辑距离和条件函数依赖的酒店数据清洗方法研究[D];南昌大学;2014年
7 张峰;XML不完全信息的动态发现[D];山东大学;2009年
8 侯林娇;基于函数依赖的成批处理模式挖掘方法研究[D];湖南科技大学;2011年
9 曹颖;云计算环境下分布式数据不一致的研究[D];中国海洋大学;2013年
10 周莉;带约束的XML与RDB数据转换关键技术的研究[D];江西师范大学;2005年
,本文编号:2325599
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2325599.html