当前位置:主页 > 科技论文 > 软件论文 >

不一致数据上精确决策树生成算法

发布时间:2018-11-11 17:23
【摘要】:近年来,随着现实生活中数据量的不断增大,不一致数据的出现也越发频繁,这使得人工修正不一致数据变得更加耗时.而且,人工修正数据方法本身也存在着不可避免的人为操作错误,因此,这种修正方法不再可行.如何不提前修复不一致数据,直接在不一致数据上进行分类,是该文的核心研究内容.对决策树生成算法的目标函数进行改进,使其能够直接对不一致数据进行分类,并得到较好的分类结果.对约束条件中的特征对分类结果的影响进行了多方面衡量,从而调整该特征的影响因子,使得决策树的节点分割更加精确,分类效果更优.
[Abstract]:In recent years, with the increasing amount of data in real life, inconsistent data appear more and more frequently, which makes the artificial correction of inconsistent data become more time-consuming. Moreover, there are inevitable human errors in the data correction method, so this method is no longer feasible. How to classify inconsistent data directly without repairing inconsistent data in advance is the core of this paper. The objective function of the decision tree generation algorithm is improved so that the inconsistent data can be classified directly and a better classification result is obtained. The influence of the feature in the constraint condition on the classification result is measured in many aspects, and the influence factor of the feature is adjusted to make the node segmentation of the decision tree more accurate and the classification effect better.
【作者单位】: 哈尔滨工业大学计算机科学与技术系;
【分类号】:TP301.6

【相似文献】

相关会议论文 前10条

1 陈长清;冯剑琳;向隆刚;冯玉才;;维之间带函数依赖关系的数据立方的有效计算[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

2 张忠平;曹顺良;李荣;朱扬勇;;基于约束的XML模式规范化研究[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

3 马垣;张小平;白雪;王旭;刘杨;杨鸿雁;;函数依赖作用域及分类规则的挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

4 赵相国;王国仁;张恩德;丁大斌;霍欢;;XML函数依赖的定义及分析[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

5 马垣;;动态Fuzzy函数依赖[A];第十二届全国数据库学术会议论文集[C];1994年

6 刘云峰;杨冬青;唐世渭;王腾蛟;;基于XML数据交换中的函数依赖转换方法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

7 张忠平;余靖;朱扬勇;;基于函数依赖的XML键的推理及其求解算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

8 张小峰;张福增;赵永升;李明;;基于函数依赖关系的约简算法研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

9 彭玉青;何华;顾军华;;基于粗集理论的归纳依赖关系的研究[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年

10 岳昆;郭志懋;胥正川;周傲英;;从XML键到关系数据库函数依赖[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

相关重要报纸文章 前1条

1 记者 何屹;美籍华裔科学家获英计算机最高奖[N];科技日报;2008年

相关博士学位论文 前1条

1 吕腾;XML文档的规范化问题研究[D];复旦大学;2003年

相关硕士学位论文 前10条

1 吴佳;多态依赖蕴含判定方法的研究[D];北京工业大学;2015年

2 叶杰敏;不确定数据库及相关理论研究[D];东华大学;2014年

3 李高仕;XML数据库的规范化理论研究[D];湖南师范大学;2008年

4 闫渊;基于信息论和函数依赖的半监督学习[D];吉林大学;2013年

5 覃事东;基于函数依赖改进隐含朴素贝叶斯的性能和鲁棒性[D];吉林大学;2014年

6 苏杰;基于编辑距离和条件函数依赖的酒店数据清洗方法研究[D];南昌大学;2014年

7 张峰;XML不完全信息的动态发现[D];山东大学;2009年

8 侯林娇;基于函数依赖的成批处理模式挖掘方法研究[D];湖南科技大学;2011年

9 曹颖;云计算环境下分布式数据不一致的研究[D];中国海洋大学;2013年

10 周莉;带约束的XML与RDB数据转换关键技术的研究[D];江西师范大学;2005年



本文编号:2325599

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2325599.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fd7c3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com