当前位置:主页 > 科技论文 > 自动化论文 >

面向不平衡数据集分类的层次引力模型研究

发布时间:2017-12-16 12:27

  本文关键词:面向不平衡数据集分类的层次引力模型研究


  更多相关文章: 不平衡数据集分类 层次分类模型 数据引力模型 小析取项


【摘要】:分类是数据挖掘和机器学习领域的一个热点问题,传统的分类问题主要关注数据分布平衡的情况,但是在实际应用当中数据不平衡的情况时有发生。数据的不平衡给分类直接或间接地带来了很多困难,传统的方法在对不平衡数据集进行分类时往往变得不再适用。由于不平衡数据集分类问题的挑战性和在现实中的广泛应用,吸引了越来越多的人对其进行研究。目前对不平衡数据集分类的解决方法主要分三种:问题定义层的解决方法、数据层的解决方法和算法层的解决方法。在对不平衡数据集分类中的主要问题进行分析后,该文介绍了两种传统的分类方法,即层次分类模型和数据引力模型,并分析了将它们用于不平衡数据集分类的可行性:将两者结合可以同时降低类间不平衡和小析取项对分类影响。然后在此基础上对两者进行了修改,提出了一种用于不平衡数据集分类的层次引力模型,即HDGC。本文的主要工作如下:1.将层次分类模型和数据引力模型相结合,在吸纳两者优点的同时使两者弥补了彼此的不足,即层次分类模型精确分类能力的不足和数据引力模型分类代价较高的问题。2.改变了传统层次分类模型中采用新生成样本代替原始样本的做法,将划分后位于同一区域的样本看作一个数据单元,根据数据单元距离边界的远近对其进行不同标记,并使用标记结果辅助分类。3.采用了局部引力和全局引力相结合进行分类的方法。局部引力只采用相邻的训练样本对测试样本进行分类,在有足够信息的情况下提高了分类的效率,而使用全局引力则可以利用尽可能多的信息对难分样本进行分类。为了验证HDGC算法的有效性,分别在实际数据集和人工数据集上进行了实验,实验结果表明该方法能够很好的处理不平衡数据集的分类问题,同时具有较高的分类效率。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181;TP311.13

【相似文献】

中国期刊全文数据库 前2条

1 张晶;宋福根;孙捷;;价格与广告的组合博弈模型及系统仿真[J];计算机系统应用;2013年05期

2 ;[J];;年期

中国重要会议论文全文数据库 前7条

1 黄涛;张明;覃东海;;东亚的贸易一体化模式:一个引力模型的验证[A];现代工业工程与管理研讨会会议论文集[C];2006年

2 武艺;吴小根;;旅游地引力模型分析研究[A];地理学会全面建设小康社会——第九次中国青年地理工作者学术研讨会论文摘要集[C];2003年

3 何伟;;我国大豆进口的主要影响因素——基于引力模型的研究[A];农业经济问题(2010年增刊)[C];2010年

4 王晨钟;;基于改进的引力模型解析我国外贸发展的动因变化[A];新规划·新视野·新发展——天津市社会科学界第七届学术年会优秀论文集《天津学术文库》(下)[C];2011年

5 谢国立;;引力模型在城市交通流量分布预测中的应用[A];第三届全国结构工程学术会议论文集(下)[C];1994年

6 王海龙;;基于引力模型的京津冀地区城市圈辐射力分析[A];全国经济地理研究会第十三届学术年会暨金融危机背景下的中国区域经济发展研讨会论文集[C];2009年

7 余淼杰;;发展中国家间的民主进步能促进其双边贸易吗——基于引力模型的一个实证研究[A];经济学(季刊)第7卷第4期[C];2008年

中国博士学位论文全文数据库 前6条

1 萨达罕(Saadeh Shaker Othman Saadeh);中国和海湾合作理事会国家之间的双边贸易重力模型比较分析[D];首都经济贸易大学;2016年

2 维摩拉;中国与南亚经贸协调发展研究[D];南京师范大学;2015年

3 郝景芳;基于面板数据引力模型的中国对外贸易研究[D];清华大学;2012年

4 朱海霞;基于引力模型的中美农产品贸易边境效应模型研究[D];上海交通大学;2008年

5 何伟;基于引力模型的中国食用油籽贸易影响因素及贸易潜力研究[D];中国农业科学院;2011年

6 张英涛;生产外包与区域经济合作:理论和实证研究[D];南开大学;2014年

中国硕士学位论文全文数据库 前10条

1 郑翔;基于引力模型的区域经济联系的测度与实证分析[D];浙江工商大学;2015年

2 JUNAID KAMAL(卡马尔);巴基斯坦双边贸易影响因素研究[D];首都经济贸易大学;2015年

3 陈娜娜;中国与哈萨克斯坦双边货物贸易潜力研究[D];新疆大学;2015年

4 任媛;中国与主要贸易伙伴双边贸易成本的测度与分析[D];陕西师范大学;2015年

5 韩笑;中国货物贸易出口量的影响因素[D];合肥工业大学;2015年

6 赫慧慧;加入TPP:顺势而为亦或另取炉灶[D];安徽大学;2016年

7 马苓苓;基于引力模型识别复杂网络中有影响力的传播者[D];安徽大学;2016年

8 吴沁;中国与“一带一路”国家贸易潜力研究[D];南京大学;2016年

9 陈三景;中哈贸易密切度分析及贸易潜力测算[D];新疆财经大学;2016年

10 许智云;福建省高新技术产品国际贸易现状分析与前景展望[D];福州大学;2014年



本文编号:1296027

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1296027.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f4614***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com