当前位置:主页 > 科技论文 > 软件论文 >

一种不完备混合数据集成聚类算法

发布时间:2017-09-07 01:06

  本文关键词:一种不完备混合数据集成聚类算法


  更多相关文章: 集成聚类 不完备数据 混合数据 缺失值填充 K原型聚类算法


【摘要】:集成聚类技术由于具有较好的泛化能力,目前引起了研究者的高度关注.已有研究主要关注数值型完备数据的集成聚类问题.然而,实际应用中面临的数据往往是兼具数值属性和分类属性共同描述的混合型数据,而且通常带有缺失值.为此,针对不完备混合数据提出了一种集成聚类算法,首先利用3种缺失值填充方法对不完备混合数据进行完备化处理;其次在3种填充后的不同完备数据集上分别多次执行K-Prototypes算法产生基聚类结果;最后对基聚类结果进行集成.在UCI真实数据集上与传统聚类算法通过实验进行了比较分析,实验结果表明提出的算法是有效的.
【作者单位】: 山西大学计算机与信息技术学院;计算智能与中文信息处理教育部重点实验室(山西大学);
【关键词】集成聚类 不完备数据 混合数据 缺失值填充 K原型聚类算法
【分类号】:TP391
【正文快照】: 聚类分析是针对给定的数据集,根据元素之间因此,如何针对不完备混合数据进行集成聚类就显的相似性度量自动将相似的元素划分到同一组,使得尤为必要.得组内的元素相似性达到最大而组间元素的相似性为了解决这一问题,本文提出了一个基于缺失达到最小的过程.目前,聚类分析技术已

【相似文献】

中国重要会议论文全文数据库 前10条

1 蔡彪;廖闻剑;彭艳兵;;Deep Web数据集成和关键技术综述[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年

2 许国艳;王志坚;;基于主动服务的领域数据集成研究[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年

3 胥永康;吴志杰;席传裕;岳筱玲;;基于数据拆分的数据集成技术研究[A];2005全国计算机程序设计类课程教学研讨会论文集[C];2005年

4 李宗华;肖道纲;彭明军;;数字武汉空间基础数据集成建库及应用[A];坚持科学发展观 推进自主创新 促进国家创新型城市建设——武汉市第二届学术年会论文集[C];2006年

5 乔慧捷;赵海军;纪力强;;生物多样性数据集成模式初探[A];第五届全国生物多样性保护与持续利用研讨会论文摘要集[C];2002年

6 张寿明;张云生;向风红;缪尔康;;异构设备数据集成实践[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年

7 张德钦;饶克锋;顾进广;;基于语义的工业联合体数据集成机制[A];全国冶金自动化信息网2014年会论文集[C];2014年

8 刘靖;刘江宁;;数据集成体系架构及其实现框架研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年

9 李宗华;彭明军;;规划国土资源管理空间数据集成应用与运行机制探讨[A];2004城市规划年会论文集(下)[C];2004年

10 祝晓红;刘炜;李俊丽;;用WPF进行复杂数据集成的方法研究[A];第二十七届中国控制会议论文集[C];2008年

中国重要报纸全文数据库 前10条

1 于翔;集成即服务:面向云的数据集成[N];网络世界;2009年

2 邹大斌;发挥数据的最大价值[N];计算机世界;2007年

3 于翔;谁碾碎了数据?[N];网络世界;2007年

4 本报记者 于翔;数据集成驱动企业实时创新[N];网络世界;2010年

5 本报记者 于翔;数据集成市场演绎“大国崛起”[N];网络世界;2010年

6 本报记者 于翔;数据集成开启云征程[N];网络世界;2010年

7 本报记者 于翔;数据集成进入快速成长期[N];网络世界;2010年

8 于翔 王翔;收复数据孤岛[N];网络世界;2007年

9 朱文;CIO希望攻克数据质量关[N];计算机世界;2008年

10 吕梁市煤炭设计研究院 张萍;浅析数据集成环境下煤炭企业管理信息系统的构建[N];吕梁日报;2012年

中国博士学位论文全文数据库 前10条

1 张燕;Web数据集成中实体演化与关联问题研究[D];山东大学;2015年

2 鄂新华;面向服务的数据集成若干关键技术研究[D];北京邮电大学;2015年

3 朱笑尘;异质过程数据集成与修复[D];清华大学;2015年

4 王欣;数据集成技术若干问题的研究[D];上海交通大学;2010年

5 张永新;面向Web数据集成的数据融合问题研究[D];山东大学;2012年

6 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年

7 魏红雨;基于4G地学空间数据集成关键技术研究[D];吉林大学;2014年

8 曹顺良;生物学数据集成若干关键问题研究[D];复旦大学;2005年

9 周春英;超数据集成挖掘方法与技术研究[D];浙江大学;2012年

10 陈义;面向数据集成的数据复制和查询优化[D];中国科学院研究生院(软件研究所);2004年

中国硕士学位论文全文数据库 前10条

1 翟妍伟;基于联邦的异构数据集成与交换系统研究与实现[D];西南交通大学;2015年

2 贾存鑫;链接数据技术在生物医学领域的应用技术研究[D];南京大学;2015年

3 姜玉茹;变电站数据集成与智能化应用研究[D];山东大学;2015年

4 申亚鹏;基于用户反馈的多源非结构化数据集成研究[D];浙江大学;2015年

5 李明;多元空间位置数据集成和服务方法研究[D];南京师范大学;2015年

6 李莉;保障信息系统数据集成管理工具的研究与实现[D];西安电子科技大学;2014年

7 徐U嗞,

本文编号:806505


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/806505.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7b86d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com