当前位置:主页 > 科技论文 > 软件论文 >

基于K-means的关联规则聚类分析与可视化

发布时间:2018-04-23 22:14

  本文选题:关联规则 + 聚类算法 ; 参考:《太原科技大学》2016年硕士论文


【摘要】:关联规则是数据挖掘的主要研究内容之一,并已广泛地应用在市场营销、零售等众多领域。然而针对高维海量数据集,尤其当支持度和置信度阈值太低时,将生成大量冗余和相似的关联规则,对关联规则的理解和实际应用造成了较多困难。本文采用K-means思想,对关联规则聚类算法与恒星光谱关联规则聚类簇的可视化方法进行了研究,主要成果如下:(1)给出了一种基于K-means的关联规则聚类算法。该算法首先重新定义了冗余关联规则,并给出了一种删除冗余关联规则的方法;然后根据关联规则前件与后件的结构特性,定义了一种新的规则间相似性度量;其次采用最大三角形方法选取聚类的初始点,并利用K-means思想,对删除冗余后的关联规则进行聚类分析,将相似的关联规则归为一类;最后采用恒星光谱数据和人工数据集,实验验证该算法能够帮助用户快速地找到有用的关联规则。(2)给出了一种基于平行坐标的恒星光谱关联规则簇可视化方法。该方法首先根据恒星光谱关联规则簇中的属性,对属性维(横坐标)进行定义;然后根据各属性的特征个数对属性区间(纵坐标)定义;其次,采用刷技术、增减维数来显示特定维数或者特定属性时的规律。最后,采用恒星光谱关联规则聚类集进行可视化,实验验证该方法有效地提高了关联规则的可理解性。
[Abstract]:Association rules are one of the main research contents of data mining and have been widely used in many fields, such as marketing, retail and so on. However, a large number of redundant and similar association rules will be generated for the high dimensional mass data sets, especially when the support and confidence threshold are too low, which causes more difficulties in the understanding and practical application of association rules. It is difficult to use the K-means idea to study the visualization method of association rule clustering algorithm and stellar spectral association rule clustering cluster. The main results are as follows: (1) a clustering algorithm based on K-means is given. The algorithm first redefines the redundant association rules, and gives a redundant association rule. And then, according to the structural characteristics of the association rules and the post parts, a new measure of the similarity between rules is defined. Secondly, the initial point of the cluster is selected by the maximum triangle method, and the K-means idea is used to cluster analysis of the redundant association rules, and the similar association rules are classified as a class. Finally, the constant star light is used. The algorithm can help users to quickly find useful association rules. (2) a visualization method of star spectral association rules based on parallel coordinates is given. Firstly, the attribute dimension (abscissa) is defined according to the attributes of the star spectral association rules cluster; and then according to each of them, The characteristic number of attributes is defined on the attribute interval (ordinate); secondly, the brush technique is used to increase and decrease the dimension to display the specific dimension or specific property. Finally, the stellar spectral association rule clustering set is used to visualize it. The experiment proves that the method effectively improves the comprehensibility of the association rules.

【学位授予单位】:太原科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 蔡秋茹;柳益君;罗烨;朱广萍;叶飞跃;;基于K-means聚类的电信企业客户分群决策[J];江南大学学报(自然科学版);2010年02期

2 张亚萍;胡学钢;;基于K-means的朴素贝叶斯分类算法的研究[J];计算机技术与发展;2007年11期

3 刘运;殷建平;程杰仁;蔡志平;;基于k-Means改进算法的分布式拒绝服务攻击检测[J];计算机工程与科学;2008年12期

4 张济强;高玉良;;遗传模拟退火算法在k-means聚类中的应用[J];电脑知识与技术;2012年07期

5 贾花萍;李尧龙;哈渭涛;史晓影;;K-means聚类神经网络分类器在睡眠脑电分期中的应用研究[J];河南科学;2012年06期

6 李学勇;高国红;孙甲霞;;基于互信息和K-means聚类的信息安全风险评估[J];河南师范大学学报(自然科学版);2011年02期

7 郁雪;李敏强;;一种结合有效降维和K-means聚类的协同过滤推荐模型[J];计算机应用研究;2009年10期

8 屈新怀;高万里;丁必荣;李朕;;基于聚类数和初始值的K-means算法改进研究[J];组合机床与自动化加工技术;2011年04期

9 边鹏;赵妍;苏玉召;;一种改进的K-means算法最佳聚类数确定方法[J];现代图书情报技术;2011年09期

10 宗瑜;金萍;李明楚;;BK-means:骨架初始解K-means[J];计算机工程与应用;2009年14期

相关会议论文 前6条

1 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年

2 陈磊;胡佳敏;严华;;K-means算法在散货船代货运系统中的应用[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年

3 郑建军;甘仞初;贺跃;毕思飞;;一种基于k-means的聚类集成方法[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年

4 张望;王辉;;个性化服务中的并行K-Means聚类算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年

5 江华;王翰虎;陈梅;;一种基于K-means聚类分组的P2P超结点模型[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

6 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年

相关硕士学位论文 前10条

1 陈智;基于K-means聚类算法的机会网络群组移动模型及其长相关性研究[D];湘潭大学;2015年

2 许允栋;K-means聚类算法的改进与应用[D];广西师范大学;2015年

3 丁斌;基于布谷鸟算法的K-means聚类挖掘算法研究[D];合肥工业大学;2015年

4 贺艳芳;熵加权多视角核k-means聚类算法的研究[D];郑州大学;2016年

5 陈克;基于K-means算法的CSS Sprites图片合成技术的研究[D];东北师范大学;2016年

6 黄新华;基于Apriori和K-means算法的图书推荐系统设计与实现[D];湖南大学;2016年

7 靳姗姗;基于K-means聚类分析的南海水团分布及其季节变化研究[D];国家海洋局第一海洋研究所;2017年

8 王琢;基于K-means的关联规则聚类分析与可视化[D];太原科技大学;2016年

9 梁云昭;基于K-means的围棋特征提取方法研究[D];北京理工大学;2015年

10 于洋洋;基于并行K-MEANS聚类分析的社群发现算法研究[D];东北大学;2012年



本文编号:1793868

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1793868.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户12320***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com