当前位置:主页 > 科技论文 > 软件论文 >

模糊层次聚类算法及在软件架构重构中的应用研究

发布时间:2019-01-21 20:49
【摘要】:大数据时代的到来,为我们带来了更多的知识。作为知识的发掘工具之一,数据挖掘(Data Mining,DM)技术一直是学者们研究的基础理论依托。层次聚类是DM中重要的研究部分,近些年来,层次聚类已经应用在了许多不同的研究领域。计算机技术日新月异,作为软件系统的主要成员——遗留系统,越来越难以适应复杂的软件功能需求,对遗留系统的取舍成为企业头疼的问题。不仅如此,遗留系统开发时间久远,开发文档丢失,系统内部功能结构紊乱,这些问题成为遗留系统后期维护和再开发的绊脚石。对遗留系统进行架构重构,成为解决以上问题的主要途径。目前,对软件系统进行架构重构的方法主要分为两类:(1)数学建模方法。(2)聚类的方法。其中,应用聚类进行软件架构重构的方法有两种:基于密度聚类的软件架构重构和基于层次聚类的架构重构。近些年来,基于层次聚类的软件架构重构成为遗留系统架构重构的主要方法。但是,该方法仍然存在两方面的问题:(1)实体与实体特征间的二元关系无法区分实体特征对实体的影响程度。(2)相似度基于距离计算的层次聚类效果差。针对以上的问题,本文在传统的层次聚类的基础上进行了改进,给出了基于信息损失的模糊层次聚类算法(Fuzzy Hierarchical Clustering algorithm Based on Information Loss,FHCBIL),该算法主要在实体特征权值分配和相似度计算方法上进行了改进,分别解决了传统层次聚类算法中实体与实体特征间的二元关系和实体划分准确性低的问题。本文进一步将FHCBIL算法应用在软件架构重构中,生成软件新架构,实现了软件架构的重构。本文主要有以下三方面的贡献:(1)构建基于模糊层次聚类的软件架构重构系统模型。针对基于层次聚类的软件架构重构后新架构的实体划分准确性不高的问题,本文融合了模糊关系与层次聚类,构建了基于模糊层次聚类的软件架构重构系统模型。该系统模型由软件系统的数据提取、模糊层次聚类、新架构评估三大模块组成。其中,软件系统的数据提取模块实现软件系统源代码转换和数据提取的功能;模糊层次聚类模块实现生成软件新架构的功能;新架构评估模块实现新架构的层次结构合理性和实体划分准确性评估的功能。(2)给出改进的模糊层次聚类算法FHCBIL。针对传统层次聚类在无法区分实体特征对实体影响程度和实体间划分准确性较低两方面的不足,本文给出相应的改进策略:一是扩充了实体特征的权值分配,将实体特征权值分为全局权值和局部权值,这样使实体特征以不同的隶属度从属于实体,实体与实体特征间由传统的二元关系变为模糊关系。二是将信息损失作为FHCBIL算法的相似度计算方法。基于以上策略,本文进一步给出改进的模糊层次聚类算法FHCBIL,该算法分为三部分:数据预处理、FHCBIL算法聚类、生成树形结构。在数据预处理部分,首先采用Z-score方法对数据集进行规范化处理。其次对规范化后的数据集进行实体特征权值的分配,构建实体特征向量。在聚类部分,首先选取每个数据对象作为簇中心。然后采用信息损失的方法计算实体间的相似度。最后合并相似度最大的实体,形成新的聚类簇。在生成树形结构部分,首先更新实体特征向量、聚类簇数及聚类层数。其次迭代合并实体直到聚类簇的数目和聚类层数达到给定的阈值。最后形成树形结构。(3)实现基于FHCBIL算法的软件架构重构系统。本文首先选取了面向对象的遗留系统。其次对选定的遗留系统进行源代码转换和数据提取。最后利用提取的数据集进行FHCBIL算法聚类,生成树形结构,实现基于FHCBIL算法的遗留系统架构重构。为了验证改进的模糊层次聚类算法FHCBIL的聚类性能以及基于FHCBIL算法的软件架构重构后新架构的质量,本文做了相应的评估。在FHCBIL算法聚类性能评价方面,实验选取JC系数(Jaccard Coefficient,JC)、FMI(Fowlkes and Mallows Index,FMI)、RI(Rand Index,RI)作为评估指标,使用选定的遗留系统的数据,与经典的聚类效果好的聚类算法进行对比实验与分析。实验结果表明:FHCBIL算法聚类性能好。在基于FHCBIL算法的软件架构重构后新架构质量的评估方面,实验应用几种常用的进行软件架构重构的层次聚类算法和FHCBIL算法实现软件架构重构,对比分析重构后新架构的层次结构以及实体划分准确率,实验结果表明:基于FHCBIL算法的软件架构重构后的新架构层次结构合理,内聚度高、耦合性低,并且新架构的实体间划分准确性高。
[Abstract]:......
【学位授予单位】:西南大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.5;TP311.13

【参考文献】

相关期刊论文 前10条

1 伍恒;李文杰;蒋e,

本文编号:2413026


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2413026.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2c523***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com