当前位置:主页 > 科技论文 > 软件论文 >

基于SVN日志的软件过程活动实时挖掘研究

发布时间:2020-06-23 18:15
【摘要】:大数据技术面临的挑战是如何将数据转换为真正的价值。目前,大数据被过多的关注数据的存储和处理问题而忽视了过程。过程挖掘技术在传统的基于模型的数据分析如仿真技术和业务流程管理技术等和基于数据的分析技术如机器学习和数据挖掘等之间搭建了桥梁,它既关注了过程,也使用了真实数据,它可以用来主动学习一些人类真实进行的行为性模型。现有的过程挖掘技术不能直接应用在软件过程挖掘中。为解决软件过程挖掘工作中过程日志缺少活动属性的问题,提出了一种动态实时的软件过程活动挖掘方法。该方法立足事件与活动的关联关系,从软件过程SVN日志文件中抽取日志事件记录,并对事件记录进行结构化处理,再通过对向量化的事件信息进行聚类来发现这些事件包含的语义信息,发现活动标签,并依据该标签构造分类器对新的数据进行活动映射,将无监督学习变为有监督学习,实现活动属性的挖掘与映射,最后利用准确率、召回率以及调和平均值对映射结果进行评价。实验使用真实的软件过程日志数据集,并对比之前研究提出方法的结果,最后表明该方法可以进行软件过程日志活动挖掘且映射类别的平均准确率、召回率、调和平均值(参数分别取0.5、1、1.5)分别达到0.85、0.87、0.83、0.84、0.85,证明方法的有效性。本文研究中的创新点主要有如下几点:(1)在软件过程挖掘中开拓了从关联关系研究过程挖掘的新思路;(2)解决了软件过程日志事件缺乏活动信息的问题以及对其活动进行有效的归类,同时保证了整个活动挖掘的动态实时性;(3)解决聚类数确定,增加分类器的评价维度使得评价结果更加客观。
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.5;TP181
【图文】:

基于SVN日志的软件过程活动实时挖掘研究


传统事件日志与SVN日志数据间结构对比图

基于SVN日志的软件过程活动实时挖掘研究


向量化部分结果展示图

【参考文献】

相关期刊论文 前5条

1 杨丽琴;康国胜;郭立鹏;田朝阳;张亮;张笑楠;高翔;;一种适用于多样性环境的业务流程挖掘方法[J];软件学报;2015年03期

2 王千;王成;冯振元;叶金凤;;K-means聚类算法研究综述[J];电子设计工程;2012年07期

3 曾庆田;;过程挖掘的研究现状与问题综述[J];系统仿真学报;2007年S1期

4 姜园,张朝阳,仇佩亮,周东方;用于数据挖掘的聚类算法[J];电子与信息学报;2005年04期

5 杨芙清;软件工程技术发展思索[J];软件学报;2005年01期

相关博士学位论文 前1条

1 朱锐;数据驱动的软件开发过程挖掘与分析研究[D];云南大学;2016年

相关硕士学位论文 前1条

1 袁艳红;基于Word2Vec语言模型与图核设计的文本分类研究[D];西南大学;2016年



本文编号:2727713

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2727713.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b9b16***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com