当前位置:主页 > 科技论文 > 软件论文 >

基于知识图谱的bug分析技术研究与系统实现

发布时间:2021-09-25 04:42
  软件bug问题在软件开发与维护过程中不可避免。随着软件项目规模的扩大及软件复杂性的增加,不断出现新的bug问题,bug修复成了一项充满难度和挑战的工作。软件历史库中bug报告与commit提交信息数量越积越多,对这些信息进行管理和搜索也变得越来越困难。由于bug报告与commit信息被管理在分开的两个系统中,且它们之间常常存在着关联关系缺失等问题。因此,当开发人员在bug库中对bug信息进行搜索时,不仅会耗费许多时间且得到的信息并不全面。在问答网站中寻求答案,也不能及时得到回复,这都导致bug问题不能及时被修复。本文针对这些问题,构建了 bug知识库。后又在此基础上构建了 bug知识图谱帮助开发人员搜索bug问题。不仅能为开发人员提供更全面的信息,更提高了开发人员解决bug问题的效率。本文工作主要集中在以下几个方面:(1)对bug库及commit库中数据进行分析,整合bug报告及commit信息,挖掘bug报告及commit中的显示关系、隐式关系,构建bug知识库。(2)针对数据更新时间随bug数量增加而越来越长的问题,利用一种终身主题模型技术实现对bug知识库的自动更新。(3)针对现... 

【文章来源】:扬州大学江苏省

【文章页数】:73 页

【学位级别】:硕士

【部分图文】:

基于知识图谱的bug分析技术研究与系统实现


buy报告裁图

信息,开发人员,标题信息,扬州大学


4?扬州大学硕士学位论文???时描述修改的内容,以便其他开发人员查看交流。因此,Git库中的commit详细地记录了??bug修复的相关信息,其中包括commit的标题信息、commit?ID、提交人、提交日期及源??代码中修改的内容。GitHub[14]*管理的Mozilla@Bugzilla项目的commit信息截图如图1.3??所不。本文通过分析挖掘这些commit信息建立bug报告、开发人员与commit间的bug知??,u。??

查准率,方法


与搜索的内容相似或相关,参评者将会判定该bug信息是相关的。然后,他们将会对相关??bug信息进行计数。最终通过统计会分别计算出两种方法的查准率。??图3.2和表3-1显示了两种方法查准率的比较。在图3.2中,蓝色折线代表了本文方法??的查准率整体情况,橘色折线代表了使用聚类方法实现丁具搜索结果的查准率的整体情??况,每个点都代表了一个bug问题搜索结果的查准率。正如图3.2所显示的,本文使用LTM??模型构建知识库的方法的大部分查准率相比于使用聚类方法的要更高。在表3-1中,我们??可以发现本文方法实现的工具的平均查准率为64.53%,而使用聚类方法实现的工具的平均??查准率为20.30%。造成这一结果的原因是,本文方法是结合LTM模型对bug库进行构建??的,LTM模型是从bug报告、commit数据中提取主题,并根据主题的分布对这些bug信??


本文编号:3409110

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3409110.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2c831***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com