当前位置:主页 > 科技论文 > 自动化论文 >

基于神经网络的软件缺陷分派和数据误用研究

发布时间:2020-07-18 07:45
【摘要】:为了方便地管理软件缺陷,许多大规模开源项目使用软件缺陷追踪系统,以缺陷报告的形式记录、管理缺陷。软件缺陷分派是软件缺陷管理中的重要步骤,目的是分派合适的开发人员修复缺陷。缺陷修复效率对软件质量有重要影响,而高效地修复缺陷需要及时准确地分派开发人员。在大规模开源项目中,不仅每天新增的缺陷报告数量多,而且项目中存在的开发人员数量也很多。因此,软件缺陷分派需要耗费大量人力成本和时间成本。为了提升缺陷分派的效率,许多研究提出预测修复人员的方法。其中最新的一类方法使用神经网络建立分类模型。但目前这类方法使用的数据集和参数设置都存在差异,难以进行对比。因此本文根据这类方法中模型的主要特点构建相似模型,并在同样的数据集和参数设置下进行实验,从而便于对比。此外,本文使用注意力机制、标签平滑尝试改进现有模型。最后,由于缺陷属性可能会随时间而变动,如果使用错误时间点的属性值进行测试,有导致模型效果虚高的风险。因此,本文使用不同时期的属性值来研究数据误用对模型效果的影响。本文的主要研究内容有:一、以缺陷基本属性如文本和组件为特征,使用卷积神经网络、循环神经网络和注意力机制构建模型。二、以缺陷派生属性组件内历史修复人员序列为特征构建模型,探索人员序列本身和根据人员序列计算的动态标签平滑对模型效果的影响。三、探索增加缺陷报告提交者特征对模型效果在整体上及不同类型缺陷报告上的影响。四、探索由属性变动导致的数据误用对模型效果的影响。本文的主要结论有:一、特征对模型效果的影响程度远大于网络类型对模型效果的影响程度。单独使用派生属性特征的模型就能得到比使用基本属性特征的模型更好的效果。二、动态标签平滑可以提升预测修复人员中靠后部分的准确率,静态标签平滑可以提升预测修复人员中靠前部分的准确率。三、加入缺陷提交者特征后的模型效果提升,基本来自于缺陷提交者同时为缺陷修复者的缺陷。由于提交者可以直接将缺陷分派给自己,因此在实际应用中这部分提升的价值有限。四、各种属性变动对模型效果都有明显影响,属性变动的影响程度从高到底依次为历史修复人员序列、组件、文本。
【学位授予单位】:武汉大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP311.53;TP183
【图文】:

缺陷,人员,组件,修改时间


2.1.1. 软件缺陷报告的属性图 2.1 Eclipse 中编号 160000 的软件缺陷报告基本信息图 2.1 所示的是 Eclipse 中编号 160000 的软件缺陷报告的基本信息。图 2.1中最上方是缺陷报告的编号与摘要。Status 代表缺陷报告所处的状态。Product 和Component 分别代表缺陷所属的产品及产品中的组件。一般来说,每个组件由一组的开发人员维护。Assignee 代表负责修复该缺陷的开发人员,即缺陷分派模型的预测目标。一份缺陷报告还包括报告提交者、提交时间和最近修改时间,这些信息记录在图 2.1 右上方的 Reported 和 Modified 属性中。CC List 表示对该缺陷有兴趣的用户。

示意图,附件,示例,缺陷


武汉大学硕士学位论文8图 2.2 为软件缺陷报告的附件列表示意图,可以看到附件中的内容有截图、补丁和测试等多种类型。图 2.2 软件缺陷报告附件列表示例图 2.3 为缺陷报告的描述与评论区域,Description 为报告提交者在提交报告时对缺陷的描述,项目开发者通过阅读 Description 的内容理解和重现缺陷。Comment 部分记录了报告提交者和项目开发人员的交流过程。图 2.3 Eclipse 中编号 160000 的软件缺陷报告描述与评论除此之外,软件缺陷追踪系统中还记录了缺陷报告属性的变更记录,它们保存在如图 2.4 所示的缺陷报告属性变更记录表中。当缺陷报告提交后,基本属性的变化都会记录在该表格中。缺陷报告的摘要、组件、分派者等属性都可能发生变化并被记录。

缺陷,变更记录表,变更记录,软件缺陷


8除此之外,软件缺陷追踪系统中还记录了缺陷报告属性的变更记录,它们保存在如图 2.4 所示的缺陷报告属性变更记录表中。当缺陷报告提交后,基本属性的变化都会记录在该表格中。缺陷报告的摘要、组件、分派者等属性都可能发生变化并被记录。

【相似文献】

相关期刊论文 前10条

1 王铁建;吴飞;荆晓远;;基于多核字典学习的软件缺陷预测[J];计算机科学;2017年12期

2 刘柯宏;刘晓建;;开源程序的软件缺陷分布特征的量化分析研究[J];电子元器件与信息技术;2017年04期

3 胡柳;邓杰;赵正伟;李瑞;;一种基于关联规则的网络软件缺陷预测方法[J];信息技术与网络安全;2018年04期

4 杨开懋;施小逸;汤恩义;;基于爬虫的软件缺陷预测[J];南昌教育学院学报;2016年06期

5 傅艺绮;董威;尹良泽;杜雨晴;;基于组合机器学习算法的软件缺陷预测模型[J];计算机研究与发展;2017年03期

6 甘露;臧洌;李航;;深度信念网软件缺陷预测模型[J];计算机科学;2017年04期

7 张志武;荆晓远;吴飞;;基于二次学习的半监督字典学习软件缺陷预测[J];模式识别与人工智能;2017年03期

8 李勇;黄志球;王勇;房丙午;;数据驱动的软件缺陷预测研究综述[J];电子学报;2017年04期

9 朱朝阳;陈相舟;闫龙;张信明;;基于主成分分析法的人工免疫识别软件缺陷预测模型研究[J];计算机科学;2017年S1期

10 孟浩;邓惠文;黄永兢;;基于软件生命周期的软件缺陷预防流程研究[J];电脑编程技巧与维护;2017年12期

相关会议论文 前10条

1 赵修湘;石勇;刘莹;张玲玲;;文本分类在软件缺陷管理中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年

2 赵亮;侯金宝;;文件和包层次的软件缺陷预测研究[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年

3 于秀山;王广俭;;软件缺陷管理[A];中国电子学会可靠性分会第十三届学术年会论文选[C];2006年

4 寇纲;彭怡;石勇;;基于数据挖掘的软件缺陷度量评估管理及研究现状综述[A];第三届(2008)中国管理学年会——信息管理分会场论文集[C];2008年

5 李立清;;用软件缺陷数据进行缺陷预测[A];中国工程物理研究院科技年报(2005)[C];2005年

6 张志刚;赵静;张苓琳;;基于语义分析的软件缺陷自动检测技术研究[A];第五届中国指挥控制大会论文集[C];2017年

7 高通;焦彦平;龚波;;基于曲线拟合的软件缺陷排除成本预测[A];2010年全国通信安全学术会议论文集[C];2010年

8 涂亚明;毛军鹏;余静;尹磊;;系统测试阶段的软件缺陷预测模型分析[A];第六届中国测试学术会议论文集[C];2010年

9 宋建伟;谢t

本文编号:2760614


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2760614.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d0456***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com