当前位置:主页 > 科技论文 > 自动化论文 >

基于机器学习的软件缺陷预测方法研究

发布时间:2018-05-31 21:16

  本文选题:机器学习 + 软件缺陷预测 ; 参考:《中国矿业大学》2017年博士论文


【摘要】:随着软件规模的不断扩大和复杂度增加,软件维护的难度也日益增大。在软件开发和维护过程中,不可避免地会产生各种各样的缺陷。软件缺陷是影响软件质量的首要因素,如果软件产品中存在缺陷,在软件运行过程中有可能会造成软件失效,甚至导致软件崩溃。软件测试能够发现软件产品中存在的缺陷,但过量的测试又会影响软件的开发进度,增加开发成本。软件缺陷预测是软件测试中的一项重要工作,主要是根据历史数据来预测软件中潜在的缺陷,从而合理分配测试资源,提高测试工作效率。近年来,软件缺陷预测在软件工程领域引起了研究者的广泛关注,基于机器学习的软件缺陷预测方法也成为研究的热点。针对面向分类任务的有监督缺陷预测中存在的关键问题,如项目内缺陷预测中的特征选择、分类不平衡影响和演化信息利用不充分,跨项目缺陷预测中的不相关或冗余特征,以及跨公司缺陷预测中的特征异构等,本论文主要研究基于机器学习的软件缺陷预测的新技术、新方法,旨在进一步提高缺陷预测性能。具体研究内容如下:(1)针对软件缺陷预测中不同特征与类别(有缺陷或无缺陷)的相关性差异,提出一种基于相似性度量的特征选择方法。根据不同类别样本间的相似性和特征差值来更新特征权重,按照特征权重降序排列得到一个特征排序列表,然后根据特征排序列表依次选择所有特征子集,并分别评价它们的分类性能。与四种特征选择方法进行比较,结果表明,提出的特征选择方法的性能优于或相当于对比方法。(2)为了探究分类不平衡对软件缺陷预测模型性能的影响程度,提出一种分类不平衡影响分析方法。通过设计一种新数据集构造算法,将原不平衡数据集转化为一组不平衡率依次递增的新数据集,并选取典型的预测模型对新数据集进行预测,从而评价各个预测模型在分类不平衡时的性能稳定程度,同时还评价了代价敏感模型和集成模型在分类不平衡时的性能稳定程度。(3)针对面向对象程序的演化信息,从历史包的缺陷率和类的变更程度角度提出了两个演化度量元,并采用特征选择方法比较代码度量元和演化度量元与类别的相关性。结果表明,与代码度量元相比,提出的演化度量元与类别的相关性相对较高,且加入提出的演化度量元能够有效提高缺陷预测性能。(4)针对跨项目数据集中的不相关或冗余特征,提出一种基于特征选择的跨项目缺陷预测方法。采用特征子集选择和特征排序两种方法,验证特征选择对于跨项目缺陷预测的有效性。结果表明,与项目内缺陷预测类似,特征选择也能够在一定程度上提高跨项目缺陷预测的性能。(5)针对跨公司数据集间的特征异构问题,提出一种基于特征迁移的跨公司缺陷预测方法。首先,根据不同特征分布曲线的“距离”设计一种特征匹配算法,将异构特征转化为匹配特征。然后,采用迁移学习方法将源项目中的特征信息迁移到目标项目中相匹配的特征上,实现跨公司缺陷预测。最后,设计大量实验来验证该方法的有效性,同时讨论了该方法在不同影响因素下的性能。综上所述,本论文旨在利用机器学习中的理论和方法解决软件缺陷预测中的实际问题,不仅丰富和拓宽了机器学习理论的应用领域,还提高了机器学习方法的应用价值,更为软件缺陷预测提供了新的研究思路,对于提高软件质量和软件可靠性具有重要意义。
[Abstract]:In the process of software engineering , a new data set based on similarity measure is proposed . ( 4 ) Aiming at unrelated or redundant features in cross project data set , a cross project defect prediction method based on feature selection is proposed . A feature matching algorithm is designed based on feature subset selection and feature ranking .
【学位授予单位】:中国矿业大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP181;TP311.5

【相似文献】

相关期刊论文 前10条

1 ;常用软件缺陷威胁因特网[J];佛山陶瓷;2001年02期

2 ;软件缺陷词典正在制定[J];软件世界;2007年06期

3 王德胜;宫云战;;论软件缺陷[J];计算机应用研究;2008年12期

4 聂剑平;韩柯;陈光;曹旭;;软件缺陷增长过程的混沌分析[J];计算机工程与应用;2008年11期

5 刘海;郝克刚;;软件缺陷数据的分析方法及其实现[J];计算机科学;2008年08期

6 熊斐;李建忠;徐中望;;软件缺陷管理与防范[J];科技创新导报;2009年04期

7 石剑飞;杨欣;秦玮;闫怀志;;一种软件缺陷预测改进模型的研究[J];北京理工大学学报;2010年09期

8 缪林松;;基于代价敏感神经网络算法的软件缺陷预测[J];电子科技;2012年06期

9 朱小燕;曲俊燕;;浅析软件缺陷的问题[J];无线互联科技;2013年04期

10 田华;蒲天银;;基于迁移学习的软件缺陷预测方法研究[J];西南师范大学学报(自然科学版);2014年03期

相关会议论文 前8条

1 赵修湘;石勇;刘莹;张玲玲;;文本分类在软件缺陷管理中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年

2 李立清;;软件缺陷数据的分析和预测[A];第三届中国测试学术会议论文集[C];2004年

3 李立清;;用软件缺陷数据进行缺陷预测[A];中国工程物理研究院科技年报(2005)[C];2005年

4 赵亮;侯金宝;;文件和包层次的软件缺陷预测研究[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年

5 于秀山;王广俭;;软件缺陷管理[A];中国电子学会可靠性分会第十三届学术年会论文选[C];2006年

6 寇纲;彭怡;石勇;;基于数据挖掘的软件缺陷度量评估管理及研究现状综述[A];第三届(2008)中国管理学年会——信息管理分会场论文集[C];2008年

7 高通;焦彦平;龚波;;基于曲线拟合的软件缺陷排除成本预测[A];2010年全国通信安全学术会议论文集[C];2010年

8 涂亚明;毛军鹏;余静;尹磊;;系统测试阶段的软件缺陷预测模型分析[A];第六届中国测试学术会议论文集[C];2010年

相关重要报纸文章 前7条

1 谢敏、戴金龙;追踪每一个软件缺陷[N];计算机世界;2005年

2 学健;可怕的不是缺陷本身[N];计算机世界;2001年

3 ;Firefox、IE中发现缺陷[N];计算机世界;2005年

4 道琼斯;小电脑 大雄心[N];人民邮电;2007年

5 特约撰稿 朱颜镇;万维易化项目管理力助电信运营商[N];通信信息报;2004年

6 ;Microsoft计划推出Windows Server SP1[N];计算机世界;2004年

7 记者 王俊鸣;美专家认为因特网中枢有漏洞[N];科技日报;2001年

相关博士学位论文 前9条

1 于巧;基于机器学习的软件缺陷预测方法研究[D];中国矿业大学;2017年

2 Gabriel Kofi Armah;[D];电子科技大学;2015年

3 王伟光;动态软件缺陷测试关键技术研究[D];南京大学;2016年

4 陈琳;基于机器学习的软件缺陷预测研究[D];重庆大学;2016年

5 陈媛;基于数据挖掘的软件缺陷预测技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年

6 马樱;基于机器学习的软件缺陷预测技术研究[D];电子科技大学;2012年

7 单纯;软件缺陷分布预测技术及应用研究[D];北京理工大学;2015年

8 张凯;软件缺陷混沌分形描述与软件质量进化度量的研究[D];武汉理工大学;2005年

9 杨晓杏;基于度量元的软件缺陷预测技术[D];中国科学技术大学;2014年

相关硕士学位论文 前10条

1 赵长凯;软件缺陷管理与预测系统的设计[D];复旦大学;2013年

2 张亮;基于改进BP算法的软件缺陷预测模型研究[D];北京理工大学;2015年

3 王男帅;基于遗传优化支持向量机的软件缺陷预测模型研究[D];北京理工大学;2015年

4 陈艳;软件缺陷管理技术研究与实现[D];电子科技大学;2014年

5 李碧雯;基于迁移学习的跨项目软件缺陷预测[D];上海交通大学;2015年

6 梁天超;一种基于人工免疫朴素贝叶斯方法的软件缺陷预测模型[D];南京邮电大学;2015年

7 陈家强;软件缺陷预测中数据预处理技术研究[D];南京大学;2014年

8 江晓苏;鱼群优化的多核支持向量机在软件缺陷预测中的应用[D];重庆师范大学;2016年

9 权衡;基于Web的软件缺陷管理系统的设计与实现[D];华中科技大学;2014年

10 刘庆山;基于复杂网络的动态软件缺陷预测算法研究[D];燕山大学;2016年



本文编号:1961309

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1961309.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户22370***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com