当前位置:主页 > 科技论文 > 软件论文 >

基于特征选择的软件缺陷预测方法研究

发布时间:2025-01-17 15:19
  软件测试是根据需求文档等,对被测试的软件通过人工或测试工具的方式,来检测软件是否满足预期的过程,在软件开发周期中起着重要作用,是确保软件质量的不可缺少的一个过程。软件测试的目的是发现软件中尚未发现的缺陷。越早发现的缺陷,缺陷造成的影响和损失就越小,其修复成本也越低。但是,在尽可能多地发现软件缺陷的同时需要降低投入成本和保证研发进度,手工测试的方法已经不能满足这种需求。软件缺陷预测技术可以利用历史数据预先辨别出可能存在缺陷的软件模块,针对缺陷高风险模块投入更多的测试资源,从而保障软件的质量和测试效率。目前的软件功能和规模的剧增,导致数据集有高维等特点,容易造成维度爆炸问题。而软件特征中存在无用的特征,在构建缺陷预测模型时不起作用甚至起到反作用,影响模型的分类性能。特征选择是指从已有的原始特征中选择少数最有效的特征,降低数据集的维度的过程。在缺陷预测模型中使用特征选择可以很好地剔除缺陷数据集中的无关和冗余特征,从而提高预测模型的分类能力。本文在特征选择方法的基础上,针对数据集中存在的无关特征和冗余特征,在集成的特征排序选择和聚类特征选择方面开展了一系列研究。本文研究工作的主要内容包括以下两个...

【文章页数】:53 页

【学位级别】:硕士

【部分图文】:

图1.2类不平衡学习(1)数据层面的方法

图1.2类不平衡学习(1)数据层面的方法

第1章绪论7图1.2类不平衡学习(1)数据层面的方法数据层面的方法主要是对数据进行重采样来平衡数据集。重采样主要分为过采样、欠采样以及两者结合的采样方法。其中,过采样方法是通过增加不平衡数据集中少数类的样本,使其数量与多数类相同;欠采样方法是通过减少不平衡数据集中的多数类样本,使....


图2.1软件缺陷预测框架

图2.1软件缺陷预测框架

第2章相关理论与技术分析15块,针对缺陷高风险模块投入足够的测试资源进行软件测试,以保证软件产品的质量并提升软件测试的效率。软件缺陷预测主要包含的步骤有:(1)获取历史缺陷数据;(2)数据预处理;(3)特征选择;(4)训练软件缺陷预测模型;(5)使用模型预测新数据。本文研究内容主....


图2.2特征选择过程

图2.2特征选择过程

西南大学硕士学位论文


图2.3ROC曲线

图2.3ROC曲线

第2章相关理论与技术分析21=+(2-3)查全率(recall)是指正确预测为正类的样本数占实际为正类的样本数的百分比,也叫敏感度。表示的是真实有缺陷的模块中,被预测出来有缺陷的模块占多大比例。查全率的计算公式为:=+(2-4)F-值(F-measure)是精确率和查全率的调和平....



本文编号:4028237

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/4028237.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7aa45***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com