基于深度自编码网络的软件缺陷预测方法与实现
发布时间:2024-02-20 06:02
软件规模和复杂度的不断增长给软件数据带来了大量缺陷,而含有缺陷的软件在运行时会造成难以想象的后果,严重时甚至会给社会带来巨大的经济损失。因此如何提升软件质量目前成为软件工程领域中最为重要的问题。软件缺陷预测技术能在软件开发初期,及时准确地预测出软件模块是否具有缺陷,帮助测试人员合理有效地分配有限的测试资源,降低软件维护成本,进而提高软件质量。软件缺陷预测方法的预测效果与数据集自身的特点有着密切的相关性,通过研究发现,目前软件缺陷预测过程中常出现缺陷数据分布不平衡、特征信息冗余以及特征维度过大的问题。针对这些问题,结合深度学习对数据特征强大的学习能力,本文提出了基于深度自编码网络的软件缺陷预测方法。本文使用的这种方法包括一种基于无监督学习和随机采样的混合采样方法,解决了数据集中类不平衡问题,同时使用深度自编码网络的数据特征进行降维,有效提升了数据样本的质量,进而提升缺陷预测模型的性能。主要工作内容如下:1)阅读了大量国内外相关文献,总结当前软件缺陷预测过程中常见的挑战,包括软件缺陷数据不规则、缺陷数据分布不平衡以及特征信息冗余等问题。2)提出了一种基于无监督学习和随机采样的采样方法,该方...
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
本文编号:3903951
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
图2.1软件缺陷技术分类Fig2.1Classificationofdefectpredictiontechniques
图2.1软件缺陷技术分类Fig2.1Classificationofdefectpredictiontechniques①静态缺陷预测技术:根据发展历史,可以分为基于度量元的缺陷预测技术、缺陷分布预测技术和缺陷预测模型技术。1)基于度量元的缺陷预测技术:软件度量元....
图2.2特征选择过程
庆大学硕士学位论文2相关理论基X=X(2用m个最小的非零特征值对应的特征向量作为最后数输出结果,即经过LPP后的投影矩阵。.2.2特征选择特征选择技术主要是从原始特征中选出一个子集,得到数据更加紧凑的表样也是软件缺陷预测领域中解决软件数据维数....
图2.3筛选器原理
随机产生序列选择算法(简称(简称GA)。随机产生序列选择算法选择,首先随机产生一个特征子集FS和SBS贪心算法的局部最优解。局部最优的缺陷,如若最优解区域用评价函数给特征子集评分,然后特征子集被选中繁殖的概率依赖于ationFunction):依据工作原理,(Wrapp....
图2.4封装器原理
息增益度量基于信息熵,信息熵的合元素分布越紊乱,信息熵越大。前分类标签D的信息熵,计算公式()=щ()D的概率。然后计算选用特征后()=щ(式(2.17):(....
本文编号:3903951
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3903951.html