当前位置:主页 > 科技论文 > 自动化论文 >

基于集成学习的软件缺陷预测研究

发布时间:2025-01-04 00:54
  在科学技术迅速发展的今天,随着社会信息化建设不断推进,信息技术广泛应用,各行各业都离不开计算机软件的支持,软件的可靠性正逐渐成为人们关注的焦点。软件存在的缺陷越少,软件的可靠性就越高,系统也就越稳定。因此,软件缺陷预测是一个重要的研究课题。然而在实际研究中,经常因缺乏足够的标记样本导致预测模型得不到有效的训练。另外,缺陷样本集存在严重的类不平衡问题,数据分布不平衡影响模型的预测结果。同时,样本数据包含大量的冗余特征信息,这也会影响模型的预测性能。因此,本文综合考虑软件缺陷预测中常常遇到的标记样本不足、类不平衡和特征冗余问题,提出以下解决方案,并选用NASA、AEEEM和MORPH公开数据集开展实验:首先,针对缺陷数据的类不平衡问题,本文对数据集先做欠采样再做SMOTE过采样以降低数据的不平衡度。与不做数据采样的原始数据及随机欠采样、随机过采样、SMOTE过采样进行实验比对,证明了数据重采样的必要性和混合采样的有效性。其次,针对特征冗余问题,本文使用SMA优化算法选择最优特征。与不做特征选择的原始数据及PSO、GWO算法进行实验比对,证明了数据普遍存在冗余或无关特征的结论和SMA优化算法的...

【文章页数】:53 页

【学位级别】:硕士

【部分图文】:

图4-1.?HSRF算法的流程图??Fig.4-1?Flow?chart?of?HSRF?algorithm??

图4-1.?HSRF算法的流程图??Fig.4-1?Flow?chart?of?HSRF?algorithm??

?基宁集成學习的软件缺陷预测研宄???习器(即随机森林)。??这里需要指出的是,为了方便计算,运用SMOTE进行过采样时,将随机选择??的近邻个数设为10,?S:lE类样本的个数达到总体样本数的20%时,就停止采样。??HSRF算法的具体流程如图4-1所示:??^???1 ̄r??....


图5-1.算法的流程图??Fig.5-1?Algorithm?flow?chart??

图5-1.算法的流程图??Fig.5-1?Algorithm?flow?chart??

,FSCERS方法将基??于条件信息熵的属性约简技术与随机子空间融合在一起,能够同时发挥这两种特征??选择[58]技术的优势。FSCERS方法所选择的特征包括两个部分:一方面,利用基于??条件信息熵的属性约简技术来选择一部分特征,这部分特征能够保留初始特征集的??分类能力,从而保....


图2-1Bagging算法操作图

图2-1Bagging算法操作图

基于混合采样与集成学习的软件缺陷预测研究14输入样本扰动:基于原始数据集,构建多个数据子集,再利用不同的数据子集训练出不同的基分类器。常见方法为采样法。输入属性扰动:基于原始属性集,构建若干个属性子集,再利用不同的属性子集训练出不同的基分类器。该方法适用于数据集中包含较多冗余属性....


图5-1.ASP<sub>S</sub>tacking算法的流程图

图5-1.ASPStacking算法的流程图

基于混合采样与集成学习的软件缺陷预测研究44图5-1.ASP<sub>S</sub>tacking算法的流程图Fig.5-1ASP<sub>S</sub>tackingalgorithmflowdiagram如图5-1所示,ASP<sub>S</sub>tacking算法首先对初....



本文编号:4022650

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4022650.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a8a36***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com