代价敏感的混合软件缺陷预测模型
发布时间:2021-04-11 16:03
在互联网的高速发展时代,软件的规模和复杂度不断增大,软件中存在的缺陷如果不被及时发现,可能会对相关领域产生巨大的影响。因此,在软件尚未发布之前,找到隐藏在软件中的缺陷是一个急需解决的问题。在软件缺陷预测上,机器学习算法发挥着重要作用,有着较好的效果,但是在现实的软件项目中,软件缺陷预测依然存在如下几个问题。(1)测试软件模块代价太高,只能对少数的软件模块进行测试,即只有少数的数据样本被贴上标签;(2)不同的错分带来的代价不一致,将有缺陷的数据样本判断为没有缺陷明显比把没有缺陷的数据样本判断为有缺陷的代价大;(3)软件缺陷预测的数据集具有类不平衡的特点,有缺陷的数据样本只占少数;(4)现有的缺陷预测模型没有考虑源代码中隐含的语义信息。本文针对上述问题,提出了一种基于代价敏感的混合软件缺陷预测模型,主要工作内容如下:1.提出改正的半监督支持向量机,采用十折交叉验证法抽取训练数据集和测试数据集,进行多次重复实验,避免出现偶然性;同时半监督支持向量机能够利用少量标签数据样本和大量没有标签数据样本一起构建缺陷预测模型。2.提出基于代价敏感的支持向量机,通过给予“将有缺陷数据样本预测为没有缺陷”较...
【文章来源】:云南大学云南省 211工程院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
传统的软件缺陷预侧模型
图3.1特征定位过程??12??
图4.?1建模过程??
【参考文献】:
期刊论文
[1]基于LDA的软件代码主题摘要自动生成方法[J]. 李文鹏,赵俊峰,谢冰. 计算机科学. 2017(04)
[2]基于DA-SVM的软件缺陷预测模型[J]. 甘露,臧洌,李航. 计算机与现代化. 2017(02)
[3]利用RNNLM面向主题的特征定位方法[J]. 尹春林,王炜,李彤,何云,熊文军,周小煊. 计算机科学与探索. 2017(10)
[4]基于混合余弦相似度的中文文本层次关系挖掘[J]. 董洋溢,李伟华,于会. 计算机应用研究. 2017(05)
[5]源代码变量名的自动语义标注[J]. 陈凯,沈备军,王永剑,金波. 计算机应用研究. 2016(11)
[6]静态软件缺陷预测方法研究[J]. 陈翔,顾庆,刘望舒,刘树龙,倪超. 软件学报. 2016(01)
[7]演化软件的特征定位方法[J]. 韩俊明,王炜,李彤,何云. 计算机科学与探索. 2016(09)
[8]基于主题建模和静态分析技术的软件代码功能性主题获取方法[J]. 李萌,赵俊峰,谢冰. 中国科学:信息科学. 2014(01)
本文编号:3131556
【文章来源】:云南大学云南省 211工程院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
传统的软件缺陷预侧模型
图3.1特征定位过程??12??
图4.?1建模过程??
【参考文献】:
期刊论文
[1]基于LDA的软件代码主题摘要自动生成方法[J]. 李文鹏,赵俊峰,谢冰. 计算机科学. 2017(04)
[2]基于DA-SVM的软件缺陷预测模型[J]. 甘露,臧洌,李航. 计算机与现代化. 2017(02)
[3]利用RNNLM面向主题的特征定位方法[J]. 尹春林,王炜,李彤,何云,熊文军,周小煊. 计算机科学与探索. 2017(10)
[4]基于混合余弦相似度的中文文本层次关系挖掘[J]. 董洋溢,李伟华,于会. 计算机应用研究. 2017(05)
[5]源代码变量名的自动语义标注[J]. 陈凯,沈备军,王永剑,金波. 计算机应用研究. 2016(11)
[6]静态软件缺陷预测方法研究[J]. 陈翔,顾庆,刘望舒,刘树龙,倪超. 软件学报. 2016(01)
[7]演化软件的特征定位方法[J]. 韩俊明,王炜,李彤,何云. 计算机科学与探索. 2016(09)
[8]基于主题建模和静态分析技术的软件代码功能性主题获取方法[J]. 李萌,赵俊峰,谢冰. 中国科学:信息科学. 2014(01)
本文编号:3131556
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3131556.html