当前位置:主页 > 科技论文 > 软件论文 >

基于机器学习的软件缺陷预测方案研究

发布时间:2021-05-05 17:34
  随着网络科技的快速发展,用户对于软件的质量也提出了更高的要求。软件缺陷是影响软件质量的最大因素,软件缺陷的检测成为软件上线前的必经步骤。然而通常一个软件的体量非常巨大,如果要检查全部软件代码,花费的成本也是巨大的。软件缺陷预测的提出正是为了解决这一问题,将检测的人力物力更好的分配到可能有缺陷的地方,既可以提高效率又可以节省成本。本文针对基于机器学习的软件缺陷预测中对特征关联性考虑不足和无标签预测问题深入研究,从多个角度入手以提高预测的曲线下面积(Area Under Curve,AUC)指标,相比准确率指标更好的表达较少的有缺陷类的预测效果。论文主要成果有:首先,针对软件缺陷预测中分类的不平衡性,即与正常代码部分相比有缺陷的部分往往占少数,提出了新型的上采样方案。方案中增加了类内离散度信息与支持向量清洗策略,使得新样本分布更均匀。通过与多个上采样方案在多个软件缺陷预测中流行的机器学习方法上进行实验对比,证明了所提出的上采样方案取得了更高的AUC值。其次,从特征入手,根据每个特征对最终预测效果的影响程度对原有的特征进行筛选,提出一套特征筛选与预测为一体的方案。方案分别从正向增加特征与反向... 

【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景与意义
    1.2 研究现状
        1.2.1 采样方法的研究现状及在软件缺陷预测中的应用
        1.2.2 特征选择在软件缺陷领域的研究现状
        1.2.3 无标签软件缺陷预测的研究现状
    1.3 论文主要工作
    1.4 论文的组织结构
第二章 软件缺陷预测关键技术
    2.1 特征提取方法
    2.2 评价指标
    2.3 采样技术
    2.4 特征降维方法
    2.5 本文机器学习方法
第三章 基于类内离散度的上采样方法
    3.1 上采样方案
        3.1.1 概述
        3.1.2 上采样方案步骤
        3.1.3 类内离散度
        3.1.4 支持向量调整比例
        3.1.5 ENN数据清洗
    3.2 实验与分析
        3.2.1 数据与评价指标
        3.2.2 实验设计
        3.2.3 实验结果分析
    3.3 本章小结
第四章 自动特征子集选择方案
    4.1 引言
    4.2 特征分析与特征子集
        4.2.1 选择独立特征
        4.2.2 特征子集选择优化
    4.3 结合随机森林的特征子集选择方案
        4.3.1 方案整体介绍
        4.3.2 随机森林分类器的融入
    4.4 结合类内离散度上采样的向前特征子集选择
    4.5 实验与分析
        4.5.1 实验流程
        4.5.2 结果分析
    4.6 本章小结
第五章 PCLAI无监督缺陷预测方法
    5.1 改进CLAMI的模型
        5.1.1 CLAMI缺陷分析
        5.1.2 改进的无监督标记方法PCLAI
    5.2 实验与分析
        5.2.1 实验设计
        5.2.2 结果分析
    5.3 本章小结
第六章 总结与展望
    6.1 工作总结
    6.2 展望
参考文献
致谢
攻读学位期间发表的学术论文


【参考文献】:
期刊论文
[1]SBFS:基于搜索的软件缺陷预测特征选择框架[J]. 陈翔,陆凌姣,吉人,魏世鑫.  计算机应用研究. 2017(04)
[2]基于ADASYN与AdaBoostSVM相结合的不平衡分类算法[J]. 柳培忠,洪铭,黄德天,骆炎民,王守觉.  北京工业大学学报. 2017(03)
[3]一种半监督集成跨项目软件缺陷预测方法[J]. 何吉元,孟昭鹏,陈翔,王赞,樊向宇.  软件学报. 2017(06)
[4]基于不平衡数据集的软件缺陷预测[J]. 张晓风,张德平.  计算机应用研究. 2017(07)
[5]软件缺陷预测中基于聚类分析的特征选择方法[J]. 刘望舒,陈翔,顾庆,刘树龙,陈道蓄.  中国科学:信息科学. 2016(09)
[6]静态软件缺陷预测方法研究[J]. 陈翔,顾庆,刘望舒,刘树龙,倪超.  软件学报. 2016(01)
[7]面向不平衡数据集的改进型SMOTE算法[J]. 王超学,张涛,马春森.  计算机科学与探索. 2014(06)
[8]特征选择方法综述[J]. 姚旭,王晓丹,张玉玺,权文.  控制与决策. 2012(02)



本文编号:3170299

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3170299.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f181f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com