基于集成学习的软件缺陷预测方法研究
发布时间:2022-01-02 12:37
在软件工程领域中软件缺陷预测技术能有效地辅助软件测试、保障软件产品质量和增强软件的安全性。本文结合软件度量方法和集成学习算法对缺陷代码进行研究,提出了基于不平衡率阈值移动的异质集成算法和基于递归特征消除的极端随机树特征选择算法来预测软件源代码的缺陷,主要内容如下:首先,分析了软件缺陷预测的研究现状,对软件安全缺陷库中不同类型的缺陷进行了研究,采用结构化的软件度量方法预测软件缺陷,结合集成学习方法研究软件缺陷预测中类不平衡的问题,针对软件缺陷中最危险的内存安全缺陷结合搜索策略进行特征分析。其次,为了解决软件缺陷预测中缺陷代码不平衡的问题,本文提出一种基于不平衡率阈值移动的异质集成算法。通过引入异质集成算法思想,在不影响缺陷数据分布的前提下,将决策树和逻辑回归算法作为基分类器进行模型融合,增加基分类器结构的多样性,并结合缺陷历史数据的不平衡率进行阈值移动,有效地提高了集成算法预测软件缺陷的准确性。再次,为了分析软件内存安全缺陷的特征,本文从函数级别对缺陷代码进行结构化度量,提取基于数据流分析的函数类别,提出一种基于递归特征消除的极端随机树特征选择算法。通过引入启发式规则,来分析内存安全缺陷...
【文章来源】:燕山大学河北省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
缺陷、错误、故障、失效基本关系图
第 2 章 软件缺陷预测的相关分析的错误数,定义如式(2-7)所示,Halst的容量成正比。3000VB 中操作符的总数,2N 为程序中操作数作数类型的数目。法根据软件拓扑结构来衡量复杂程度,够通过计算流程图上的数据流条数和数如图 2-2 所示。这些复杂度主要包含了等。
燕山大学工学硕士学位论文软件度量得到的指标建立缺陷预测模型,进一步挖掘软件缺陷与度联关系,可以有效的指导软件开发和软件测试,保障软件产品的质件缺陷预测模型ll 等人[33]对度量指标与缺陷的关系提出了有效的论述,一般在软件缺,首先通过软件度量的方法对软件的旧版本进行量化,生成度量数后基于机器学习、统计学习或其他方法建立缺陷预测的模型,最后型对未标记的模块进行预测。基本框架如图 2-3 所示,它能够有效陷的历史信息,为软件开发提供有利的决策。
【参考文献】:
期刊论文
[1]集成学习方法:研究综述[J]. 徐继伟,杨云. 云南大学学报(自然科学版). 2018(06)
[2]基于改进Adaboost软件缺陷数据特征选择方法[J]. 李克文,邹晶杰. 计算机工程与设计. 2017(11)
[3]一种面向软件缺陷预测的相似性度量特征选择方法(英文)[J]. Qiao YU,Shu-juan JIANG,Rong-cun WANG,Hong-yang WANG. Frontiers of Information Technology & Electronic Engineering. 2017(11)
[4]基于Boosting的代价敏感软件缺陷预测方法[J]. 杨杰,燕雪峰,张德平. 计算机科学. 2017(08)
[5]基于组合机器学习算法的软件缺陷预测模型[J]. 傅艺绮,董威,尹良泽,杜雨晴. 计算机研究与发展. 2017(03)
[6]面向软件缺陷预测的聚类欠采样集成方法[J]. 陆鹏程,邱建林,卞彩峰,陈璐璐,陈翔. 计算机工程与设计. 2016(07)
[7]分类不平衡对软件缺陷预测模型性能的影响研究[J]. 于巧,姜淑娟,张艳梅,王兴亚,高鹏飞,钱俊彦. 计算机学报. 2018(04)
[8]HFS:一种面向软件缺陷预测的混合特征选择方法[J]. 陈翔,贺成,王宇,管怀文. 计算机应用研究. 2016(06)
[9]基于程序特征谱整数溢出错误定位技术研究[J]. 惠战伟,黄松,嵇孟雨. 计算机学报. 2012(10)
本文编号:3564191
【文章来源】:燕山大学河北省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
缺陷、错误、故障、失效基本关系图
第 2 章 软件缺陷预测的相关分析的错误数,定义如式(2-7)所示,Halst的容量成正比。3000VB 中操作符的总数,2N 为程序中操作数作数类型的数目。法根据软件拓扑结构来衡量复杂程度,够通过计算流程图上的数据流条数和数如图 2-2 所示。这些复杂度主要包含了等。
燕山大学工学硕士学位论文软件度量得到的指标建立缺陷预测模型,进一步挖掘软件缺陷与度联关系,可以有效的指导软件开发和软件测试,保障软件产品的质件缺陷预测模型ll 等人[33]对度量指标与缺陷的关系提出了有效的论述,一般在软件缺,首先通过软件度量的方法对软件的旧版本进行量化,生成度量数后基于机器学习、统计学习或其他方法建立缺陷预测的模型,最后型对未标记的模块进行预测。基本框架如图 2-3 所示,它能够有效陷的历史信息,为软件开发提供有利的决策。
【参考文献】:
期刊论文
[1]集成学习方法:研究综述[J]. 徐继伟,杨云. 云南大学学报(自然科学版). 2018(06)
[2]基于改进Adaboost软件缺陷数据特征选择方法[J]. 李克文,邹晶杰. 计算机工程与设计. 2017(11)
[3]一种面向软件缺陷预测的相似性度量特征选择方法(英文)[J]. Qiao YU,Shu-juan JIANG,Rong-cun WANG,Hong-yang WANG. Frontiers of Information Technology & Electronic Engineering. 2017(11)
[4]基于Boosting的代价敏感软件缺陷预测方法[J]. 杨杰,燕雪峰,张德平. 计算机科学. 2017(08)
[5]基于组合机器学习算法的软件缺陷预测模型[J]. 傅艺绮,董威,尹良泽,杜雨晴. 计算机研究与发展. 2017(03)
[6]面向软件缺陷预测的聚类欠采样集成方法[J]. 陆鹏程,邱建林,卞彩峰,陈璐璐,陈翔. 计算机工程与设计. 2016(07)
[7]分类不平衡对软件缺陷预测模型性能的影响研究[J]. 于巧,姜淑娟,张艳梅,王兴亚,高鹏飞,钱俊彦. 计算机学报. 2018(04)
[8]HFS:一种面向软件缺陷预测的混合特征选择方法[J]. 陈翔,贺成,王宇,管怀文. 计算机应用研究. 2016(06)
[9]基于程序特征谱整数溢出错误定位技术研究[J]. 惠战伟,黄松,嵇孟雨. 计算机学报. 2012(10)
本文编号:3564191
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3564191.html