一种基于EBIC的软件故障特征选择方法
发布时间:2021-03-09 03:57
软件故障预测运用软件度量指标及历史故障数据建立预测模型,以确定待测软件模块是否有故障倾向性。故障预测研究中,特征选择是一个重要步骤,该步骤选取一定维度的部分故障数据建立预测模型来提高模型性能,以达到压缩特征维度,提高模型预测精度,降低预测模型复杂度,节约计算资源的目的。软件故障预测中若采用大量度量指标建立预测模型可能因其中含有无关特征使预测模型性能受到不良影响,因此故障预测中的特征选择具有重要的研究价值。现有特征选择方法或所选特征子集建立的预测模型有效性较低;或耗费计算资源、所选特征维数较高,在特征维度较大时易导致维度灾难。针对以上问题,本文提出了一种基于拓展贝叶斯信息准则的特征选择方法EBIC-FS,该方法对数据做线性回归并计算出残差平方和较小且数据维数较少的特征模型,具体为:在第一轮进行特征排序,计算每个特征的EBIC值,得到特征排名列表;第二轮以最优特征——最优特征+次优特征的次序依次增加特征维数,每一维度的特征集合为一个特征子集,计算每一维度下各个特征子集的EBIC值,从中选出最佳特征子集。确定最佳特征子集后,用逻辑回归、朴素贝叶斯、决策树、k近邻、随机森林5个分类器分别建立故...
【文章来源】:云南大学云南省 211工程院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
羞于分类器的软件故津预侧过程
第三章基于EBIC的特征选择方法及其故障预测??章基于EBIC的特征选择方法及其故障预测??基于拓展贝叶斯信息准则的软件故障特征选择方法,在故障预测领域的应用,其完整过程是一个软件故障预内容包括获取故障数据、EBIC-FS特征选择、建立预测架如图3.1所示,本章将围绕以上三个步骤,重点阐述E对故障数据及训练预测模型部分进行简要介绍。??
回归适用于二分类问题,可用于判别某一程序模块是否有故障倾生故障的概率。其预测值范围在〇到1之间,如图3.3中y_pred所可判定为有故障倾向性,也可判定为无故障倾向性;若预测概率大判定为有故障倾向性,反之则为无故障倾向性。??2)朴素贝叶斯(Naive?Bayesian,NB)??V??图3.4:朴素贝叶斯基本结构??“
本文编号:3072206
【文章来源】:云南大学云南省 211工程院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
羞于分类器的软件故津预侧过程
第三章基于EBIC的特征选择方法及其故障预测??章基于EBIC的特征选择方法及其故障预测??基于拓展贝叶斯信息准则的软件故障特征选择方法,在故障预测领域的应用,其完整过程是一个软件故障预内容包括获取故障数据、EBIC-FS特征选择、建立预测架如图3.1所示,本章将围绕以上三个步骤,重点阐述E对故障数据及训练预测模型部分进行简要介绍。??
回归适用于二分类问题,可用于判别某一程序模块是否有故障倾生故障的概率。其预测值范围在〇到1之间,如图3.3中y_pred所可判定为有故障倾向性,也可判定为无故障倾向性;若预测概率大判定为有故障倾向性,反之则为无故障倾向性。??2)朴素贝叶斯(Naive?Bayesian,NB)??V??图3.4:朴素贝叶斯基本结构??“
本文编号:3072206
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3072206.html