软件缺陷预测中基于聚类分析的特征选择方法
本文关键词:软件缺陷预测中基于聚类分析的特征选择方法
更多相关文章: 软件质量保障 缺陷预测 数据挖掘 特征选择 聚类分析
【摘要】:软件缺陷预测通过挖掘软件历史仓库,构建缺陷预测模型来预测出被测项目内的潜在缺陷程序模块.但有时候搜集到的缺陷预测数据集中含有的冗余特征和无关特征会影响到缺陷预测模型的性能.提出一种基于聚类分析的特征选择方法 FECAR.具体来说,首先基于特征之间的关联性(即FFC),将已有特征进行聚类分析.随后基于特征与类标间的相关性(即FCR),对每个簇中的特征从高到低进行排序并选出指定数量的特征.在实证研究中,借助对称不确定性(symmetric uncertainty)来计算FFC,借助信息增益(information gain)、卡方值(chi-square)或Relief F来计算FCR.以Eclipse和NASA数据集等实际项目为评测对象,重点分析了应用FECAR方法后的缺陷预测模型的性能,FECAR方法选出的特征子集冗余率和比例.结果验证了FECAR方法的有效性.
【作者单位】: 南京大学计算机软件新技术国家重点实验室;南京大学计算机科学与技术系;南通大学计算机科学与技术学院;
【关键词】: 软件质量保障 缺陷预测 数据挖掘 特征选择 聚类分析
【基金】:国家自然科学基金(批准号:61373012,61321491,91218302,61202006) 国家重点基础研究发展计划(973计划)(批准号:2009C B320705) 江苏省高校自然科学研究项目(批准号:12KJB520014) 南京大学计算机软件新技术国家重点实验室开放课题(批准号:KFKT2016B18),南京大学软件新技术与产业化协同创新中心资助项目
【分类号】:TP311.53
【正文快照】: 国家自然科学基金(批准号:61373012,61321491,91218302,61202006)、国家重点基础研究发展计划(973计划)(批准号:2009CB320705)、江苏省高校自然科学研究项目(批准号:12KJB520014)、南京大学计算机软件新技术国家重点实验室开放课题(批准号:KFKT2016B18)和南京大学软件新技术与
【参考文献】
中国期刊全文数据库 前3条
1 陈翔;顾庆;刘望舒;刘树龙;倪超;;静态软件缺陷预测方法研究[J];软件学报;2016年01期
2 郁抒思;周水庚;关佶红;;软件工程数据挖掘研究进展[J];计算机科学与探索;2012年01期
3 王青;伍书剑;李明树;;软件缺陷预测技术[J];软件学报;2008年07期
【共引文献】
中国期刊全文数据库 前10条
1 王星;何鹏;陈丹;曾诚;;跨项目缺陷预测中训练数据选择方法[J];计算机应用;2016年11期
2 徐毅;范会敏;;谱聚类与混沌免疫相结合的软件缺陷分析算法[J];吉林大学学报(理学版);2016年05期
3 刘望舒;陈翔;顾庆;刘树龙;陈道蓄;;软件缺陷预测中基于聚类分析的特征选择方法[J];中国科学:信息科学;2016年09期
4 丰俊;陈璐璐;曾奶举;;基于动态缺陷预测的缺陷收敛判定[J];科技创新与应用;2016年20期
5 陆鹏程;邱建林;卞彩峰;陈璐璐;陈翔;;面向软件缺陷预测的聚类欠采样集成方法[J];计算机工程与设计;2016年07期
6 熊婧;高岩;王雅瑜;;基于Adaboost算法的软件缺陷预测模型[J];计算机科学;2016年07期
7 张德平;刘国强;张柯;;基于GMDH因果关系的软件缺陷预测模型[J];计算机科学;2016年07期
8 类兴明;杨春花;;基于GitHub的软件缺陷数据预处理[J];齐鲁工业大学学报(自然科学版);2016年03期
9 王宗会;周勇;张德平;;基于改进的非参数方法的软件失效预测模型[J];计算机科学;2016年06期
10 周丽英;;面向软件开发信息库的数据挖掘综述[J];中国管理信息化;2016年12期
【二级参考文献】
中国期刊全文数据库 前10条
1 陈翔;鞠小林;文万志;顾庆;;基于程序频谱的动态缺陷定位方法研究[J];软件学报;2015年02期
2 原子;于莉莉;刘超;;面向细粒度源代码变更的缺陷预测方法[J];软件学报;2014年11期
3 陈翔;陈继红;鞠小林;顾庆;;回归测试中的测试用例优先排序技术述评[J];软件学报;2013年08期
4 郁抒思;周水庚;关佶红;;软件工程数据挖掘研究进展[J];计算机科学与探索;2012年01期
5 姜远;黎铭;周志华;;Software Defect Detection with ROCUS[J];Journal of Computer Science & Technology;2011年02期
6 王青;伍书剑;李明树;;软件缺陷预测技术[J];软件学报;2008年07期
7 郭树行;兰雨晴;金茂忠;;基于目标的软件可信性需求规约方法研究[J];计算机工程;2007年11期
8 陈莉,刘海红,盛昌,陈威;可靠性增长模型和正交缺陷分类的结合及在过程定性分析中的应用[J];科学技术与工程;2005年14期
9 刘宏伟,杨孝宗,岳晓光,曲峰;一个NHPP类软件可靠性增长模型框架[J];计算机工程与科学;2005年04期
10 胡玉鹏,陈治平,林亚平,李军义;贝叶斯缺陷分析模型及其在软件测试中的应用[J];计算机应用;2005年04期
【相似文献】
中国期刊全文数据库 前10条
1 孙霞;郑庆华;;一种面向非平衡数据的邻居词特征选择方法[J];小型微型计算机系统;2008年12期
2 蒋盛益;郑琪;张倩生;;基于聚类的特征选择方法[J];电子学报;2008年S1期
3 王加龙;朱颢东;;结合类别相关性和辨识集的特征选择方法[J];微型机与应用;2009年23期
4 朱颢东;周姝;钟勇;;结合差别对象对集的综合性特征选择方法[J];计算机工程与设计;2010年03期
5 姜慧研;柴天佑;;基于可信间隔的特征选择方法研究[J];控制与决策;2011年08期
6 姚旭;王晓丹;张玉玺;权文;;特征选择方法综述[J];控制与决策;2012年02期
7 王志昊;王中卿;李寿山;李培峰;;不平衡情感分类中的特征选择方法研究[J];中文信息学报;2013年04期
8 张玉红;周全;胡学钢;;面向跨领域情感分类的特征选择方法[J];模式识别与人工智能;2013年11期
9 李敏;卡米力·木依丁;;特征选择方法与算法的研究[J];计算机技术与发展;2013年12期
10 申清明;闫利军;高建民;赵静;;基于混沌搜索的特征选择方法[J];兵工学报;2013年12期
中国重要会议论文全文数据库 前6条
1 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
3 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
5 顾成杰;张顺颐;刘凯;黄河;;基于粗糙集和禁忌搜索的特征选择方法[A];江苏省电子学会2010年学术年会论文集[C];2010年
6 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
中国博士学位论文全文数据库 前4条
1 刘明霞;属性学习若干重要问题的研究及应用[D];南京航空航天大学;2015年
2 毛勇;基于支持向量机的特征选择方法的研究与应用[D];浙江大学;2006年
3 尹留志;关于非平衡数据特征问题的研究[D];中国科学技术大学;2014年
4 裴志利;数据挖掘技术在文本分类和生物信息学中的应用[D];吉林大学;2008年
中国硕士学位论文全文数据库 前10条
1 曹晋;基于SVDD的特征选择方法研究及其应用[D];苏州大学;2015年
2 张强;静态图像上的行人检测方法研究[D];中国科学技术大学;2015年
3 张晓梅;基于融合特征的微博主客观分类方法研究[D];山西大学;2014年
4 王君;基于SVM-RFE的特征选择方法研究[D];大连理工大学;2015年
5 于海珠;面向文本聚类的特征选择方法及应用研究[D];大连理工大学;2015年
6 赵世琛;文本分类中特征选择方法研究[D];山西大学;2014年
7 王丹;特征选择算法研究及其在异常检测中的应用[D];电子科技大学;2014年
8 林艳峰;中文文本分类特征选择方法的研究与实现[D];西安电子科技大学;2014年
9 卢志浩;基于GEP的kNN算法改进研究[D];广西师范学院;2015年
10 王立鹏;面向图数据的特征选择方法及其应用研究[D];南京航空航天大学;2015年
,本文编号:918686
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/918686.html