一种基于文本、分类信息融合的重复缺陷报告检测方法
发布时间:2022-10-29 12:44
用户和测试人员所提交的缺陷报告是发现软件缺陷的重要途经之一。缺陷报告是描述缺陷的载体,开发人员对缺陷报告描述问题的修复是完善软件的必要手段。不同用户和测试人员针对同一缺陷提交报告,导致缺陷报告库有大量重复的缺陷报告。随着软件规模和复杂度的日益增大,针对重复报告的手动分诊已无法适应越来越复杂的软件系统。重复缺陷报告检测研究旨在过滤缺陷报告库中的重复部分,有效提高软件维护活动的执行效率,是软件维护领域的研究热点。当前重复缺陷报告检测的准确率还有很大的提升空间,尚无法满足业界对重复缺陷报告预测的期望。提高预测精度的难点在于寻找一个合适且全面的方法衡量缺陷报告之间的相似性。借鉴数据融合方法,本文提出了一种基于文本信息、分类信息融合的重复缺陷报告检测方法CBLO(Combinationof BM25F、LSI and One-Hot)。本方法包括4个步骤:1.数据预处理,提取重复缺陷报告的文本信息与分类信息。2.使用BM25F与LSI算法对文本信息进行数值化处理,给出文本信息相似性测度。3.使用One-Hot算法对分类信息进行数值化处理,给出分类信息相似性测度。4.基于相似性融合方法,实现文本信...
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 论文的主要工作及创新
1.4 论文组织结构
第二章 相关研究基础
2.1 软件缺陷报告
2.1.1 缺陷报告管理流程
2.1.2 缺陷报告结构
2.2 TF-IDF方法
2.3 潜语义索引LSI方法
2.4 空间向量
2.4.1 One-Hot空间向量生成
2.4.2 空间向量相似性测度
2.5 信息检索评价指标MRR
2.6 本章小结
第三章 本文CBLO方法
3.1 数据预处理
3.2 相似性计算
3.2.1 文本信息相似性计算
3.2.2 分类信息相似性计算
3.3 相似性融合
3.4 CBLO方法流程
3.5 本章小结
第四章 实验与结果分析
4.1 数据集及评价指标
4.1.1 数据集
4.1.2 评价指标
4.2 基线方法
4.3 实验设计
4.4 实验结果与分析
4.4.1 实验结果
4.4.2 结果分析
4.5 存在的局限与不足
4.6 本章小结
第五章 总结与展望
参考文献
攻读硕士学位期间的科研成果
致谢
【参考文献】:
期刊论文
[1]基于卷积网络的句子语义相似性模型[J]. 黄江平,姬东鸿. 华南理工大学学报(自然科学版). 2017(03)
[2]奇异值分解定理的几何意义[J]. 姜芳,曹荣美. 科技创新导报. 2013(04)
[3]自动分析软件缺陷报告间相关性的方法研究[J]. 李楠,王晓博,刘超. 计算机应用研究. 2010(06)
[4]软件缺陷报告[J]. 李丹. 电子质量. 2003(07)
博士论文
[1]软件缺陷报告管理关键技术研究[D]. 喻维.华南理工大学 2018
硕士论文
[1]基于缺陷报告和源代码的相似缺陷识别方法[D]. 董美含.哈尔滨工业大学 2018
[2]自动重复缺陷报告检测方法研究[D]. 王彬.华东师范大学 2016
[3]基于LDA模型的重复缺陷报告检测的研究[D]. 蒋欣志.重庆大学 2013
[4]软件缺陷自动分派研究[D]. 黄小亮.复旦大学 2011
本文编号:3697709
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 论文的主要工作及创新
1.4 论文组织结构
第二章 相关研究基础
2.1 软件缺陷报告
2.1.1 缺陷报告管理流程
2.1.2 缺陷报告结构
2.2 TF-IDF方法
2.3 潜语义索引LSI方法
2.4 空间向量
2.4.1 One-Hot空间向量生成
2.4.2 空间向量相似性测度
2.5 信息检索评价指标MRR
2.6 本章小结
第三章 本文CBLO方法
3.1 数据预处理
3.2 相似性计算
3.2.1 文本信息相似性计算
3.2.2 分类信息相似性计算
3.3 相似性融合
3.4 CBLO方法流程
3.5 本章小结
第四章 实验与结果分析
4.1 数据集及评价指标
4.1.1 数据集
4.1.2 评价指标
4.2 基线方法
4.3 实验设计
4.4 实验结果与分析
4.4.1 实验结果
4.4.2 结果分析
4.5 存在的局限与不足
4.6 本章小结
第五章 总结与展望
参考文献
攻读硕士学位期间的科研成果
致谢
【参考文献】:
期刊论文
[1]基于卷积网络的句子语义相似性模型[J]. 黄江平,姬东鸿. 华南理工大学学报(自然科学版). 2017(03)
[2]奇异值分解定理的几何意义[J]. 姜芳,曹荣美. 科技创新导报. 2013(04)
[3]自动分析软件缺陷报告间相关性的方法研究[J]. 李楠,王晓博,刘超. 计算机应用研究. 2010(06)
[4]软件缺陷报告[J]. 李丹. 电子质量. 2003(07)
博士论文
[1]软件缺陷报告管理关键技术研究[D]. 喻维.华南理工大学 2018
硕士论文
[1]基于缺陷报告和源代码的相似缺陷识别方法[D]. 董美含.哈尔滨工业大学 2018
[2]自动重复缺陷报告检测方法研究[D]. 王彬.华东师范大学 2016
[3]基于LDA模型的重复缺陷报告检测的研究[D]. 蒋欣志.重庆大学 2013
[4]软件缺陷自动分派研究[D]. 黄小亮.复旦大学 2011
本文编号:3697709
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3697709.html