基于机器学习的错误定位方法研究

发布时间:2017-03-18 07:05

  本文关键词:基于机器学习的错误定位方法研究,由笔耕文化传播整理发布。


【摘要】:错误定位是整个软件调试过程中最耗时最困难的部分,错误定位过程中的任何改进都可以大大降低软件成本。传统的错误定位方法一般是利用开发工具手动地设置断点,不但耗费精力,而且效率低下。因此,利用机器学习的理论与技术,使在调试过程中的错误定位实现自动化,是当前研究的重点。基于机器学习的错误定位方法首先是根据选择的测试用例执行得到源程序的语句覆盖信息和执行结果,然后,利用机器学习模型计算出每条语句的可疑度值,最后按照可疑度值由高到低的顺序逐条检查程序的可疑语句进行错误定位。本文在充分分析程序测试用例的覆盖信息基础上,以减少查找错误语句、提高错误定位效率为目的,对一些传统的机器学习模型进行了改进。本文有以下几点创新之处:第一,基于增强径向基函数神经网络的错误定位方法。结合径向基函数神经网络与正交试验设计理论,提出了一种增强径向基函数神经网络错误定位算法,通过正交试验设计方法可以自适应地调整神经网络中的参数值,从而达到优化错误定位模型的目的。第二,基于基因表达式编程的错误定位方法。结合基因表达式编程技术以及基于频谱的错误定位方法,找到适应程序的高效秩函数,提出了一种新的错误定位方法,再利用此高效秩函数去计算出每条语句的可疑度值,提高错误定位效率。第三,基于数据分组处理因果关系的错误定位方法。针对普通因果检验方法只能检验两个变量之间因果关系的不足,从检测多维变量间因果关系的理论出发,提出了一种改进型的因果关系错误定位方法。最后,为了验证所提出机器学习错误定位方法的有效性,本文采用真实的测试数据集Siemens Suite作为研究对象,分别对以上三个模型进行实验性能对比,结果表明,本文所提出的所有错误定位方法较之前的传统方法具有更精确的错误定位效果和更显著的定位效率。
【关键词】:错误定位 机器学习 软件调试 径向基神经网络 基因表达式编程 因果关系
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.53;TP181
【目录】:
  • 摘要4-5
  • abstract5-10
  • 注释表10-11
  • 第一章 绪论11-18
  • 1.1 课题研究背景11-12
  • 1.2 错误定位技术研究现状与趋势12-15
  • 1.2.1 国内外研究现状13-14
  • 1.2.2 近年研究趋势14-15
  • 1.3 课题研究内容15-16
  • 1.4 论文组织结构16-17
  • 1.5 本章小结17-18
  • 第二章 程序数据采集与建模技术研究18-25
  • 2.1 错误定位的建模过程18-19
  • 2.2 实验数据19-21
  • 2.3 数据采集技术研究21-23
  • 2.3.1 GCOV程序覆盖工具21-22
  • 2.3.2 LCOV覆盖信息显示工具22-23
  • 2.4 错误定位模型性能指标23-24
  • 2.5 本章小结24-25
  • 第三章 基于增强径向函数神经网络的错误定位方法25-37
  • 3.1 径向基函数神经网络模型25-28
  • 3.1.1 RBFN的内部结构25-26
  • 3.1.2 RBFN的参数训练26-28
  • 3.2 增强径向基函数神经网络模型28-32
  • 3.2.1 正交试验设计28-30
  • 3.2.2 ERBFN模型技术研究30-32
  • 3.3 基于ERBFN的错误定位方法32-34
  • 3.4 实验结果与分析34-36
  • 3.5 本章小结36-37
  • 第四章 基于基因表达式编程的错误定位方法37-49
  • 4.1 基于频谱的错误定位方法37-39
  • 4.2 基因表达式编程算法39-43
  • 4.3 基于GEP的错误定位方法43-45
  • 4.4 实验结果与分析45-48
  • 4.5 本章小结48-49
  • 第五章 基于数据分组处理因果关系的错误定位方法49-57
  • 5.1 因果关系概述49-50
  • 5.2 GMDH算法50-51
  • 5.3 基于GMDH的错误定位方法51-54
  • 5.3.1 初步定性分析51-53
  • 5.3.2 GMDH因果关系检验53-54
  • 5.3.3 错误定位54
  • 5.4 实验结果与分析54-56
  • 5.5 本章小结56-57
  • 第六章 模型结果分析及引发的新探讨57-61
  • 6.1 模型实验比较57-59
  • 6.2 影响模型定位性能的主要因素59-60
  • 6.2.1 程序语句规模因素59
  • 6.2.2 程序测试用例规模因素59-60
  • 6.2.3 程序结构因素60
  • 6.3 本章小结60-61
  • 第七章 总结与展望61-62
  • 参考文献62-67
  • 致谢67-68
  • 在学期间的研究成果及发表的学术论文68

【相似文献】

中国期刊全文数据库 前10条

1 张明玉,倪志伟;基于机器学习的智能决策支持系统[J];淮南师范学院学报;2005年03期

2 杨凌霄;武建平;;机器学习方法在人脸检测中的应用[J];计算机与数字工程;2008年03期

3 ;第十一届中国机器学习会议[J];智能系统学报;2008年02期

4 ;第14届中国机器学习会议[J];智能系统学报;2012年06期

5 费宗铭;吕建;王志坚;陈道蓄;徐家福;;机器学习[J];计算机科学;1991年01期

6 赵沁平;魏华;王军玲;;机器学习技术与机器学习系统[J];计算机科学;1993年05期

7 姚敏;机器学习及其发展方向[J];计算机时代;1994年04期

8 ;第31届机器学习国际会议(英文)[J];智能系统学报;2014年01期

9 黄海滨;机器学习及其主要策略[J];河池师范高等专科学校学报(自然科学版);2000年04期

10 佘玉梅;一种协调机器学习方法研究[J];云南民族学院学报(自然科学版);2000年03期

中国重要会议论文全文数据库 前10条

1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年

2 王昊;李银波;纪志梁;;利用机器学习方法预测严重药物不良反应-呼吸困难[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年

3 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年

4 周晴杰;徐立鸿;吴启迪;;机器学习串级结构的初步探讨[A];1998年中国控制会议论文集[C];1998年

5 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年

6 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年

7 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

8 黄金铁;李景银;周建常;;对高炉炉况评价模型参数的机器学习——一个三类线性模式分类器的实现[A];1995中国控制与决策学术年会论文集[C];1995年

9 程国建;蔡磊;潘华贤;;核向量机在大规模机器学习中的应用[A];第十一届中国青年信息与管理学者大会论文集[C];2009年

10 张钹;张铃;;统计学习理论及其应用[A];2001年中国智能自动化会议论文集(上册)[C];2001年

中国重要报纸全文数据库 前10条

1 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年

2 IBM大数据专家 James Kobielus 范范 编译;机器学习已成为大数据基石[N];网络世界;2014年

3 本报记者 房琳琳;合久必分:分布式“机器学习”应运而生[N];科技日报;2014年

4 雨辰;机器学习类图书为什么火爆[N];中华读书报;2014年

5 百度公司技术副总监 多媒体部负责人 余凯;深度学习与多媒体搜索技术演进[N];中国信息化周报;2013年

6 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年

7 本报记者 张晔邋通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年

8 记者  彭德倩;机器学习精度提升近6个百分点[N];解放日报;2006年

9 本报记者 闵杰;大数据热 高端人才缺[N];中国电子报;2013年

10 沈建苗 编译;如何成为大数据科学家[N];计算机世界;2013年

中国博士学位论文全文数据库 前10条

1 董春茹;机器学习中的权重学习与差分演化[D];华南理工大学;2015年

2 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年

3 胡巍;面向格结构的机器学习[D];上海交通大学;2009年

4 张义荣;基于机器学习的入侵检测技术研究[D];国防科学技术大学;2005年

5 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年

6 梁锡军;稀疏优化在机器学习中的若干应用[D];大连理工大学;2013年

7 蒋刚;核机器学习方法若干问题研究[D];西南交通大学;2006年

8 陈慧灵;面向智能决策问题的机器学习方法研究[D];吉林大学;2012年

9 周伟达;核机器学习方法研究[D];西安电子科技大学;2003年

10 熊毅;基于机器学习的蛋白质结合位点特征化和预测方法研究[D];武汉大学;2011年

中国硕士学位论文全文数据库 前10条

1 毛海斌;基于半监督机器学习的情感分类领域适应问题研究[D];南京理工大学;2015年

2 安军辉;基于微博数据的微博用户性别判断研究[D];华中师范大学;2015年

3 陈召阳;基于机器学习的改性麦槽吸附重金属构效关系模型研究[D];江西理工大学;2014年

4 王成;基于半监督机器学习的文本情感分析技术[D];南京理工大学;2015年

5 孙科;基于Spark的机器学习应用框架研究与实现[D];上海交通大学;2015年

6 刘江龙;基于机器学习的射频指纹定位方法研究[D];电子科技大学;2015年

7 张蕾;基于机器学习的网络舆情采集技术研究与设计[D];电子科技大学;2014年

8 施宇;基于数据挖掘和机器学习的木马检测系统设计与实现[D];电子科技大学;2014年

9 施应敏;基于机器学习的Femtocell信道频谱与功率资源分配算法的研究[D];南京邮电大学;2015年

10 张柯;基于机器学习的错误定位方法研究[D];南京航空航天大学;2015年


  本文关键词:基于机器学习的错误定位方法研究,由笔耕文化传播整理发布。



本文编号:254091

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/254091.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7ab38***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com