一种基于机器学习技术的日志记录语句级别推荐方法的研究
发布时间:2021-08-09 19:15
日志记录语句由于具有捕获和记录系统运行时信息的能力,成为了软件系统遇到故障时分析问题原因的主要信息来源。另一方面,互联网领域日新月异的变化,带来了越来越多的用户以及丰富的功能需求,这导致软件系统质量和性能要求都日益提高。日志记录语句由于前述原因,吸引了越来越多实践者和研究者的关注。事实上,恰当地在软件代码中插入日志记录语句已成为开发人员日常工作中十分重要的一部分。一个日志记录语句会利用普通文本和可选的相关变量来记录系统关键的事件信息。在编写日志记录语句时,开发人员需要决策在哪里记录以及需要记录哪些内容。但是,仅仅考虑这两个方面是不足够的,现有的日志框架和工具都要求为每个日志记录语句分配一个用来描述记录信息详细程度的级别,它会影响最终保存下来的日志信息。如果一个日志记录语句被分配了不合适的级别,可能会导致本该记录的信息没有被储存下来,使得后续的日志分析等工作缺失了关键性信息。现有的研究中表明因为需要权衡内容足够的大量日志所带来的益处和所消耗的成本,开发人员在为一条日志记录语句分配级别时往往会花费较大的精力,他们往往只能依赖自己的开发经验和领域知识进行决策。为工业界提供日志记录语句级别分配...
【文章来源】:南京大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
图3.3:技术方案流程??本文提出的日忠记录语句级别推荐方法共有8个步骤:??
的级别都是合适的,这样所学习到的经验也更为准确,有较高的适用性。??LOG.?info(?“DEBUG?Container?Finished:”?+?containerld);??图4.2:级别反模式示例??4.1.3数据统计与分析??在对数据实例进行了筛选之后,为了能进一步了解开发实践中日志记录语??句级别的分布情况,以及探究相关原因和影响级别决策的因素,本文简单地统??计了一下相关数据,具体的结果展示如下所示。??loglevel分布情况??47,?〇%??2772,??;..?■?■??4188,13%?1?8218,?25%??翁'??、■?.??-:?.??12937,?40%??^?trace???debug?缴?info?warn?a?error?綴?fatal??图4.3:?level分布展示??首先是各个级别在所有日志记录语句中的占比
?〇&?〇&??图4.4:代码块分布展示??接着是拥有f:l志记录语句的代码块类型所占的比重。图4.4中显示,??IfBlock中H志记录语句的数量占比是最为高的。这是因为一个丨「Block往往??代表着实际运行中-种具体的逻辑状态,在获取了详细的逻辑状态信息之??后,会更容易地定位问题发生的原因,所以也是H志记录语句最常出现的代??码块。另外MethodBlock屮分布的也很多的,因为-个函数足-般承担着一个??逻辑功能职责,此处较为容易出现逻辑错误,往往是开发人员的关注重点。??其次便是TryBlock和CatchBlock,这两个代码块的职责是用来捕获异常,因此??也是日志记录语句常常被插入的地方,这个占比不那么高的原因,可能是因??为TryBlock和CatchBlock块本身被使用的频率不高。??最后是每种代码块中各个曰志记录语句级别的分布状况。图4.5中显示,??TryBlock和CatchBlock虽然常常…起出现
【参考文献】:
期刊论文
[1]基于机器学习的文本分类技术研究进展[J]. 刘婧,姜文波,邵野. 电脑迷. 2018(06)
[2]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[3]二项分类logistic回归的基本原理和关键问题[J]. 刘彬彬,王琦琦,于石成,胡跃华,么鸿雁,孙谨芳,谭云洪. 中国防痨杂志. 2016 (08)
[4]机器学习及其算法和发展研究[J]. 张润,王永滨. 中国传媒大学学报(自然科学版). 2016(02)
[5]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川. 数据采集与处理. 2016(01)
[6]权核Logistic回归模型的分类和特征选择算法[J]. 池光辉,刘建伟,李卫民,罗雄麟. 计算机工程与应用. 2013(09)
[7]决策树算法及其核心技术[J]. 杨学兵,张俊. 计算机技术与发展. 2007(01)
[8]文本分类技术研究[J]. 高洁,吉根林. 计算机应用研究. 2004(07)
[9]数据挖掘中决策树的探讨[J]. 马秀红,宋建社,董晟飞. 计算机工程与应用. 2004(01)
[10]文本分类实现技术[J]. 王灏,黄厚宽,田盛丰. 广西师范大学学报(自然科学版). 2003(01)
本文编号:3332644
【文章来源】:南京大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
图3.3:技术方案流程??本文提出的日忠记录语句级别推荐方法共有8个步骤:??
的级别都是合适的,这样所学习到的经验也更为准确,有较高的适用性。??LOG.?info(?“DEBUG?Container?Finished:”?+?containerld);??图4.2:级别反模式示例??4.1.3数据统计与分析??在对数据实例进行了筛选之后,为了能进一步了解开发实践中日志记录语??句级别的分布情况,以及探究相关原因和影响级别决策的因素,本文简单地统??计了一下相关数据,具体的结果展示如下所示。??loglevel分布情况??47,?〇%??2772,??;..?■?■??4188,13%?1?8218,?25%??翁'??、■?.??-:?.??12937,?40%??^?trace???debug?缴?info?warn?a?error?綴?fatal??图4.3:?level分布展示??首先是各个级别在所有日志记录语句中的占比
?〇&?〇&??图4.4:代码块分布展示??接着是拥有f:l志记录语句的代码块类型所占的比重。图4.4中显示,??IfBlock中H志记录语句的数量占比是最为高的。这是因为一个丨「Block往往??代表着实际运行中-种具体的逻辑状态,在获取了详细的逻辑状态信息之??后,会更容易地定位问题发生的原因,所以也是H志记录语句最常出现的代??码块。另外MethodBlock屮分布的也很多的,因为-个函数足-般承担着一个??逻辑功能职责,此处较为容易出现逻辑错误,往往是开发人员的关注重点。??其次便是TryBlock和CatchBlock,这两个代码块的职责是用来捕获异常,因此??也是日志记录语句常常被插入的地方,这个占比不那么高的原因,可能是因??为TryBlock和CatchBlock块本身被使用的频率不高。??最后是每种代码块中各个曰志记录语句级别的分布状况。图4.5中显示,??TryBlock和CatchBlock虽然常常…起出现
【参考文献】:
期刊论文
[1]基于机器学习的文本分类技术研究进展[J]. 刘婧,姜文波,邵野. 电脑迷. 2018(06)
[2]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[3]二项分类logistic回归的基本原理和关键问题[J]. 刘彬彬,王琦琦,于石成,胡跃华,么鸿雁,孙谨芳,谭云洪. 中国防痨杂志. 2016 (08)
[4]机器学习及其算法和发展研究[J]. 张润,王永滨. 中国传媒大学学报(自然科学版). 2016(02)
[5]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川. 数据采集与处理. 2016(01)
[6]权核Logistic回归模型的分类和特征选择算法[J]. 池光辉,刘建伟,李卫民,罗雄麟. 计算机工程与应用. 2013(09)
[7]决策树算法及其核心技术[J]. 杨学兵,张俊. 计算机技术与发展. 2007(01)
[8]文本分类技术研究[J]. 高洁,吉根林. 计算机应用研究. 2004(07)
[9]数据挖掘中决策树的探讨[J]. 马秀红,宋建社,董晟飞. 计算机工程与应用. 2004(01)
[10]文本分类实现技术[J]. 王灏,黄厚宽,田盛丰. 广西师范大学学报(自然科学版). 2003(01)
本文编号:3332644
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3332644.html
最近更新
教材专著