基于组合分类算法的源代码注释质量评估方法
发布时间:2017-11-12 03:06
本文关键词:基于组合分类算法的源代码注释质量评估方法
更多相关文章: 源码注释 质量评估 文本分类 组合算法 自然语言处理
【摘要】:源代码注释是软件的重要组成部分,研究者往往需要利用人工或自动化的方法产生分析注释,注释的质量评估也往往是通过人工来完成,这无疑是低效不客观的。为此,首先从注释的格式、语言形式、内容以及与代码相关度4个方面出发构建注释评估准则;进而,基于这一准则提出了一种基于组合分类算法的注释质量评估方法。该方法将机器学习以及自然语言处理技术引入到注释质量评估中来,利用分类算法将注释分为不合格、合格、良好、优秀四个等级。通过对基本分类算法的组合使用,使得评估效果进一步提高。组合分类算法的准确率和F1值较单独使用某一种分类算法提高20个百分点左右,除宏平均F1值外,各项指标都达到了70%以上。实验结果表明,所提方法能够很好地应用于注释质量评估。
【作者单位】: 中国科学院软件研究所互联网软件技术实验室;中国科学院大学;中国科学院软件研究所总体部;中国科学院软件研究所基础软件国家工程研究中心;
【基金】:国家科技重大专项(2014ZX01029101-002)~~
【分类号】:TP391.1
【正文快照】: 0引言源代码注释是软件的重要组成部分[1],对代码理解和软件维护有着极其重要的作用,然而,多数软件项目并不能提供完整的注释和文档[2-3],因此,研究者试图利用人工以及自动化的方法为代码添加注释。其中,自动化方法主要包括注释复用[4-5]以及摘要抽取[6-8]。注释复用技术先从
【相似文献】
中国期刊全文数据库 前10条
1 郑智捷;幻序合并分类算法[J];计算机学报;1984年05期
2 刘t,
本文编号:1174041
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1174041.html