基于组合分类算法的源代码注释质量评估方法

发布时间：2017-11-12 03:06

本文关键词：基于组合分类算法的源代码注释质量评估方法

【摘要】：源代码注释是软件的重要组成部分,研究者往往需要利用人工或自动化的方法产生分析注释,注释的质量评估也往往是通过人工来完成,这无疑是低效不客观的。为此,首先从注释的格式、语言形式、内容以及与代码相关度4个方面出发构建注释评估准则;进而,基于这一准则提出了一种基于组合分类算法的注释质量评估方法。该方法将机器学习以及自然语言处理技术引入到注释质量评估中来,利用分类算法将注释分为不合格、合格、良好、优秀四个等级。通过对基本分类算法的组合使用,使得评估效果进一步提高。组合分类算法的准确率和F1值较单独使用某一种分类算法提高20个百分点左右,除宏平均F1值外,各项指标都达到了70%以上。实验结果表明,所提方法能够很好地应用于注释质量评估。
【作者单位】：中国科学院软件研究所互联网软件技术实验室;中国科学院大学;中国科学院软件研究所总体部;中国科学院软件研究所基础软件国家工程研究中心;
【基金】：国家科技重大专项(2014ZX01029101-002)~~
【分类号】：TP391.1
【正文快照】： 0引言源代码注释是软件的重要组成部分[1],对代码理解和软件维护有着极其重要的作用,然而,多数软件项目并不能提供完整的注释和文档[2-3],因此,研究者试图利用人工以及自动化的方法为代码添加注释。其中,自动化方法主要包括注释复用[4-5]以及摘要抽取[6-8]。注释复用技术先从

【相似文献】

中国期刊全文数据库前10条

1 郑智捷;幻序合并分类算法[J];计算机学报;1984年05期

2 刘t，

本文编号：1174041

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1174041.html

上一篇：面向大型企业信息安全建设的虚拟化威胁感知技术
下一篇：基于SOA的政府信息管理系统的设计与研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|