面向Java程序包的代码概要自动生成技术研究
本文选题:程序理解 + 潜在语义分析 ; 参考:《计算机科学与探索》2017年02期
【摘要】:程序理解是从软件程序中获得抽象在程序中的功能和知识的过程,对软件维护有着重要的意义。研究表明,软件维护消耗了软件预算的50%到80%,而其中大概47%到62%的维护时间用于对软件系统的理解上。提出了一种面向Java程序的包概要方法,尝试从软件的语义层次出发,利用信息索引领域的潜在语义分析和数据挖掘领域的聚类算法对软件程序中的语义信息进行提取分析。对相似词汇的代码文件进行聚类,并从中提取话题对Java程序中的包进行刻画;对这些话题进行语义恢复,并利用MiniPar,一个英文词法分析器,来辅助生成程序中包的概要信息。实验结果表明该方法能够改进程序理解的效率。
[Abstract]:Program understanding is the process of obtaining abstract functions and knowledge from software programs, which is of great significance to software maintenance. The research shows that software maintenance consumes 50% to 80% of the software budget, and about 47% to 62% of the maintenance time is spent on understanding the software system. In this paper, a packet summary method for Java programs is proposed, which attempts to extract and analyze the semantic information in software programs by using the latent semantic analysis in the field of information indexing and clustering algorithm in the field of data mining from the point of view of the semantic level of the software. The code files of similar words are clustered and the topics are extracted to describe the packets in the Java program, and the semantic recovery of these topics is carried out. MiniPara is used as an English lexical analyzer to help generate the summary information of the packets in the program. Experimental results show that this method can improve the efficiency of program understanding.
【作者单位】: 扬州大学信息工程学院;南京大学计算机软件新技术国家重点实验室;
【基金】:国家自然科学基金Nos.61402396,61472344 中国博士后面上项目No.2015M571489 软件新技术国家重点实验室开放课题项目No.KFKT2016B21 江苏省教育厅自然科学基金面上项目No.13KJB520027~~
【分类号】:TP312.2
【相似文献】
相关期刊论文 前10条
1 张成;曲明成;倪宁;仇光;卜佳俊;;基于概率潜在语义分析模型的自动答案选择[J];计算机工程;2011年14期
2 范玉华;秦世引;;基于潜在语义分析的场景分类优化决策方法[J];计算机辅助设计与图形学学报;2013年02期
3 刘云峰,齐欢,代建民,王小平;中文信息的潜在语义分析[J];华南理工大学学报(自然科学版);2004年S1期
4 汤世平;樊孝忠;朱建勇;;基于潜在语义分析的本体空间表示模型研究[J];计算机应用与软件;2008年01期
5 程彩虹;王惠临;解国栋;;基于潜在语义分析的自动词法学习技术[J];情报理论与实践;2008年05期
6 赵亚慧;;潜在语义分析技术在自动评卷系统中的应用[J];延边大学学报(自然科学版);2011年04期
7 陈永平;杨思春;苏新;毛万胜;;基于加权潜在语义分析的答案抽取[J];计算机系统应用;2012年01期
8 汪瑾;;基于潜在语义分析的程序代码相似度检测[J];科技创新与应用;2012年33期
9 盖杰,王怡,武港山;潜在语义分析理论及其应用[J];计算机应用研究;2004年03期
10 欧建林;林茜;史晓东;;潜在语义分析在连续语音识别中的应用[J];计算机工程与应用;2009年32期
相关会议论文 前6条
1 宁健;林鸿飞;;基于改进潜在语义分析的交叉语言检索[A];第五届全国信息检索学术会议论文集[C];2009年
2 秦洋;王立宏;武栓虎;宋宜斌;;基于潜在语义分析的启动子识别[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
3 耿焕同;吴祥;毕硕本;;基于潜在语义分析的BBS主题发现算法研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
4 郭燕慧;王枞;钟义信;;语言认知与主题内容识别[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
5 刘昌钰;郭颖;唐常杰;翟静;李海宏;;基于潜在语义分析与Bayes分类的BBS文档鉴别[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 李晓婷;张磊;沈建京;;面向服务的主动式统计预测报表技术[A];2007年中国智能自动化会议论文集[C];2007年
相关博士学位论文 前1条
1 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
相关硕士学位论文 前10条
1 李珀瀚;数据库中关键词的查询扩展研究[D];复旦大学;2014年
2 黄小燕;基于潜在语义关系的更年期综合症知识图库的构建及其应用研究[D];电子科技大学;2015年
3 尚美辰;基于UMLS和通路数据的潜在语义分析技术的研究与实现[D];黑龙江大学;2015年
4 倪诗梦;[D];东南大学;2015年
5 马文涛;面向电子病历文本分析的潜在语义分析应用研究[D];浙江大学;2016年
6 常利伟;基于多系统融合的潜在语义分析技术研究[D];沈阳航空航天大学;2013年
7 孙小欣;基于潜在语义分析的学科知识图谱构建[D];华中师范大学;2013年
8 唐朝辉;潜在语义分析在互联网数据挖掘中的应用研究[D];湖南大学;2009年
9 刘森;概率潜在语义分析及其应用[D];浙江大学;2011年
10 赵天雪;潜在语义分析在答疑系统中的应用研究[D];吉林大学;2005年
,本文编号:1859699
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1859699.html