当前位置:主页 > 科技论文 > 软件论文 >

基于增强描述的代码搜索方法

发布时间:2018-12-15 22:26
【摘要】:如何有效地帮助程序员从目前的各种代码库中搜索与特定编程任务相关的代码,已成为软件工程重要的研究领域之一.提出一种基于增强描述的代码搜索方法 DERECS,该方法首先基于开源项目、问答系统等构建一个代码-描述语料库,并分析代码及自然语言描述,提取方法调用和代码结构相关特征值;然后,基于代码片段中的方法调用及代码片段的结构特征对代码进行描述增强,以减小被搜索的代码与自然语言查询语句之间的差异,扩大搜索的范围.使用真实自然语言查询语句作为测试基准,对DERECS进行验证.验证结果表明,DERECS的效果显著优于典型方法 SNIFF和Krugle的查询结果.
[Abstract]:How to effectively help programmers to search code related to specific programming tasks from various code bases has become one of the most important research fields in software engineering. A code search method based on enhanced description (DERECS,) is proposed. Firstly, a code-description corpus is constructed based on open source project and question answering system, and the code and natural language description are analyzed. Extracting the eigenvalues of method invocation and code structure; Then, the code description is enhanced based on the method invocation in the code fragment and the structural feature of the code fragment, in order to reduce the difference between the searched code and the natural language query statement, and expand the scope of the search. The real natural language query statement is used as the test benchmark to verify the DERECS. The results show that DERECS is better than SNIFF and Krugle in query results.
【作者单位】: 北京大学信息科学技术学院;高可信软件技术教育部重点实验室(北京大学);
【基金】:国家重点基础研究发展计划(973)(2015CB352200,2015CB352201) 国家自然科学基金(61672045,61421091,61529201,91318301)~~
【分类号】:TP311.5;TP391.1

【相似文献】

相关期刊论文 前10条

1 谭俊明;;自然语言的理解综述[J];科技广场;2008年05期

2 何祖军;胡静;;自然语言的规范与转化——基于嵌入式系统的描述[J];计算机与现代化;2008年11期

3 刘海涛;关于自然语言计算机处理的几点思考[J];术语标准化与信息技术;2001年01期

4 刘三满,刘荷花;论计算机处理自然语言的新趋向[J];科技情报开发与经济;2002年04期

5 胡广朋;用于计算机辅助教学的自然语言接口[J];微计算机应用;2003年05期

6 张世红;胡佳佳;宋继华;刘会霞;琚文胜;;网络环境下的自然语言检索[J];医学情报工作;2005年06期

7 胡广朋;钱遥立;沈继峰;;一种应用规划识别建立自然语言接口的方法[J];江苏科技大学学报(自然科学版);2006年03期

8 杜津;杨一平;曾隽芳;;自然语言时间信息的模拟与计算[J];计算机工程与设计;2006年13期

9 张雪英;闾国年;宦建;;面向汉语的自然语言路径描述方法[J];地球信息科学;2008年06期

10 彭程;;基于本体论的电子商务自然语言研究[J];微计算机信息;2008年18期

相关会议论文 前4条

1 胡健;黄丽华;刘杰;;基于自然语言的智能决策支持系统人机接口[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第4卷)[C];1997年

2 谷明哲;孟小峰;周勇;;中文自然语言查询界面NChiql的Java设计实现[A];第十六届全国数据库学术会议论文集[C];1999年

3 周勇;孟小峰;刘爽;王珊;;数据库自然语言查询系统NChiql中语义依存树向SQL的转换[A];第十六届全国数据库学术会议论文集[C];1999年

4 才让加;吉太加;;藏语语料库中词性分类代码的确定[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

相关博士学位论文 前4条

1 田飞;用于自然语言分布式表达的联合学习方法研究[D];中国科学技术大学;2016年

2 于墨;自然语言句子级结构表示的建模与学习[D];哈尔滨工业大学;2016年

3 李虎;基于本体和规则的受控自然语言系统模型研究[D];华中科技大学;2010年

4 孟小峰;中文数据库自然语言查询处理研究[D];中国科学院研究生院(计算技术研究所);1999年

相关硕士学位论文 前10条

1 孙婷婷;汉语搭配获取方法研究[D];江苏科技大学;2015年

2 徐娟;面向地图搜索领域的自然语言句子g镆逡馔祭斫夥椒ㄑ芯縖D];复旦大学;2014年

3 杨潇;基于隐写编码的自然语言信息隐藏技术研究[D];长沙理工大学;2015年

4 裴君波;信息分发中自然语言订阅接口的研究[D];北京邮电大学;2015年

5 付胜博;基于自然语言的空间数据检索研究[D];西北工业大学;2007年

6 武睿峰;自然语言密写分析及密写量检测[D];西北大学;2014年

7 李霞;自然语言篇章中时间信息的研究及在产品设计领域中的应用[D];西安电子科技大学;2013年

8 詹思瑜;自然语言的计算机处理模型[D];电子科技大学;2003年

9 周洪楷;基于数据库的自然语言智能接口的研究与实现[D];西安电子科技大学;2011年

10 郭键;自然语言脚本生成动画脚本的关键技术研究[D];哈尔滨工业大学;2008年



本文编号:2381381

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2381381.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户25514***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com