当前位置:主页 > 科技论文 > 软件论文 >

一种基于代码描述语义向量的Java代码搜索方法研究

发布时间:2021-10-13 02:40
  代码搜索的目标是辅助开发者搜索符合开发需求的代码,是软件工程的重要研究领域之一。传统的代码搜索采用字符串匹配技术将搜索文本中的词和代码中的词直接匹配,或将搜索文本和代码转换成中间表示进行匹配,忽略搜索文本上下文语义和代码之间的关系等信息,导致了代码搜索的准确率较低。针对上述不足,本文提出一种基于代码描述语义向量的Java代码搜索方法(简称CDSVJCS,Code Description Semantics Vector based Java Code Search)。该方法以开发者活跃的Github项目托管平台的开源项目源代码和Stack Overflow开源社区问答系统的问答数据为依托,利用代码文本描述和代码块的映射关系,提取并构建“代码描述-代码块库”,提供了代码搜索的基础数据;其次,CDSVJCS利用句法分析和fastText词向量,将搜索文本和代码描述经过句法分析后转换到向量空间,从上下文的角度计算搜索文本和代码描述的相似度,结合代码描述和代码块之间的映射关系,生成初始搜索结果;最后,基于初始搜索结果,利用基于LSTM-RNN的相似代码检测的分类算法,将搜索结果划分为符合搜索需... 

【文章来源】:西华大学四川省

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

一种基于代码描述语义向量的Java代码搜索方法研究


GithubSpring相关项目Fig.1.1SpringrelatedprojectsonGithub

开发者,软件开发,平台,文件组


图 1.1 Stack Overflow java 相关问答Fig.1.1 Java related items on Stack OverflowGithub 是一个开源项目的托管平台,很多优质的开源项目由开发者提交到 Github,提供给开发者一种协作软件开发的新形式。开源项目由多个文件组成,其中包括数万行

框架图,代码,框架,资源库


图 2.1 常用代码搜索框架Fig.2.1 commonly used code search framework面将对图 2.1 的几个部分进行简要的阐述。代码资源库


本文编号:3433797

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3433797.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1a29d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com