当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于代码模式的软件问答文档检索优化方法

发布时间:2018-08-24 19:29
【摘要】:开发人员通常通过问答网站的搜索引擎进行相关软件问答文档的搜索。在检索结果中,包含优质代码片段(使用示例)的问答文档往往更受青睐,但如何度量这些文档中代码片段的质量仍是个巨大的挑战。针对这个问题,提出了一种基于代码模式的软件问答文档检索优化方法。该方法能够基于当前检索结果,抽取文档中的代码片段,分析代码片段中的公共代码模式,并基于代码模式度量文档中代码片段的质量,从原有检索结果中向用户推荐高质量的软件问答文档。以软件开发人员在实践过程中遇到的真实问题为基础进行了实验,对比Stack Overflow的搜索结果,所提方法在准确率指标NDCG@5上提升了40%。
[Abstract]:Developers usually search software Q&A documents through the search engines of Q&A websites. Q&A documents containing high-quality code fragments (using examples) are often preferred in search results, but how to measure the quality of code fragments in these documents is still a great challenge. To solve this problem, a new Q&A document based on Q&A is proposed. This method can extract code fragments from documents based on current retrieval results, analyze common code patterns in code fragments, and measure the quality of code fragments in documents based on code patterns. Based on the real problems encountered by software developers in the process of practice, the proposed method is compared with the Stack Overflow search results, and the accuracy index NDCG@5 is improved by 40%.
【作者单位】: 北京大学信息科学技术学院;高可信软件技术教育部重点实验室;北京大学(天津滨海)新一代信息技术研究院;
【基金】:国家重点研发计划No.2016YFB1000804 国家杰出青年科学基金No.61525201~~
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 贾西平;彭宏;郑启伦;石时需;江焯林;;基于主题的文档检索模型[J];华南理工大学学报(自然科学版);2008年09期

2 毓钧;多层次文档检索软件的实施方法[J];铁路计算机应用;1994年01期

3 王洪俊;施水才;俞士汶;肖诗斌;;跨语言相似文档检索[J];中文信息学报;2007年01期

4 孙成立;;混淆网络在音频文档检索系统中的应用研究[J];计算机工程与应用;2010年28期

5 韩海清;陈颉;;基于用户兴趣偏好的网络文档检索[J];计算机光盘软件与应用;2012年08期

6 贾西平;刘海珠;;面向服务的文档智能检索平台[J];广东技术师范学院学报;2010年03期

7 李胜;胡和平;;语义桌面环境下一种基于概念图的文档检索方法[J];计算机工程与科学;2009年08期

8 羊帅;王锋;林兰芬;朱晓伟;谢非;;基于自动查询扩展的专利文档检索方法[J];中国科技论文;2013年10期

9 杨毅;;一种Word文档关键词自动整理方法[J];信息与电脑(理论版);2014年01期

10 李培国;叶嫣;;多类型文档检索和转换技术研究[J];微型机与应用;2014年10期

相关会议论文 前2条

1 王洪俊;施水才;俞士汶;肖诗斌;;跨语言文档对齐[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

2 何莉;林鸿飞;;基于主题划分的分布式检索混合结果合并技术研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

相关重要报纸文章 前1条

1 实习记者 史紫薇;布局“点”与“面”,,大数据落地医疗行业[N];中国计算机报;2013年

相关博士学位论文 前2条

1 郑铁然;基于音节网格的汉语语音文档检索方法研究[D];哈尔滨工业大学;2008年

2 黄亮;脱机中文手写文档检索关键技术研究[D];武汉大学;2013年

相关硕士学位论文 前10条

1 金鑫;多媒体文档检索研究[D];西安电子科技大学;2012年

2 张国良;基于改进词袋的多媒体文档检索研究[D];西安电子科技大学;2013年

3 付兴刚;基于笔画距离的手写文档检索算法研究[D];哈尔滨工业大学;2009年

4 羊帅;基于自动查询扩展的专利文档检索方法[D];浙江大学;2013年

5 廖兴伟;文档复制检测方法研究与系统实现[D];哈尔滨工业大学;2012年

6 武文博;基于能量弹性网格的手写文档检索方法[D];哈尔滨工业大学;2008年

7 李化;基于图像内容的文档检索方法研究[D];延边大学;2010年

8 郭永明;XML文档检索技术研究[D];太原理工大学;2003年

9 李兴隆;基于Ontology的文档检索[D];东北大学;2005年

10 江腾蛟;XML文本文档检索技术研究[D];江西财经大学;2006年



本文编号:2201803

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2201803.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cf42e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com