基于代码模式的软件问答文档检索优化方法
[Abstract]:Developers usually search software Q&A documents through the search engines of Q&A websites. Q&A documents containing high-quality code fragments (using examples) are often preferred in search results, but how to measure the quality of code fragments in these documents is still a great challenge. To solve this problem, a new Q&A document based on Q&A is proposed. This method can extract code fragments from documents based on current retrieval results, analyze common code patterns in code fragments, and measure the quality of code fragments in documents based on code patterns. Based on the real problems encountered by software developers in the process of practice, the proposed method is compared with the Stack Overflow search results, and the accuracy index NDCG@5 is improved by 40%.
【作者单位】: 北京大学信息科学技术学院;高可信软件技术教育部重点实验室;北京大学(天津滨海)新一代信息技术研究院;
【基金】:国家重点研发计划No.2016YFB1000804 国家杰出青年科学基金No.61525201~~
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 贾西平;彭宏;郑启伦;石时需;江焯林;;基于主题的文档检索模型[J];华南理工大学学报(自然科学版);2008年09期
2 毓钧;多层次文档检索软件的实施方法[J];铁路计算机应用;1994年01期
3 王洪俊;施水才;俞士汶;肖诗斌;;跨语言相似文档检索[J];中文信息学报;2007年01期
4 孙成立;;混淆网络在音频文档检索系统中的应用研究[J];计算机工程与应用;2010年28期
5 韩海清;陈颉;;基于用户兴趣偏好的网络文档检索[J];计算机光盘软件与应用;2012年08期
6 贾西平;刘海珠;;面向服务的文档智能检索平台[J];广东技术师范学院学报;2010年03期
7 李胜;胡和平;;语义桌面环境下一种基于概念图的文档检索方法[J];计算机工程与科学;2009年08期
8 羊帅;王锋;林兰芬;朱晓伟;谢非;;基于自动查询扩展的专利文档检索方法[J];中国科技论文;2013年10期
9 杨毅;;一种Word文档关键词自动整理方法[J];信息与电脑(理论版);2014年01期
10 李培国;叶嫣;;多类型文档检索和转换技术研究[J];微型机与应用;2014年10期
相关会议论文 前2条
1 王洪俊;施水才;俞士汶;肖诗斌;;跨语言文档对齐[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 何莉;林鸿飞;;基于主题划分的分布式检索混合结果合并技术研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
相关重要报纸文章 前1条
1 实习记者 史紫薇;布局“点”与“面”,,大数据落地医疗行业[N];中国计算机报;2013年
相关博士学位论文 前2条
1 郑铁然;基于音节网格的汉语语音文档检索方法研究[D];哈尔滨工业大学;2008年
2 黄亮;脱机中文手写文档检索关键技术研究[D];武汉大学;2013年
相关硕士学位论文 前10条
1 金鑫;多媒体文档检索研究[D];西安电子科技大学;2012年
2 张国良;基于改进词袋的多媒体文档检索研究[D];西安电子科技大学;2013年
3 付兴刚;基于笔画距离的手写文档检索算法研究[D];哈尔滨工业大学;2009年
4 羊帅;基于自动查询扩展的专利文档检索方法[D];浙江大学;2013年
5 廖兴伟;文档复制检测方法研究与系统实现[D];哈尔滨工业大学;2012年
6 武文博;基于能量弹性网格的手写文档检索方法[D];哈尔滨工业大学;2008年
7 李化;基于图像内容的文档检索方法研究[D];延边大学;2010年
8 郭永明;XML文档检索技术研究[D];太原理工大学;2003年
9 李兴隆;基于Ontology的文档检索[D];东北大学;2005年
10 江腾蛟;XML文本文档检索技术研究[D];江西财经大学;2006年
本文编号:2201803
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2201803.html