当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于词语关联度的查询缩略

发布时间:2018-02-05 21:59

  本文关键词: 查询缩略 词语关联度 评价方式 出处:《中文信息学报》2014年04期  论文类型:期刊论文


【摘要】:冗长查询指用户提交的句子成份复杂的查询。当前的搜索引擎对于关键字的检索取得了较好的结果。但是对于冗长的查询,如果将所有词作为关键字进行检索,往往只能返回相当有限的结果。我们尝试利用关键词之间的词语关联度,发现语义蕴含,删除"信息量"小的关键词,提高检索的效果。对于实验结果,我们分别从"面向机器"和"面向用户"两个角度进行评价。在"面向机器"的评价部分,我们根据搜索引擎返回结果的标红率和结果数进行自动评价;在"面向用户"的评价部分,我们对搜索结果文档进行人工评价。实验结果表明,我们的方法能够明显提高检索结果的数量和质量。
[Abstract]:Verbose query is a query with complex sentence components submitted by the user. The current search engine has achieved good results for keyword retrieval. But for lengthy query, if all words are used as keywords to retrieve. We try to use the word correlation degree between keywords, find semantic implication, delete the "small amount of information" keywords, improve the retrieval effect. For the experimental results. In the evaluation part of "machine oriented", we evaluate automatically according to the red rate and the number of results returned by search engine. In the part of "user oriented" evaluation, we evaluate the search result document manually. The experimental results show that our method can obviously improve the quantity and quality of search results.
【作者单位】: 哈尔滨工业大学计算机科学与技术学院社会计算与信息检索研究中心;腾讯公司搜索平台部;
【基金】:国家自然科学基金面上项目(61073126,61273321);国家自然科学基金(61133012) 国家863前沿技术研究项目(2012AA011102)
【分类号】:TP391.3


本文编号:1492868

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1492868.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户62882***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com