当前位置:主页 > 科技论文 > 软件论文 >

基于词汇时间分布的微博查询扩展

发布时间:2018-07-04 16:13

  本文选题:微博检索 + 查询扩展 ; 参考:《计算机学报》2016年10期


【摘要】:该文提出了一种面向微博检索的基于词汇时间分布的查询扩展方法.该方法利用扩展词与查询词的时间分布的相似性来度量扩展词与查询词之间的相关度,建立了基于词汇时间分布的查询模型.具体而言,该文在提出词汇时间分布的定义和估计方法的基础上,给出了查询词与扩展词的时间分布相似性的度量,以此作为它们的相关度,完成扩展词的选择和查询模型的重估.该文方法利用时间信息而不是内容来扩展查询,避免了基于内容的查询扩展方法因微博内容短而无法准确估计扩展词的不足.由TREC 2011和TREC 2012微博检索评测数据上的实验结果表明,基于词汇时间分布的查询扩展模型有效地提高了微博检索的性能,不仅显著优于经典的基于内容的查询扩展模型,而且优于其他利用时间进行查询扩展的方法.
[Abstract]:In this paper, a query extension method based on word time distribution for Weibo retrieval is proposed. This method uses the similarity of time distribution between extended words and query words to measure the correlation between extended words and query words, and establishes a query model based on word time distribution. Specifically, on the basis of the definition and estimation method of lexical time distribution, this paper gives a measure of the similarity of temporal distribution between query words and extended words, which is regarded as their correlation degree. The selection of extended words and the revaluation of query model are completed. In this paper, time information rather than content is used to extend the query, which avoids the shortage of the method of query expansion based on content because of the short content of Weibo, which can not accurately estimate the extension words. The experimental results of TREC 2011 and TREC 2012 Weibo retrieval and evaluation data show that the query expansion model based on lexical time distribution can effectively improve the performance of Weibo retrieval, and it is not only superior to the classical content-based query expansion model, but also better than that of the classical content-based query extension model. Moreover, it is superior to other methods of query expansion using time.
【作者单位】: 哈尔滨工业大学计算机科学与技术学院;黑龙江工程学院计算机科学与技术学院;
【基金】:国家自然科学基金(61370170,61402134,61173074) 国家社科基金(14CTQ032)资助~~
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 阳小华;蒋辉;马家宇;;基于任务上下文的查询扩展方法[J];郑州大学学报(理学版);2010年01期

2 吴煈;张奇;黄萱菁;;基于整数线性规划的查询扩展[J];计算机研究与发展;2013年08期

3 何燕;;基于用户反馈的查询扩展研究[J];情报理论与实践;2013年08期

4 黄伟群;;基于用户视角的交互式查询扩展研究[J];图书情报工作;2014年05期

5 黄名选;严小卫;张师超;;查询扩展技术进展与展望[J];计算机应用与软件;2007年11期

6 林国俊;叶飞跃;耿冬;郑国良;;基于语义的概念查询扩展[J];计算机工程与设计;2009年06期

7 巩玉玺;王大玲;;一种改进的基于伪相关反馈的查询扩展[J];微计算机信息;2009年15期

8 黄名选;张师超;严小卫;;基于查询行为和关联规则的相关反馈查询扩展[J];计算机工程;2009年10期

9 张超盟;李战怀;温宗臣;;局部上下文分析剪枝概念树的查询扩展[J];计算机工程;2009年14期

10 罗小聪;;基于专用双语词典的查询扩展[J];现代计算机(专业版);2009年10期

相关会议论文 前10条

1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年

2 吕碧波;赵军;;基于相关文档池建模的查询扩展[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

3 林建方;李生;郑德权;;基于词语搭配关系的查询扩展方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

4 丁国栋;白硕;王斌;;一种基于局部共现的查询扩展方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

5 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

6 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

7 王秉卿;张奇;吴立德;黄萱菁;;机器学习的查询扩展在博客检索中的应用[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

8 王秉卿;黄萱菁;;基于线性模型的查询扩展方法[A];第五届全国信息检索学术会议论文集[C];2009年

9 晋松;林鸿飞;苏绥;;基于标签共现的查询扩展研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

10 郭文;史晓东;陈毅东;;跨语言信息检索中的查询扩展[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

相关博士学位论文 前3条

1 郭晓黎;煤矿安全事件本体及其在查询扩展中的应用研究[D];中国矿业大学(北京);2016年

2 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年

3 王俊义;正负相关反馈与查询扩展技术的研究[D];内蒙古大学;2012年

相关硕士学位论文 前10条

1 姚小同;查询扩展技术研究[D];北京邮电大学;2009年

2 许威;基于概念格的查询扩展系统及建格算法研究[D];北京邮电大学;2008年

3 胡保祥;基于查询日志的查询扩展研究[D];北京邮电大学;2013年

4 董静;基于信任网络的查询扩展技术研究[D];哈尔滨工程大学;2013年

5 郭青;基于用户标注信息的查询扩展方法研究[D];大连理工大学;2014年

6 尹俊杰;基于本体术语关系的局部查询扩展[D];河北大学;2012年

7 瞿国忠;查询扩展技术研究[D];华中师范大学;2007年

8 林智超;基于查询扩展的网络信息语义检索服务的研究与实现[D];华东师范大学;2012年

9 陈U,

本文编号:2096626


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2096626.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cafc6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com