融合用户兴趣和混合估计的微博检索模型研究

发布时间:2021-10-24 20:16
  中国互联网络信息中心发布的第42次《中国互联网络发展状况统计报告》显示:截止2018年6月,中国微博用户规模已达3.37亿人,在整体网民数中微博用户数占比已达42.1%。巨大的用户数量使微博逐渐成为人们获取和分享信息的重要途径。为从庞大的微博数据中获取有效信息,微博检索已成为微博服务的重要组成部分。微博检索虽属文本检索范畴,但却不同于传统文本检索,两者的区别主要体现在排序原则和搜索数据两个方面。在排序原则方面,微博检索除要考虑查询与文档的内容相似度外,还应考虑其它因素,如时间、兴趣、博文质量等;在搜索数据方面,微博检索面向的是微博文档,其典型特点是长度较短、内容稀疏。结合微博检索的特点,本文在查询似然模型的基础上提出一个融合用户兴趣和混合估计的微博检索模型。新模型主要对传统查询似然模型中的文档先验概率和文档语言模型估计进行改进,具体工作体现在两个方面:(1)在文档先验概率方面,首先通过量化用户对微博的兴趣行为得到用户的兴趣博文库,然后通过计算用户兴趣博文库和微博之间的相似度对微博集中每条微博先验概率的计算进行改进,最终使符合用户兴趣的微博具有较高的先验概率,以在一定程度上满足用户的个性... 

【文章来源】:河北大学河北省

【文章页数】:55 页

【学位级别】:硕士

【部分图文】:

融合用户兴趣和混合估计的微博检索模型研究


论文组织结构

信息检索,基本流程,查询表达式


的查询请求,将用户信息需求转化成查询表达式,然后对查询表达式进行进一步的分析和扩展;③在文档库中匹配出相关的文挡,并通过特定的检索模型对检索到的文档进行排序,最终将结果返回给用户。信息检索的基本流程如图2-1所示:图 2-1 信息检索的基本流程信息检索系统的主要功能包括:①对用户的特定信息需求进行描述,即:根据用户的输入信息,生成一个查询表达式,然后对查询表达式进行进一步分析,以满足检索要求;②建立文档索引,即:收集所要检索的半结构化或非结构化文档,并为其建立索引;③对文档进行表示,即:如何来存储文档和表示文档的内容,建立供检索用的文档库。④对查询和文档进行匹配,即:根据具体模型和算法从文档库中找出与用户需求相关的文挡。⑤进行相关性反馈,即:把检索的结果按照相关性反馈给用户,用户可以把自己对检索结果的意见反馈给系统,从而提高后续的检索效果。微博检索属于信息检索范畴

界面图,搜索引擎,界面,相关性反馈


⑤进行相关性反馈,即:把检索的结果按照相关性反馈给用户,用户可以把自己对检索结果的意见反馈给系统,从而提高后续的检索效果。微博检索属于信息检索范畴,其基本流程同样可以依据上述过程进行实现。图2-2展示了新浪类微博提供的微博搜索引擎界面,从图中可以看出:微博搜索可以实现综合、找人、文章、视频、图片、话题六种功能。现有研究大多主要针对微博文本信息进行研用户信息需求查询表达式相关反馈对检索表达式分析和扩展检索结果匹配并检索 文档表示 文档索引文档库

【参考文献】:
期刊论文
[1]中文关键短语自动提取方法研究[J]. 荣垂田,李银银,王琰.  计算机科学与探索. 2019(09)
[2]基于文本和公式的科技文档相似度计算[J]. 徐建民,许彩云.  数据分析与知识发现. 2018(10)
[3]面向微博短文本的社交与概念化语义扩展搜索方法[J]. 崔婉秋,杜军平,寇菲菲,李志坚,Lee JangMyung.  计算机研究与发展. 2018(08)
[4]基于用户扩展兴趣的微博推荐方法[J]. 徐建民,刘明艳,王苗.  计算机应用研究. 2019(06)
[5]基于潜在语义与图结构的微博语义检索[J]. 肖宝,李璞,胡娇娇,蒋运承.  计算机工程. 2017(06)
[6]一种基于用户动态兴趣和社交网络的微博推荐方法[J]. 陈杰,刘学军,李斌,章玮.  电子学报. 2017(04)
[7]基于维基语义扩展的微博话题追踪模型研究[J]. 唐晓波,王中勤,钟林霞.  情报科学. 2017(02)
[8]吕苏语口语标注语料的自动分词方法研究[J]. 于重重,操镭,尹蔚彬,张泽宇,郑雅.  计算机应用研究. 2017(05)
[9]基于词汇时间分布的微博查询扩展[J]. 韩中元,杨沐昀,孔蕾蕾,齐浩亮,李生.  计算机学报. 2016(10)
[10]面向微博搜索的时间敏感的排序学习方法[J]. 王书鑫,卫冰洁,鲁骁,王斌.  中文信息学报. 2015(04)

博士论文
[1]基于时间特性的微博检索和微博过滤研究[D]. 韩中元.哈尔滨工业大学 2016



本文编号:3455909

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3455909.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d2c5a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com