当前位置:主页 > 科技论文 > 搜索引擎论文 >

个性化检索系统中用户兴趣模型构建研究

发布时间:2018-12-07 11:57
【摘要】:随着大数据时代的到来,如何管理、利用互联网中已存在的海量数据成为当下的热点。每天用户对于互联网产品的使用都产生大量的历史数据,但一般的搜索引擎并不会利用这些数据,其检索的结果也通常无法满足用户的个性化需求。因此,个性化检索系统已经成为互联网新技术中的一个研究热点。本文首先介绍了查询-概念二分图理论,通过分析其中对查询权重设计不合理的问题,提出以查询为单位划分用户浏览历史。本文利用从用户历史中抽取的概念描述查询,对于查询本文在计算其权重时参考了查询使用的时间、出现的先后次序等因素。用户兴趣建模过程中本文通过聚类算法将相似的查询组合在一起,降低了用户兴趣模型的维度,使得每个查询在模型中的比例更加合理。在模型存储和更新问题上,本文提出自己了的存储格式、更新算法。最后,利用构建的个性化检索原型系统,实现了用户浏览历史的捕捉,通过模拟用户的浏览过程验证了以查询为单位对用户兴趣的描述更合理。在与其他建模算法的对比中证明了本文提出的建模算法能够获得更为优秀的兴趣模型。系统运行的结果体现了本文设计的更行算法也较为合理。
[Abstract]:With the arrival of big data era, how to manage and utilize the huge amount of data in the Internet has become a hot spot. Every day, users produce a lot of historical data for the use of Internet products, but general search engines do not use these data, and their retrieval results are usually unable to meet the personalized needs of users. Therefore, personalized retrieval system has become a research hotspot in the new Internet technology. This paper first introduces the theory of query-concept bipartite graph. By analyzing the unreasonable design of query weights, this paper proposes to divide the browsing history of users with query as a unit. In this paper, we use the concept extracted from the user history to describe the query. For the query, we refer to the time used in the query, the order of occurrence and other factors in the calculation of the weight of the query. In the process of user interest modeling similar queries are combined by clustering algorithm which reduces the dimension of user interest model and makes the proportion of each query in the model more reasonable. In the problem of model storage and updating, this paper proposes its own storage format and update algorithm. Finally, the user's browsing history is captured by using the personalized retrieval prototype system, and the user's interest is described more reasonably by simulating the user's browsing process. In comparison with other modeling algorithms, it is proved that the proposed modeling algorithm can obtain better interest model. The result of the system operation shows that the algorithm designed in this paper is more reasonable.
【学位授予单位】:长春工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3

【参考文献】

相关期刊论文 前10条

1 李峰;裴军;游之洋;;基于隐式反馈的自适应用户兴趣模型[J];计算机工程与应用;2008年09期

2 赖玉霞;刘建平;;K-means算法的初始聚类中心的优化[J];计算机工程与应用;2008年10期

3 王国霞;刘贺平;;个性化推荐系统综述[J];计算机工程与应用;2012年07期

4 蒲国林;杨清平;王刚;邱玉辉;;基于语义的个性化用户兴趣模型[J];计算机科学;2008年07期

5 顾其威;郭鹏;潘锋;;手机广告推荐中的用户兴趣建模研究[J];计算机应用研究;2012年02期

6 郝水龙;吴共庆;胡学钢;;基于层次向量空间模型的用户兴趣表示及更新[J];南京大学学报(自然科学版);2012年02期

7 王留正;何振峰;;基于全局性分裂算子的进化K-means算法[J];计算机应用;2012年11期

8 宋艳娟;陈振标;;个性化检索系统中用户兴趣模型的研究[J];计算机与数字工程;2013年02期

9 潘金贵,胡学联,李俊,张灵玲;一个个性化的信息搜集Agent的设计与实现[J];软件学报;2001年07期

10 仝雪姣;孟凡荣;王志晓;;对k-means初始聚类中心的优化[J];计算机工程与设计;2011年08期

相关博士学位论文 前1条

1 余轶军;Web访问信息挖掘若干关键技术的研究[D];浙江大学;2006年

相关硕士学位论文 前9条

1 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年

2 戴雪梅;面向购物的聚类搜索引擎的研究与实现[D];北京交通大学;2011年

3 冯子威;用户兴趣建模的研究[D];哈尔滨工业大学;2010年

4 马恩穹;基于Web数据挖掘的个性化搜索引擎研究[D];南京理工大学;2012年

5 李爱明;个性化搜索引擎用户模型研究[D];华中师范大学;2007年

6 陈抒然;面向个性化服务的用户兴趣建模及应用研究[D];重庆大学;2007年

7 孟庆顺;Web信息检索结果聚类系统的研究[D];天津大学;2007年

8 邹博伟;个性化信息检索中用户兴趣模型的研究[D];哈尔滨工业大学;2009年

9 郝水龙;面向个性化服务的用户兴趣模型表示及更新研究[D];合肥工业大学;2012年



本文编号:2367165

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2367165.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b6741***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com