基于模糊粗糙集的个性化搜索引擎研究

发布时间：2019-11-06 10:56

【摘要】：随着因特网技术在人类社会活动中的应用越来越广泛，因特网中信息的规模越来越大。庞大的信息数量使得大部分人难以自己检索需要的信息，而只能通过搜索引擎帮助检索。但现有的搜索引擎针对不同的用户返回的是相同的结果，没有考虑用户之间的个性差异，这导致在查询二义词时，必然有一部分用户的体验比其它用户差。而根据调查，中国的用户通常只对第一页的信息感兴趣，这就要求搜索引擎需要根据用户的兴趣将符合其兴趣的搜索结果尽量靠前。但另一方面，搜索引擎返回的搜索结果本身已经考虑到了大部分用户的兴趣、习惯，同时用户也可能会对其它领域也产生临时兴趣，所以完全否定搜索引擎现有排序也是不可取的，可能会过度适应用户的兴趣，导致其只能看到某个领域的内容。本文提出一种基于模糊粗糙集的个性化搜索引擎重排序算法，在百度搜索引擎原始搜索数据的基础上，通过重排序，实现个性化搜索服务。首先，，本文阐述了个性化搜索引擎的一些相关知识；然后提出了一种两级用户兴趣模型，将一级兴趣视为模糊粗糙集的上近似集，二级兴趣视为下近似集；接着提出一种基于模糊粗糙集相似度的重排序算法，计算百度搜索引擎返回结果和用户兴趣模型的相似度，然后结合进百度原有排名；最后，本文列举了实验的结果，并对实验的结果进行了分析，表明可以满足个性化的需求。
【图文】：

百度,搜索引擎,引擎

第 2 章个性化搜索引擎相关知识引擎主要是指能够根据不同用户的不同需求，针对索引擎。如，搜索“火箭”这个词的时候，喜欢篮的结果应该是不一样的。这需要实现对不同用户的和收集，用户模型的建立。然后和数据库里面的网个性化的搜索结果。除此之外，个性化还包括搜索的搜索引擎已经开始了个性化的尝试，推出了形形歌推出了个人主页，用户可以自己定制谷歌主页。”栏目，提供个性化服务，如图 2.1。但这些服务基的推送上，并没有涉及到核心业务——搜索引擎的

下近似集,相似度,百度,权重

图 4.1 下近似集相似度测试结果百度原排名权重百度的权重时，除了平均排名上升以外，那些符合用户记录，也是考察结果好坏的一个标准，所以还要考察排程度。下近似度权重为 0.6，然后分别测试百度权重为 0，0，由下图可知选择 0.2 时，排名变化下降达到顶峰，，此时效果较好。
【学位授予单位】：华侨大学
【学位级别】：硕士
【学位授予年份】：2013
【分类号】：TP391.3

【参考文献】