一种基于最近搜索周期被引用频率的改进WPR算法
发布时间:2017-08-05 15:04
本文关键词:一种基于最近搜索周期被引用频率的改进WPR算法
更多相关文章: 主题特征 被引用频率 偏重旧网页 搜索周期 主题漂移
【摘要】:针对WPR(Weighted PageRank)算法存在的在网页搜索方面的主题漂移和偏重旧网页的现象,综合网页的主题特征和最近搜索周期网页的被引用频率两个因素,提出了一种改进的算法WTFPR(Weighted Topic Frequency PageRank)。该算法通过内容分析,采用改进的TD-IDF算法来解决网页相关性,改善主题漂移现象;通过网页的最近搜索周期的被引用频率来提高那些较新而且价值较高的网页的PR值,从而改善偏重旧网页的现象。仿真结果表明,改进后的算法与WPR算法相比获得了更好的效果。
【作者单位】: 兰州理工大学计算机与通信学院;
【关键词】: 主题特征 被引用频率 偏重旧网页 搜索周期 主题漂移
【分类号】:TP393.092
【正文快照】: 1概述当今互联网已经成为现代共享信息的主要载体,无论网站网页数量还是用户数量都特别巨大,搜索引擎在搜索信息方面占据主要地位。从用户行为上看,多数用户在使用搜索引擎的搜索结果时,只会点击搜索出来的前2页中10到20个高相关度的搜索结果。因此如何将最能满足用户需求的页,
本文编号:625479
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/625479.html