海量Web搜索引擎系统中用户行为的分布特征及其启示
发布时间:2018-03-06 17:39
本文选题:万维网 切入点:搜索引擎 出处:《中国科学E辑:技术科学》2001年04期 论文类型:期刊论文
【摘要】:统计分析了大规模搜索引擎系统的用户行为的分布特征 .结果表明 ,用户查询内容和URL点击表现出明显的局部性 ;用户查询的分布符合幂函数的特征并具有良好的自相似性 .基于上述规律 ,设计了查询cache ,比较了FIFO ,LRU及带衰减的LFU等 3种cache替换策略 .然后 ,基于用户行为考察了海量网页信息的分布特征 ,并利用URL的入度、镜像度、目录深度等网页参数与用户行为反馈后的相关度的方差分析 ,阐明了其对优化搜索引擎系统定序算法 (rankingalgorithm)的启示 .
[Abstract]:The distribution characteristics of user behavior in large-scale search engine system are statistically analyzed. The results show that the content of user query and URL click show obvious locality. The distribution of user queries conforms to the characteristics of power function and has good self-similarity. Based on the above rules, the query cache is designed, and three cache substitution strategies, FIFO LRU and LFU with attenuation, are compared. Based on user behavior, the distribution characteristics of massive web pages are investigated, and the variance analysis of the correlation between the web page parameters such as URL entry, mirroring degree, directory depth and user behavior feedback is made. The enlightenment of this algorithm to the ranking algorithm of search engine optimization system is expounded.
【作者单位】: 北京大学计算机科学技术系网络与分布式系统研究室!北京100871 北京大学计算机科学技术系网络与分布式系统研究室!北京100871 北京大学计算机科学技术系网络与分布式系统研究室!北京100871 北京大学计算机科学技术系网络与分布式系统研究室!北京100871 ,
本文编号:1575824
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1575824.html