当前位置:主页 > 科技论文 > 搜索引擎论文 >

一种分布式用户浏览点击模型算法

发布时间:2021-05-14 11:58
  为从海量搜索点击日志中快速挖掘用户行为,提出一种分布式用户浏览点击模型(UBM)算法。原始UBM算法求出的检验度参数E只与搜索结果文档所在排序位置以及上一文档的点击位置有关,且非常稳定,基于此特性,将EM迭代求解转换为抽样估计检验度以求解吸引度的分布式UBM算法。在Spark数据平台上进行仿真,结果表明,与原始UBM算法相比,该算法能够解决点击日志中存在的严重数据倾斜问题,且运行效率较高。 

【文章来源】:计算机工程. 2019,45(03)北大核心CSCD

【文章页数】:6 页

【文章目录】:
0 概述
1 UBM算法
2 UBM分布式过程中存在的问题
3 分布式UBM算法设计
    3.1 总体框架
    3.2 数据抽样与检验度参数E估计
    3.3 吸引度A求解
4 基于Spark的分布式UBM算法实现
5 实验结果与分析
6 结束语


【参考文献】:
期刊论文
[1]搜索引擎点击模型综述[J]. 王超,刘奕群,马少平.  智能系统学报. 2016(06)
[2]EM算法研究与应用[J]. 王爱平,张功营,刘方.  计算机技术与发展. 2009(09)



本文编号:3185596

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3185596.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户03791***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com