一种分布式用户浏览点击模型算法
发布时间:2021-05-14 11:58
为从海量搜索点击日志中快速挖掘用户行为,提出一种分布式用户浏览点击模型(UBM)算法。原始UBM算法求出的检验度参数E只与搜索结果文档所在排序位置以及上一文档的点击位置有关,且非常稳定,基于此特性,将EM迭代求解转换为抽样估计检验度以求解吸引度的分布式UBM算法。在Spark数据平台上进行仿真,结果表明,与原始UBM算法相比,该算法能够解决点击日志中存在的严重数据倾斜问题,且运行效率较高。
【文章来源】:计算机工程. 2019,45(03)北大核心CSCD
【文章页数】:6 页
【文章目录】:
0 概述
1 UBM算法
2 UBM分布式过程中存在的问题
3 分布式UBM算法设计
3.1 总体框架
3.2 数据抽样与检验度参数E估计
3.3 吸引度A求解
4 基于Spark的分布式UBM算法实现
5 实验结果与分析
6 结束语
【参考文献】:
期刊论文
[1]搜索引擎点击模型综述[J]. 王超,刘奕群,马少平. 智能系统学报. 2016(06)
[2]EM算法研究与应用[J]. 王爱平,张功营,刘方. 计算机技术与发展. 2009(09)
本文编号:3185596
【文章来源】:计算机工程. 2019,45(03)北大核心CSCD
【文章页数】:6 页
【文章目录】:
0 概述
1 UBM算法
2 UBM分布式过程中存在的问题
3 分布式UBM算法设计
3.1 总体框架
3.2 数据抽样与检验度参数E估计
3.3 吸引度A求解
4 基于Spark的分布式UBM算法实现
5 实验结果与分析
6 结束语
【参考文献】:
期刊论文
[1]搜索引擎点击模型综述[J]. 王超,刘奕群,马少平. 智能系统学报. 2016(06)
[2]EM算法研究与应用[J]. 王爱平,张功营,刘方. 计算机技术与发展. 2009(09)
本文编号:3185596
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3185596.html