当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于个人数据的用户画像的算法研究与实现

发布时间:2021-08-02 21:58
  随着互联网发展,其用户规模以及所产生的数据规模呈指数级增长,“信息过载”现象也随之产生。如何从大量的数据中提取出对用户有用的信息、为用户推荐感兴趣的内容成为目前各大互联网公司面临的问题。推荐系统可以很好的解决这些问题,用户画像作为推荐系统的基础,通过对用户属性、行为等信息进行全面分析实现对用户的分类,从而可以为用户提供更好的服务,更好的防止用户的流失。良好的用户画像可以提升推荐系统的性能。本文的主要任务是根据用户历史一个月的搜索词来对用户的属性进行用户画像。针对传统用户画像模型在泛化性和准确率方面的不足,本文研究提出了一种改进的用户画像模型。本文提出了一种基于融合算法的二级用户画像模型,第一级模型主要实现用户与搜索用词在不同层次上的关联关系的功能;第二级模型利用融合算法对用户属性与搜索用词在不同层次上的关联关系进行结合,构建搜索用词与用户之间的最终映射模型。本文的主要研究工作如下:(1)提出了一种将SVMEM算法。针对人工标注数据集稀缺的问题,本文通过将SVM与EM结合,利用少量的人工标注的数据集和部分未标注的数据集来训练分类器,降低了人工标注的成本。实验表明,结... 

【文章来源】:北京工业大学北京市 211工程院校

【文章页数】:67 页

【学位级别】:硕士

【部分图文】:

基于个人数据的用户画像的算法研究与实现


用户画像标签化

网络行为,画像,数据,用户兴趣


图 2-2 用户画像构建Figure 2-2 User Portrait Construction基础数据收集中的数据主要是指网络行为数据、服务内行为数据、用户兴好数据、交易数据等相关的用户数据。网络行为数据是指对网页的访问数网页的停留时间等相关数据;服务内行为数据是指浏览的路径、页面停留时问深度、浏览页面次数等相关数据;用户内容偏好数据是指用户最长浏览以藏的内容、评价的内容、互动内容、喜欢的品牌等相关数据;用户交易数据用户的购买数据、经常买的产品、拒收率、签收率、回头率、购买产品的相格等相关的数据。行为建模主要是对上一步骤中收集到的数据进行处理,在这个阶段中,利器学习对用户的行为、偏好等进行相关的预测与评估。类似于 y=kx+b 中的,x 表示已知信息,y 表示用户的偏好,需要通过不断的实验来精确 k 和终可精确的求得 y。行为建模其实是将大概率事件筛选出来,利用相关的算模型可以排除掉用户的偶然行为。行为建模中会用到大量的模型对用户信息标签化,比如:用户汽车模型、身高体型模型等相关的模型。

分布情况,标签,多级分类,模型更新


图 2-3 用户画像的模型更新Figure 2-3 Model Updates for User Portraits的方式有两种,分别为多级标签和多级分类,比如第一级。在第一级标签中,还包括很多类的标签,这一级标签中标签,比如:年龄、性别等类似的标签,而这些人口属性签中的分类标签。像的相关模型,存在有很多的不同的用户模型的表示方法,比如:基于、基于加权关键字的向量空间模型的表示法、基于主题模型表示法等。多种表示方法如下所示:理统计分析的表示法:它主要是基于数学中的数理统计的进行计算,分别计算出数据之间的关联关系以及分布情况统计、分析和整理并进行归纳和总结。该表示方法的缺点糙。


本文编号:3318350

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3318350.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f7b82***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com