跨设备识别用户及其行为研究
发布时间:2018-05-17 00:21
本文选题:跨设备识别用户 + 特征空间 ; 参考:《西南大学》2017年硕士论文
【摘要】:随着各种智能电子设备在人们生活中的广泛应用,比如智能手机,平板电脑,笔记本电脑等各种移动智能设备,人们越来越倾向于通过不同的智能设备来完成相同的任务。然而,当用户在不同智能设备之间来回切换完成任务的时候,他们的识别信息就会变得非常模糊,以至于难以追踪到他们的踪迹。广告商希望能够找到使用这些设备的用户而不是设备本身,这样便可以针对用户所要完成的任务来做一些精准营销。因此,近些年来跨设备识别用户逐渐成为了一个热门的研究主题,它对于提高广告营销的价值以及提升用户的体验具有重要的意义。近些年来,很多普通的家庭或者个人都拥有多个可以连接互联网的智能设备,随着物联网时代的来临,智能设备更会呈现爆发式的增长。广告公司总是希望无缝地连接到设备背后的消费者,而不是设备本身。传统的办法是利用一些确定性的特征,比如电话号码,身份证号,电子邮箱等,这些特征需要用户主动提供,类似于我们日常使用的登录帐号。当用户在不同智能设备之间来回切换时,根据确定性特征便可以唯一确定一个用户。然而,出于对隐私性和安全性的考虑,用户很可能会拒绝提供他们的私人信息,这就给跨设备识别用户带来了很大的困难和挑战。针对传统跨设备识别方法的不足,近些年来已有一些学者对传统方法尝试了不同的改进,大多数研究以分析用户行为的一致性为基础。随着机器学习的兴起,一些学者提出基于概率的机器学习方法来预测用户拥有某一智能设备的概率,很好的提升了跨设备识别的准确率。然而,跨设备用户的行为数据的规模通常是非常巨大的,而且非常稀疏,现有的一些研究通常都面临着数据规模以及时间消耗的问题。本文在跨设备识别用户的需求越来越强烈的背景下,通过分析以及处理了大量的用户跨设备行为数据,充分对比了现有的机器学习方法的优缺点,并讨论了时间消耗以及数据稀疏性的处理问题,提出了基于优化提升的FFM模型,解决了跨设备识别用户的问题。本文贡献如下:1)用户行为分析及其特征空间:对跨设备用户行为进行了详细的分析,并对数据进行了较完整的预处理,通过分析特征之间的关系生成了更加完整的特征。同时对数据的缺失值进行处理,进行了One-Hot编码,数据标准化等处理,使预测结果更好。2)不同算法之间的比较:充分比较了可用于解决跨设备识别用户问题的八种机器学习模型,比较了它们在不同数据集上的表现,同时讨论了不同模型的时间消耗问题,得到了XGBoost是较好的处理这个问题的模型的结论,并探究了XGBoost模型的最优参数选择问题。3)提出了基于优化提升的FFM模型:对于大规模数据的稀疏性问题,FFM模型能较好的进行处理,我们在它的基础上,根据跨设备用户行为的地域特征,提出了基于优化提升的FFM模型。模型不但能解决大规模数据的稀疏性问题,而且在十一种模型的对比实验结果上表明,我们的模型具有更好的实验结果以及更稳定的特性,同时我们探究了模型的参数选择最优化问题。
[Abstract]:In recent years , many ordinary households or individuals have many kinds of smart devices that can connect the Internet . This paper discusses eight kinds of machine learning models which can be used to solve the problem of cross - device identification .
【学位授予单位】:西南大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP181
【参考文献】
相关期刊论文 前1条
1 王国霞;刘贺平;;个性化推荐系统综述[J];计算机工程与应用;2012年07期
,本文编号:1899061
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/1899061.html