网络用户偏好预测关键技术研究
发布时间:2021-10-14 08:25
随着互联网和移动计算技术的不断发展,以社交网络、电子商务为代表的网络应用迅速普及,致使网络中数据产生的速度和规模都空前高涨,人们进入了大数据时代。这些数据中蕴含着大量与人们的偏好相关的信息,如何从大量纷繁复杂的数据信息中准确、快速地找出人们关心的内容,如何有效地挖掘、理解和预测用户偏好进而提供个性化推荐服务,是目前互联网数据科学领域学术界和工业界共同关注的热点问题。传统的基于人工、基于统计和经验公式、基于单一协同过滤的方法已经不能适应现实互联网环境中数据庞大、主体多、无中心等特点。同时,网络用户行为呈现出高度复杂化和多样化的特征,传统用户分析模型难以准确挖掘数据的本质规律,定位用户偏好。此外,机器学习、人工智能技术的发展为用户偏好预测研究提供了新的思路,但仍处于探索发展阶段。鉴于此,本文以个性化推荐为目标,对用户偏好预测研究过程中偏好表达不完整、模型不合理、特殊因素影响未考虑等问题进行深入讨论,尝试运用机器学习的思想方法,从完善模型、提高推荐效率等角度出发,对网络用户偏好预测关键技术进行研究。依照研究对象(偏好获取方式)从直接到间接,研究场景从通用到特殊的顺序,将重点放在评分预测、基于...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:131 页
【学位级别】:博士
【部分图文】:
图2.1矩阵分解过程??
真实矩阵与预测矩阵之间的欧氏距,二三,其由用户潜在特征矩阵户及物品潜在特征矩阵2通过计算F范数得出。??和;le为正则化参数,用来控制两个潜在特征矩阵的正则化矩阵。??统的参数静态化矩阵分解模型中,无论是RMF还是NMF,PMF,其正则为一个基于实验的固定值。预测矩阵会最终收敛,并且预测值会越。因此,在每一次的更新迭代中,及矩阵并不是固定不变的,而是随着不迭代过程而不停变化的,但是指导矩阵分解过程的正则化参数在传统模是固定不变的。通过上述分析,可以假设控制迭代更新的正则化参数4和乂个固定的值,因为不同准确率的2矩阵对于每一次优化迭代时目标函程度是不相同的。??了更直观的验证上述假设,本节以RMF模型为基础,以20次迭代为一周期,取5个不同的正则化参数值(5,4,3,2,1),共取200次迭代来进行实验统计并观察变化规律。实验中,以每20次的迭代后所得的数据作为初始测此可得11个不同预测精度的初始测试集,然后以每个测试集为基准,验础上的最佳正则化参数取值,实验以RMSE作为验证指标。(详见3.5.2)??-
图2.3初始评分与预测评分分布规律图??Figure?2.3?distribution?of?initial?ratings?and?predicted?ratings??观察图2.3可得,无论是在Movilens还是Epinions数据集中,初始评分的分??布比较相较预测评分来说,分布比较分散,而预测评分多集中在2到4之间,评分??1和5数量很少。例如在Epinions数据集中,初始评分分布中,评分2-4分占到了??总评分数的57%,预测评分中,2-4评分区间的评分数占总评分数的比例为72.6%,??两者相差15.6%。尽管利用RMSE等指标验证后的整体更新性能优秀,但是和测??试集显示的真实评分分布情况仍有差距,因此需要一个微调机制来调整上述问题。??2.3.4?评分微调算法??针对实际评分分布与预测评分分布之间的差距问题,本节提出矩阵分解的微??调算法,算法的基本原理是,使预测评分在不失准确率的前提下向接近实际评分分??布的方向上去更新。如公式2.29所示
【参考文献】:
期刊论文
[1]基于迭代加权回归的推荐算法[J]. 谭姗姗,张培倩,李再兴. 数学理论与应用. 2014(03)
[2]基于受限信任关系和概率分解矩阵的推荐[J]. 印桂生,张亚楠,董宇欣,韩启龙. 电子学报. 2014(05)
[3]考虑长期与短期兴趣因素的用户偏好建模[J]. 王洪伟,邹莉. 同济大学学报(自然科学版). 2013(06)
[4]微博中基于用户偏好的信息传播研究[J]. 王金辉,贺利坚,张伟,童向荣. 计算机工程与科学. 2013(03)
[5]基于用户聚类的异构社交网络推荐算法[J]. 陈克寒,韩盼盼,吴健. 计算机学报. 2013(02)
[6]在线社会网络用户的信息分享行为预测研究[J]. 刘臣,田占伟,于晶,单伟. 计算机应用研究. 2013(04)
[7]一种上下文移动用户偏好自适应学习方法[J]. 史艳翠,孟祥武,张玉洁,王立才. 软件学报. 2012(10)
[8]适应用户需求进化的个性化信息服务模型[J]. 谢海涛,孟祥武. 电子学报. 2011(03)
[9]非负矩阵分解算法综述[J]. 李乐,章毓晋. 电子学报. 2008(04)
[10]基于用户行为分析的自适应新闻推荐模型[J]. 高琳琦. 图书情报工作. 2007(06)
博士论文
[1]基于位置社交网络的数据挖掘[D]. 连德富.中国科学技术大学 2014
硕士论文
[1]网络用户偏好分析方法的研究[D]. 张欢.北京交通大学 2014
[2]基于社交网络和地理位置信息的好友推荐方法研究[D]. 刘乾.浙江大学 2013
[3]基于本体的个性化用户模型研究[D]. 陈琳娜.燕山大学 2006
本文编号:3435801
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:131 页
【学位级别】:博士
【部分图文】:
图2.1矩阵分解过程??
真实矩阵与预测矩阵之间的欧氏距,二三,其由用户潜在特征矩阵户及物品潜在特征矩阵2通过计算F范数得出。??和;le为正则化参数,用来控制两个潜在特征矩阵的正则化矩阵。??统的参数静态化矩阵分解模型中,无论是RMF还是NMF,PMF,其正则为一个基于实验的固定值。预测矩阵会最终收敛,并且预测值会越。因此,在每一次的更新迭代中,及矩阵并不是固定不变的,而是随着不迭代过程而不停变化的,但是指导矩阵分解过程的正则化参数在传统模是固定不变的。通过上述分析,可以假设控制迭代更新的正则化参数4和乂个固定的值,因为不同准确率的2矩阵对于每一次优化迭代时目标函程度是不相同的。??了更直观的验证上述假设,本节以RMF模型为基础,以20次迭代为一周期,取5个不同的正则化参数值(5,4,3,2,1),共取200次迭代来进行实验统计并观察变化规律。实验中,以每20次的迭代后所得的数据作为初始测此可得11个不同预测精度的初始测试集,然后以每个测试集为基准,验础上的最佳正则化参数取值,实验以RMSE作为验证指标。(详见3.5.2)??-
图2.3初始评分与预测评分分布规律图??Figure?2.3?distribution?of?initial?ratings?and?predicted?ratings??观察图2.3可得,无论是在Movilens还是Epinions数据集中,初始评分的分??布比较相较预测评分来说,分布比较分散,而预测评分多集中在2到4之间,评分??1和5数量很少。例如在Epinions数据集中,初始评分分布中,评分2-4分占到了??总评分数的57%,预测评分中,2-4评分区间的评分数占总评分数的比例为72.6%,??两者相差15.6%。尽管利用RMSE等指标验证后的整体更新性能优秀,但是和测??试集显示的真实评分分布情况仍有差距,因此需要一个微调机制来调整上述问题。??2.3.4?评分微调算法??针对实际评分分布与预测评分分布之间的差距问题,本节提出矩阵分解的微??调算法,算法的基本原理是,使预测评分在不失准确率的前提下向接近实际评分分??布的方向上去更新。如公式2.29所示
【参考文献】:
期刊论文
[1]基于迭代加权回归的推荐算法[J]. 谭姗姗,张培倩,李再兴. 数学理论与应用. 2014(03)
[2]基于受限信任关系和概率分解矩阵的推荐[J]. 印桂生,张亚楠,董宇欣,韩启龙. 电子学报. 2014(05)
[3]考虑长期与短期兴趣因素的用户偏好建模[J]. 王洪伟,邹莉. 同济大学学报(自然科学版). 2013(06)
[4]微博中基于用户偏好的信息传播研究[J]. 王金辉,贺利坚,张伟,童向荣. 计算机工程与科学. 2013(03)
[5]基于用户聚类的异构社交网络推荐算法[J]. 陈克寒,韩盼盼,吴健. 计算机学报. 2013(02)
[6]在线社会网络用户的信息分享行为预测研究[J]. 刘臣,田占伟,于晶,单伟. 计算机应用研究. 2013(04)
[7]一种上下文移动用户偏好自适应学习方法[J]. 史艳翠,孟祥武,张玉洁,王立才. 软件学报. 2012(10)
[8]适应用户需求进化的个性化信息服务模型[J]. 谢海涛,孟祥武. 电子学报. 2011(03)
[9]非负矩阵分解算法综述[J]. 李乐,章毓晋. 电子学报. 2008(04)
[10]基于用户行为分析的自适应新闻推荐模型[J]. 高琳琦. 图书情报工作. 2007(06)
博士论文
[1]基于位置社交网络的数据挖掘[D]. 连德富.中国科学技术大学 2014
硕士论文
[1]网络用户偏好分析方法的研究[D]. 张欢.北京交通大学 2014
[2]基于社交网络和地理位置信息的好友推荐方法研究[D]. 刘乾.浙江大学 2013
[3]基于本体的个性化用户模型研究[D]. 陈琳娜.燕山大学 2006
本文编号:3435801
本文链接:https://www.wllwen.com/guanlilunwen/shequguanli/3435801.html