当前位置:主页 > 科技论文 > 搜索引擎论文 >

数据稀疏和隐性反馈条件下用户偏好挖掘方法

发布时间:2020-07-12 12:09
【摘要】:个性化推荐服务在当前互联网中随处可见,比如电子商务中的商品推荐系统、搜索引擎网站的个性化搜索等。这样的应用需要对用户的个人偏好有很好的理解。用户偏好挖掘不是简单的向用户推荐具体项目,而是要理解用户对项目的某种属性的偏爱。它可以被归纳为一个协同过滤问题,但面临更多挑战,这是由用户数据的特点决定的。首先,数据是极度稀疏的。单一用户在某一领域中对具体项目的隐性反馈是非常稀有的,可想而知,多用户间共享属性信息也是极度稀有的。其次,隐性反馈,用户不会对项目的具体属性做出直接的评分。从这样的数据中只能得到正反馈,从用户对某项目的行为中推测其偏好。 协同过滤技术很早就在推荐系统中得到了广泛的应用。它利用相似用户的用户很大概率会拥有相似的品味这一基本假设,对特定用户的偏好和行为做出预测,也在实际应用中取得了较好的效果。但是现有的协同过滤技术不能很好地解决上述两个用户偏好挖掘中的问题,需要进行改造。首先通过跨领域集体学习,使用户在不同领域中的行为数据可以被相互利用,继而学习过程将会彼此相互加强,以此解决单个域内数据稀疏的问题。另一方面,在学习过程中引入贝叶斯个人化排序(BayesianPersonalized Ranking,简称BPR)优化条件。BPR作为一种通用学习框架,在学习过程中以排序为目标进行数据拟合,取代传统的以二值分类为目标的方法,以解决只有正反馈的问题。 实验证明了这种方法的优越性。实验采用两种真实世界的数据集分别是用户对电影的评分数据和用户在搜索引擎中的搜索关键字数据,分别在其中挖掘用户对演员的偏好和对商品品牌的偏好。实验中用AUC统计指标比较了各种方法的挖掘结果,并且比较了它们在数据稀疏性不断增长下的性能表现。改造后的方法在数据集上的预测性能均优于现在几种最流行的协同过滤方法。并且,当数据的稀疏程度变得愈严重时,其取得的优势愈明显,表现出很好的稳定性。
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP311.13

【共引文献】

相关期刊论文 前1条

1 张锋;常会友;;使用BP神经网络缓解协同过滤推荐算法的稀疏性问题[J];计算机研究与发展;2006年04期

相关会议论文 前1条

1 Cane Wingki Leung;Stephen Chifai Chan;Korris Fulai Chung;;Towards Collaborative Travel Recommender Systems[A];第四届电子商务国际会议论文集(Ⅰ)[C];2004年

相关博士学位论文 前2条

1 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年

2 王宏宇;商务推荐系统的设计研究[D];中国科学技术大学;2007年

相关硕士学位论文 前4条

1 林颖;基于Web挖掘的信息推荐技术研究[D];扬州大学;2006年

2 韩慧俊;电子商务个性化推荐系统的研究[D];上海交通大学;2007年

3 顾勇镛;一种混合型信息推送技术研究及其在企业情报服务平台中的应用[D];浙江大学;2008年

4 田冰;分布式异构贝叶斯网络模型及其移动商务应用[D];广东工业大学;2008年



本文编号:2751939

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2751939.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ca8e0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com