基于矩阵分解的协同过滤推荐算法研究
本文关键词:智能搜索引擎信息过滤机制研究,由笔耕文化传播整理发布。
《吉林大学》 2013年
基于矩阵分解的协同过滤推荐算法研究
张川
【摘要】:当今社会,每个人的身边充斥着大量的信息,尤其是互联网中,海量的信息几乎包含了人们所需要的全部内容,但是“信息过载”问题仍使人们难以找到他们真正需要的东西。“搜索引擎”的出现在很大程度上解决了“信息过载”问题,但是搜索引擎对每个用户提供的都是相同的服务,因此,人们渴望获得更具针对性的个性化的服务。在这种情况下,推荐系统应运而生,它能够给用户提供个性化的信息推荐服务。 20世纪90年代人们开始研究推荐系统,出现了大量关于推荐系统的研究成果,提出了许多种推荐算法,这些推荐算法应用在网页浏览、电影推荐、音乐推荐与电子商务等方面。目前,推荐系统也有了很多成功应用的案例,推荐系统为商家和用户都创造了有用的价值。 本文的主要工作如下: 1.全面介绍了推荐系统的研究背景与研究现状。并介绍了几大类推荐系统,包括基于内容的推荐、基于知识的推荐、协同过滤推荐、基于图结构的推荐和组合推荐,特别是对协同过滤推荐做了较为详细的阐释。 2.详细分析了基于矩阵分解的协同过滤推荐算法,对矩阵分解所采用的梯度下降法做了简介,给出了基本矩阵分解Basic MF(Basic Matrix Factorization)、规范化矩阵分解Regularized MF(Regularized Matrix Factorization)和偏差矩阵分解Biases MF(BiasesMatrix Factorization)的整个流程。对矩阵分解所采用的差异度量方法做了讨论,介绍了不同于一般情况的采用KL散度(Kullback-Leibler Divergence)刻画部分差异的KLDDMF(Kullback-Leibler Divergence and Difference Matrix Factorization)算法。 3.为了提高矩阵分解算法的预测精确度,本文提出了几种新的矩阵分解算法,它们是偏差向量矩阵分解BV MF(Biases Vector Matrix Factorization)、用户相似性矩阵分解US MF(Users Similar Matrix Factorization)、项目相似性矩阵分解IS MF(Items SimilarMatrix Factorization)和用户相似性项目相似性矩阵分解USIS MF(Users Similar and ItemsSimilar Matrix Factorization),其中,US MF与IS MF是USIS MF的两种减弱模型。BVMF将用户和项目的偏差扩展到每个特征,每个特征都会有特定的用户偏差和特定的项目偏差,相比于其它模型BVMF的变量要更多。由于矩阵分解后的用户向量和项目向量可能不会保持原始的用户之间与项目之间的相似性关系,这样就丢掉了内在的相似性重要关系,,在US MF、IS MF和USIS MF中结合了用户或项目的相似性关系,将相似性信息融入到最小化的目标函数中,挖掘更深层的潜在信息,以使预测结果更为精确,US MF只考虑用户相似性信息,IS MF只考虑项目相似性信息,USIS MF是它们的结合,同时考虑了用户与项目的相似性信息。BVMF在预测精确度方面没有如预计的那样有好的表现;US MF和IS MF在精确度方面相比于Basic MF与Regularized MF都有了提高,但它们比BiasesMF要差;USISMF是表现最优秀的,在精确度方面,相比于BiasesMF它依旧有较大提高。 4.对矩阵分解算法的预测评分方法做了讨论,包括直接预测(Direct Prediction)、近邻预测(NearNeighbors Prediction)等,针对预测评分超过评分上下限的问题,提出了一种新的预测方法——映射预测(MappingPrediction),它把预测评分映射到评分上下限以内,并且保持了预测评分的相对高低状况,这样处理过的预测评分就不存在超过评分上下限的不合理情况,经过映射预测的评分在预测结果上有了一定的改善。 5.介绍了几种不同的推荐算法评测标准,包括MAE(Mean Absolute Error)、RMSE(RootMeanSquareError)、查准率(Precision)、查全率(Recall)。并提出了一种新的评测指标——正确率(Accuracy)。正确率是在对预测评分进行四舍五入的基础上对推荐算法做出评价,它不像查准率与查全率只考虑推荐给用户的项目的正确概率,还考虑了那些不能推荐给用户的项目的预测准确度。 6.在数据集上做了大量实验,分析各种推荐算法的运行结果。 本文针对预测精确度问题提出了几种新的算法,BVMF、USMF、ISMF和USISMF,其中,除BVMF以外,它们在精确度方面都有提高。对于评分的预测,提出了一种新的映射预测方法,相比于直接预测有很明显的效果。在评测方面,给出了一种新的正确率评测指标,它在一定程度上可以衡量算法的优劣。
【关键词】:
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.3
【目录】:
下载全文 更多同类文献
CAJ全文下载
(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)
CAJViewer阅读器支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库 前4条
1 许海玲;吴潇;李晓东;阎保平;;互联网推荐系统比较研究[J];软件学报;2009年02期
2 杨博;赵鹏飞;;推荐算法综述[J];山西大学学报(自然科学版);2011年03期
3 陈树年;搜索引擎及网络信息资源的分类组织[J];图书情报工作;2000年04期
4 刘建国;周涛;汪秉宏;;个性化推荐系统的研究进展[J];自然科学进展;2009年01期
中国博士学位论文全文数据库 前1条
1 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前2条
1 杜定宇;基于特征向量的个性化推荐算法研究[D];重庆大学;2011年
2 温会平;基于项目类别相似性与用户多兴趣的个性化推荐算法的研究[D];太原理工大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 贺定安;关于编制《中图法·网络信息分类表》的构想[J];国家图书馆学刊;2002年03期
2 沙淑欣;情报检索语言研究综述[J];国家图书馆学刊;2004年03期
3 李莉,刘鲲,王鹤;如何将传统文献分类法应用于网络信息组织[J];国家图书馆学刊;2005年03期
4 曹青;检索语言研究综述[J];北京教育学院学报;2000年04期
5 郑爽;网络信息资源的开发利用[J];北京理工大学学报(社会科学版);2001年02期
6 张帆;林建;;智能搜索引擎信息过滤机制研究[J];图书与情报;2007年04期
7 蔡晓霞;;数据挖掘技术在图书馆中的应用[J];长春师范学院学报;2011年04期
8 陈燕;牟向伟;;语义环境下个性化推荐系统建模[J];吉林大学学报(信息科学版);2010年06期
9 牟乃夏;刘文宝;张灵先;孙翠羽;;空间信息服务的个性化问题[J];测绘科学;2011年03期
10 黎星星;Building a better recommender system in E-commerce[J];Journal of Chongqing University;2003年01期
中国重要会议论文全文数据库 前8条
1 高琪;辛乐;;基于用户偏好度模型和情感计算的产品推荐算法[A];第二十九届中国控制会议论文集[C];2010年
2 王茹;郭晓;曹雪珊;;国内视频网站精准投放技术分析[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 陶晓燕;;网络信息资源的分类组织[A];山西省科学技术情报学会学术年会论文集[C];2004年
4 ;An Analysis on the Personalized Recommendation Architecture of Mobile Commerce Application[A];第六届(2011)中国管理学年会——管理科学与工程分会场论文集[C];2011年
5 ;COLLABORATIVE FILTERING RECOMMENDATION ALGORITHM BASED ON LOOK-AHEAD SELECTIVE SAMPLING[A];2006年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C];2006年
6 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
7 孙宏明;;网络信息资源的开发与利用探析[A];全国高校社科信息资料研究会第14次理论研讨会论文集[C];2012年
8 蔡晓霞;;数据挖掘在图书馆中的应用[A];福建省图书馆学会2010年学术年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 张宇;个性化移动内容服务的模型和支持技术研究[D];华中科技大学;2010年
2 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
3 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
4 胡慕海;面向动态情境的信息推荐方法及系统研究[D];华中科技大学;2011年
5 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
6 刘毅捷;视频社区中海量数据管理方法研究[D];中国科学技术大学;2011年
7 刘润然;复杂网络上的几种动力学过程研究[D];中国科学技术大学;2011年
8 马春山;移动增值业务的个性化推荐研究[D];北京邮电大学;2011年
9 黄永生;基于用户社会属性的点对点内容分发网络模型研究[D];北京邮电大学;2010年
10 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
中国硕士学位论文全文数据库 前10条
1 吴则则;支持动态演进的用户兴趣模型挖掘方法研究[D];山东科技大学;2010年
2 宋超臣;基于推荐网络的服务搜索技术研究[D];哈尔滨工程大学;2010年
3 何莹杰;个性化图书信息服务技术研究[D];哈尔滨工程大学;2010年
4 李媛;电子商务个性化推荐关键技术研究[D];哈尔滨工程大学;2010年
5 吴迪;高校毕业生就业推荐系统的设计与开发[D];大连理工大学;2010年
6 庞军;双聚类算法及其在协同过滤中的应用研究[D];大连理工大学;2010年
7 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年
8 潘拓宇;融入用户行为上下文的个性化推荐模型[D];湘潭大学;2010年
9 程淑玉;基于协同过滤算法的个性化推荐系统的研究[D];合肥工业大学;2010年
10 何克勤;基于标签的推荐系统模型及算法研究[D];华东师范大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 赵亮,胡乃静,张守志;个性化推荐算法设计[J];计算机研究与发展;2002年08期
2 周军锋,汤显,郭景峰;一种优化的协同过滤推荐算法[J];计算机研究与发展;2004年10期
3 李煊,汪晓岩,庄镇泉;基于关联规则挖掘的个性化智能推荐服务[J];计算机工程与应用;2002年11期
4 李勇,徐振宁,张维明;Internet个性化信息服务研究综述[J];计算机工程与应用;2002年19期
5 徐小琳,阙喜戎,程时端;信息过滤技术和个性化信息服务[J];计算机工程与应用;2003年09期
6 王茜;王均波;;一种改进的协同过滤推荐算法[J];计算机科学;2010年06期
7 张海燕;顾峰;姜丽红;;基于模糊簇的个性化推荐方法[J];计算机工程;2006年12期
8 张晓敏;王茜;;基于概念层次树的个性化推荐算法[J];计算机工程;2007年24期
9 余力,刘鲁;电子商务个性化推荐研究[J];计算机集成制造系统;2004年10期
10 余力,刘鲁,李雪峰;用户多兴趣下的个性化推荐算法研究[J];计算机集成制造系统;2004年12期
中国博士学位论文全文数据库 前1条
1 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 聂晶;;基于用户兴趣实时更新评价信息的远程教学资源智能推荐系统[J];中国科教创新导刊;2009年14期
2 苏一丹;王育才;顾新一;;基于独特型人工免疫网络的并行推荐算法的研究[J];计算机应用;2008年05期
3 李聪;梁昌勇;董珂;;基于项目类别相似性的协同过滤推荐算法[J];合肥工业大学学报(自然科学版);2008年03期
4 赵智;时兵;;改进的个性化推荐算法[J];长春大学学报;2005年06期
5 李聪;梁昌勇;;基于属性值偏好矩阵的协同过滤推荐算法[J];情报学报;2008年06期
6 张晓云;李慧;王霞;;基于视觉信息的个性化图像搜索排名技术[J];黑龙江科技信息;2009年31期
7 李涛;王建东;叶飞跃;冯新宇;张有东;;一种基于用户聚类的协同过滤推荐算法[J];系统工程与电子技术;2007年07期
8 嵇晓声;刘宴兵;罗来明;;协同过滤中基于用户兴趣度的相似性度量方法[J];计算机应用;2010年10期
9 鲁培;;一种改进的基于项目聚类的协同过滤推荐算法[J];科技传播;2011年01期
10 李涛;王建东;叶飞跃;;推荐系统中一种新的相似性计算方法[J];计算机科学;2007年08期
中国重要会议论文全文数据库 前10条
1 陶红亮;王明文;曹瑛;;基于项目平滑和聚类的协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 王韬丞;罗喜军;杜小勇;;基于层次的推荐:一种新的个性化推荐算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
4 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
5 梁莘燊;刘莹;;基于效能的学术资源推荐算法研究[A];第六届(2011)中国管理学年会——信息管理分会场论文集[C];2011年
6 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 高凤荣;杜小勇;王珊;;数字图书馆环境下一种基于语义分类的个性化推荐算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
8 汤显;郭景峰;高英飞;;基于类别相似性的增量协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
9 高旻;吴中福;;基于个性化情境和项目的协同推荐研究[A];2009年中国智能自动化会议论文集(第五分册)[东南大学学报(增刊)][C];2009年
10 孙铁利;杨焱;邱春艳;;基于内容预测的协同过滤推荐[A];2005年全国理论计算机科学学术年会论文集[C];2005年
中国重要报纸全文数据库 前9条
1 记者 王夕;[N];北京科技报;2011年
2 记者 向阳;[N];科技日报;2009年
3 刘溟;[N];经济日报;2004年
4 ;[N];网络世界;2001年
5 南方;[N];中国信息报;2002年
6 本报记者 雷彬;[N];通信信息报;2011年
7 赵骏飞;[N];中国保险报;2011年
8 乔颖;[N];新华每日电讯;2011年
9 商报记者 金朝力;[N];北京商报;2011年
中国博士学位论文全文数据库 前10条
1 高旻;基于计算语用学和项目的资源协同过滤推荐研究[D];重庆大学;2010年
2 沈磊;心理学模型与协同过滤集成的算法研究[D];北京航空航天大学;2010年
3 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
4 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
5 贾春晓;基于复杂网络的推荐算法和合作行为研究[D];中国科学技术大学;2011年
6 李东胜;基于兴趣与保护隐私的在线社区推荐技术研究[D];复旦大学;2012年
7 孙慧峰;基于协同过滤的个性化Web推荐[D];北京邮电大学;2012年
8 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
9 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
10 高滢;多关系聚类分析方法研究[D];吉林大学;2008年
中国硕士学位论文全文数据库 前10条
1 刘亭;隐私保持协同过滤推荐算法研究[D];燕山大学;2010年
2 袁先虎;基于混合用户模型的协同过滤推荐算法研究[D];重庆大学;2010年
3 王小亮;基于协同过滤的个性化推荐算法的优化和应用[D];浙江工商大学;2010年
4 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年
5 李有超;基于项目属性与偏爱比较的协同过滤推荐算法研究[D];燕山大学;2010年
6 封素石;分布式协同过滤推荐算法研究[D];燕山大学;2010年
7 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
8 张学胜;面向数据稀疏的协同过滤推荐算法研究[D];中国科学技术大学;2011年
9 张晓彬;基于可信度的协同过滤推荐算法研究[D];重庆大学;2010年
10 王正武;基于用户喜好类型的协同过滤推荐算法研究[D];华东师范大学;2011年
本文关键词:智能搜索引擎信息过滤机制研究,由笔耕文化传播整理发布。
本文编号:128955
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/128955.html