基于图和改进K近邻模型的高效协同过滤推荐算法
本文选题:协同过滤 + 社会网络 ; 参考:《计算机研究与发展》2017年07期
【摘要】:在互联网高速发展的今天,推荐系统已成为解决信息过载的有效手段,能够缓解用户在筛选感兴趣信息时的困扰,帮助用户发现有价值的信息.推荐系统中的协同过滤推荐算法,因其领域无关性及支持用户发现潜在兴趣的优点被广泛应用.由于数据的规模过大且稀疏的特点,当前协同过滤在算法实时性、推荐精确度等方面仍有较大提升空间.提出了GK-CF方法,通过建立基于图的评分数据模型,将传统的协同过滤算法与图计算及改进的KNN算法结合.通过图的消息传播及改进的相似度计算模型对用户先进行筛选再做相似度计算;以用户-项目二部图的节点结构为基础,通过图的最短路径算法进行待评分项目的快速定位.在此基础上,进一步通过并行图框架对算法进行了并行化实现及优化.在物理集群环境下进行了实验,结果表明,与已有的协同过滤算法相比,提出的GK-CF算法能够很好地提高推荐的准确度和评分预测的准确性,并具有较好的算法可扩展性和实时性能.
[Abstract]:With the rapid development of the Internet, recommendation system has become an effective means to solve information overload, which can alleviate the puzzles of users in filtering interesting information and help users find valuable information. Collaborative filtering recommendation algorithms in recommendation systems are widely used because of their domain independence and the advantages of supporting users to discover potential interests. Due to the large and sparse size of the data, there is still much room for improvement in real-time algorithm and recommendation accuracy. In this paper, GK-CF method is proposed. By establishing a graph based scoring data model, the traditional collaborative filtering algorithm is combined with graph calculation and improved KNN algorithm. Based on the node structure of the user-item bipartite graph, the shortest path algorithm of graph is used to locate the items to be graded quickly, which is based on the message propagation of graph and the improved similarity calculation model. On this basis, the parallel graph framework is used to realize and optimize the parallel algorithm. Experiments in physical cluster environment show that the proposed GK-CF algorithm can improve the accuracy of recommendation and score prediction, compared with the existing collaborative filtering algorithm. And the algorithm has good scalability and real-time performance.
【作者单位】: 北京交通大学计算机与信息技术学院;北京交通大学信息中心;南京师范大学计算机科学与技术学院;
【基金】:国家重点研发计划项目(2016YFB1200100) 国家自然科学基金项目(61202429,61572256) 中央高校基本科研业务费专项资金项目(2015JBM042) 江苏省自然科学基金项目(BK20141454)~~
【分类号】:TP391.3
【参考文献】
相关期刊论文 前4条
1 朱夏;宋爱波;东方;罗军舟;;云计算环境下基于协同过滤的个性化推荐机制[J];计算机研究与发展;2014年10期
2 谢娟英;高红超;;基于统计相关性与K-means的区分基因子集选择算法[J];软件学报;2014年09期
3 孙光福;吴乐;刘淇;朱琛;陈恩红;;基于时序行为的协同过滤推荐算法[J];软件学报;2013年11期
4 贾冬艳;张付志;;基于双重邻居选取策略的协同过滤推荐算法[J];计算机研究与发展;2013年05期
【共引文献】
相关期刊论文 前10条
1 张亚洲;余正生;;基于k-means++聚类的视频摘要生成算法[J];工业控制计算机;2017年07期
2 黄皓璇;邢延;;基于用户兴趣变化的Slope One协同过滤推荐算法[J];工业控制计算机;2017年07期
3 孟桓羽;刘真;王芳;徐家栋;张国强;;基于图和改进K近邻模型的高效协同过滤推荐算法[J];计算机研究与发展;2017年07期
4 周孟;朱福喜;;基于邻居选取策略的人群定向算法[J];计算机研究与发展;2017年07期
5 王飞;岳昆;孙正宝;武浩;冯辉;;基于贝叶斯网的评价数据分析和动态行为建模[J];计算机研究与发展;2017年07期
6 林敏;陈美龙;;基于大数据的协同过滤推荐算法在智慧图书馆中的应用[J];电子科学技术;2017年04期
7 李冰;王虎;王锐;;客户群及个体服务选择影响因子研究[J];计算机工程与应用;2017年13期
8 张松;张琳;王汝传;;基于用户限制聚类的协同过滤推荐算法[J];南京邮电大学学报(自然科学版);2017年03期
9 曲朝阳;徐鹏飞;娄建楼;颜佳;曲楠;;基于协同过滤的电力信息运维知识个性化推荐模型[J];东北师大学报(自然科学版);2017年02期
10 张子洋;金志刚;张瑞;;基于最近邻居优化选取方法的协同过滤推荐算法[J];南开大学学报(自然科学版);2017年03期
【二级参考文献】
相关期刊论文 前8条
1 谢娟英;谢维信;;基于特征子集区分度与支持向量机的特征选择算法[J];计算机学报;2014年08期
2 朱夏;罗军舟;宋爱波;东方;;云计算环境下支持复杂查询的多维数据索引机制[J];计算机研究与发展;2013年08期
3 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[J];计算机学报;2010年08期
4 许海玲;吴潇;李晓东;阎保平;;互联网推荐系统比较研究[J];软件学报;2009年02期
5 刘建国;周涛;汪秉宏;;个性化推荐系统的研究进展[J];自然科学进展;2009年01期
6 李聪;梁昌勇;马丽;;基于领域最近邻的协同过滤推荐算法[J];计算机研究与发展;2008年09期
7 李颖新;李建更;阮晓钢;;肿瘤基因表达谱分类特征基因选取问题及分析方法研究[J];计算机学报;2006年02期
8 张军英,Y.J.Wang,J.Khan,R.Clarke;基于类别空间的基因选择[J];中国科学E辑:技术科学;2003年12期
【相似文献】
相关期刊论文 前10条
1 徐义峰;陈春明;徐云青;;一种基于分类的协同过滤算法[J];计算机系统应用;2007年01期
2 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期
3 王岚;翟正军;;基于时间加权的协同过滤算法[J];计算机应用;2007年09期
4 曾子明;张李义;;基于多属性决策和协同过滤的智能导购系统[J];武汉大学学报(工学版);2008年02期
5 张富国;;用户多兴趣下基于信任的协同过滤算法研究[J];小型微型计算机系统;2008年08期
6 侯翠琴;焦李成;张文革;;一种压缩稀疏用户评分矩阵的协同过滤算法[J];西安电子科技大学学报;2009年04期
7 廖新考;;基于用户特征和项目属性的混合协同过滤推荐[J];福建电脑;2010年07期
8 徐红;彭黎;郭艾寅;徐云剑;;基于用户多兴趣的协同过滤策略改进研究[J];计算机技术与发展;2011年04期
9 焦晨斌;王世卿;;基于模型填充的混合协同过滤算法[J];微计算机信息;2011年11期
10 宋纬华;田元;;基于蚁群算法的协同过滤推荐技术[J];农业图书情报学刊;2013年08期
相关会议论文 前10条
1 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
相关博士学位论文 前7条
1 纪科;融合上下文信息的混合协同过滤推荐算法研究[D];北京交通大学;2016年
2 程殿虎;基于协同过滤的社会网络推荐系统关键技术研究[D];中国海洋大学;2015年
3 于程远;基于QoS的Web服务推荐技术研究[D];上海交通大学;2015年
4 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
5 孔维梁;协同过滤推荐系统关键问题研究[D];华中师范大学;2013年
6 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
7 赵向宇;Top-N协同过滤推荐技术研究[D];北京理工大学;2014年
相关硕士学位论文 前10条
1 邹腾飞;基于多特征融合的混合协同过滤算法研究[D];西南大学;2015年
2 于钰雯;基于项目凝聚层次聚类的协同过滤推荐算法研究[D];辽宁大学;2015年
3 杜文刚;基于多属性评分的协同过滤推荐算法研究[D];辽宁大学;2015年
4 高慧敏;融合占有度的时间遗忘协同过滤混合推荐算法研究[D];燕山大学;2015年
5 苏靖涵;面向SaaS多租户的动态推荐方法研究[D];辽宁大学;2015年
6 徐晓妮;基于人工鱼群算法的协同过滤推荐算法研究[D];辽宁大学;2015年
7 罗培;移动购物导购关键技术的研究与系统实现[D];西南交通大学;2015年
8 李婧;融合用户差异度及信息熵的协同过滤推荐算法[D];西安建筑科技大学;2015年
9 乐柱;基于误差反馈的协同过滤算法[D];华南理工大学;2015年
10 马兆才;基于协同过滤的推荐系统算法研究与实现[D];兰州大学;2015年
,本文编号:1923482
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1923482.html