当前位置:主页 > 经济论文 > 电子商务论文 >

协同过滤推荐系统中稀疏性数据的算法研究

发布时间:2019-02-20 08:12
【摘要】:伴随网络的高速发展和计算机技术的日新月异,电子商务中出现了信息过载的现象。为了尽快地处理类似情况,推荐系统随之诞生,此中以协同过滤算法为基础的系统更是得到了具大的肯定。但还是存在一些不易解决的问题,其中影响最大的就是数据过于稀疏的问题。本文主要针对协同过滤推荐系统中稀疏性数据的现象,提出优化传统算法的方案。首先,深入研究传统协同过滤推荐算法在稀疏性数据的场景下,相似度计算存在的优缺点,对比并且对其修正,得到基于改进计算方法的协同过滤算法。然后,根据稀疏数据的特征对用户—项目矩阵利用改进PCA减维。将通过建立可扩展聚类方法,对原始数据利用优化的K-Means算法进行有效聚类,得到针对稀疏性数据的基于降维和聚类的协同过滤算法,并将在电影推荐场景中使用优化后的算法。主要研究内容包括:(1)深入研究传统计算方法在评分数据异常稀疏的场景下,无法准确的表达用户间相似程度的问题,并在此基础上提出相应的改进方案。针对传统的相似度计算方法普遍没有考虑用户之间的共同评分项数量的问题,以及考虑到每个用户的评价标准是不一致的问题,对相似度计算进行改进。得到优化的协同算法,能更加全面考虑传统计算方法存在的缺陷。(2)研究处理稀疏数据的有效方案。分析改进主成分分析PCA,并将其用来对过于稀疏的评分矩阵进行减维处理,有效较低数据的稀疏度。研究可扩展性的改进聚类方法,对初始数据集利用优化的K-Means算法对其进行有效聚集,将具有高相似性的用户划分到相同的类中,能更好的构造用户邻居集,从而减少稀疏数据对算法的影响,同时改善传统协同过滤算法在选取邻居时计算过于复杂度的问题。最后利用电影数据集movielens对本文的优化算法进行验证,仿真表明在电影推荐场景下,确实能改善稀疏性问题。
[Abstract]:With the rapid development of network and the rapid change of computer technology, the phenomenon of information overload appears in electronic commerce. In order to deal with the similar situation as soon as possible, the recommendation system was born, and the system based on collaborative filtering algorithm was recognized. However, there are still some problems that are difficult to solve, among which the most important problem is that the data is too sparse. Aiming at the phenomenon of sparse data in collaborative filtering recommendation system, this paper proposes a scheme to optimize the traditional algorithm. Firstly, the advantages and disadvantages of the traditional collaborative filtering recommendation algorithm in sparse data scene are studied, compared and modified, and a collaborative filtering algorithm based on the improved algorithm is obtained. Then, the improved PCA is used to reduce the dimension of the user-item matrix according to the characteristics of sparse data. An extensible clustering method is established to effectively cluster the raw data using the optimized K-Means algorithm, and a collaborative filtering algorithm based on reduced and clustering for sparse data is obtained. The optimized algorithm will be used in the movie recommendation scene. The main research contents are as follows: (1) the traditional computing method can not accurately express the similarity between users in the scene where the scoring data are very sparse, and on the basis of this, the corresponding improvement scheme is put forward. In order to solve the problem that the traditional similarity calculation method does not consider the number of common score items among users, and considering that the evaluation criteria of each user are inconsistent, the similarity calculation is improved. The optimized cooperative algorithm can take into account the shortcomings of traditional computing methods more comprehensively. (2) an effective scheme to deal with sparse data is studied. The improved principal component analysis (PCA,) is analyzed and used to reduce the dimension of the score matrix which is too sparse to reduce the data sparsity effectively. The improved clustering method of extensibility is studied. The initial data set is effectively aggregated by the optimized K-Means algorithm, and the users with high similarity can be divided into the same classes, which can better construct the user neighbor set. In order to reduce the influence of sparse data on the algorithm and improve the complexity of traditional collaborative filtering algorithm in selecting neighbors. Finally, the optimization algorithm of this paper is validated by movielens, and the simulation results show that the sparse problem can be improved in the movie recommendation scenario.
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期

2 王岚;翟正军;;基于时间加权的协同过滤算法[J];计算机应用;2007年09期

3 曾子明;张李义;;基于多属性决策和协同过滤的智能导购系统[J];武汉大学学报(工学版);2008年02期

4 张富国;;用户多兴趣下基于信任的协同过滤算法研究[J];小型微型计算机系统;2008年08期

5 侯翠琴;焦李成;张文革;;一种压缩稀疏用户评分矩阵的协同过滤算法[J];西安电子科技大学学报;2009年04期

6 廖新考;;基于用户特征和项目属性的混合协同过滤推荐[J];福建电脑;2010年07期

7 沈磊;周一民;李舟军;;基于心理学模型的协同过滤推荐方法[J];计算机工程;2010年20期

8 徐红;彭黎;郭艾寅;徐云剑;;基于用户多兴趣的协同过滤策略改进研究[J];计算机技术与发展;2011年04期

9 焦晨斌;王世卿;;基于模型填充的混合协同过滤算法[J];微计算机信息;2011年11期

10 郑婕;鲍海琴;;基于协同过滤推荐技术的个性化网络教学平台研究[J];科技风;2012年06期

相关会议论文 前10条

1 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

3 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年

4 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年

5 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

6 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

9 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

10 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年

相关博士学位论文 前10条

1 纪科;融合上下文信息的混合协同过滤推荐算法研究[D];北京交通大学;2016年

2 程殿虎;基于协同过滤的社会网络推荐系统关键技术研究[D];中国海洋大学;2015年

3 于程远;基于QoS的Web服务推荐技术研究[D];上海交通大学;2015年

4 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年

5 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年

6 罗恒;基于协同过滤视角的受限玻尔兹曼机研究[D];上海交通大学;2011年

7 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年

8 高e,

本文编号:2426995


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/2426995.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1dff2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com