推荐系统中基于相似性计算的协同过滤算法研究
本文选题:协同过滤 + 稀疏性 ; 参考:《郑州大学》2017年硕士论文
【摘要】:信息技术的快速发展,互联网用户量和信息量规模的不断扩大,网络空间的信息生产者由传统媒体逐步趋向大众化和平台化。随着个人影响力的提升和人工智能的普及发展,人人都是信息的生产者,任何同网络传输相连接的设备也是信息制造者。大规模信息量的产生在为用户提供充足信息的同时也带来相当大的困扰,即如何从庞大繁琐的数据空间获取需要的信息内容,该现象即是信息过载。推荐系统的出现,有效地缓解了过载问题。其中的协同过滤推荐技术,利用用户间相关信息,产生合理推荐,并能由反馈信息进行动态调整,突破了专业领域知识的限制,提高了推荐性能。但同时协同过滤也面临着一些问题,由于用户规模和项目数量的不断增大,不可避免地会出现维度灾难的问题,该问题具体会反映在数据稀疏性上,如何有效地利用已存在的数据信息,为解决推荐系统所面临问题的关键。针对稀疏问题,本文由相似性出发展开研究。第一,在用户对应的项目领域,根据项目属性进行用户分类,得到用户初始兴趣分布。在用户所具有的兴趣分布特征基础上进行数据信息量化处理,获取用户本身兴趣特征,通过计算用户的兴趣特征差异,经过数量关系调整后得到新的相似性,最终在协同框架下进行预测评分数值计算,最终完成推荐过程。第二,根据用户评分结构所具有的隶属特点,以及用户间评分体系所体现的差异性,分别得到具有用户评分结构性和用户评分混乱性特点的相似性计算方法。在有限的用户数据空间,通过将两方面特性进行有效融合,形成新的相似性计算方法。最后,由兴趣分布和评分结构出发得到的相似性方法,在协同过滤过程中能更好地得到用户间相似关系。实验验证对比显示,在新的相似计算方法下,推荐算法能够缓解稀疏状况,降低推荐误差。
[Abstract]:With the rapid development of information technology, the number of Internet users and the scale of information are expanding, and the information producers in cyberspace are gradually becoming popular and platform from traditional media. With the improvement of personal influence and the popularization of artificial intelligence, everyone is the producer of information, and any equipment connected to the network transmission is also the information maker. The production of large-scale information not only provides sufficient information for users, but also brings considerable trouble, that is, how to obtain the required information content from the huge and cumbersome data space, which is called information overload. The appearance of recommendation system effectively alleviates the overload problem. The collaborative filtering recommendation technology can make use of relevant information among users to produce reasonable recommendation and can be dynamically adjusted by feedback information. It breaks through the limitation of professional domain knowledge and improves the performance of recommendation. But at the same time, collaborative filtering also faces some problems. Due to the increasing number of users and projects, the problem of dimensionality disaster will inevitably occur, which will be reflected in the data sparsity. How to utilize the existing data information effectively is the key to solve the problem of recommendation system. To solve the sparse problem, this paper starts with similarity. First, in the corresponding project domain, the user is classified according to the item attribute, and the initial interest distribution is obtained. On the basis of the interest distribution characteristics of users, the quantization of data information is carried out to obtain the interest characteristics of users themselves, and the new similarity is obtained by calculating the differences of interest characteristics of users and adjusting the quantitative relationship. Finally, the prediction score numerical calculation is carried out under the collaborative framework, and the recommendation process is finally completed. Secondly, according to the membership characteristics of the user scoring structure and the difference of the scoring system between users, the similarity calculation method with the characteristics of the user scoring structure and the user rating confusion is obtained respectively. In the limited user data space, a new similarity calculation method is formed by combining the two features effectively. Finally, the similarity method based on interest distribution and scoring structure can better obtain the similarity relationship between users in the process of collaborative filtering. The experimental results show that the proposed algorithm can reduce the sparse state and the recommendation error under the new similarity calculation method.
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 徐义峰;陈春明;徐云青;;一种基于分类的协同过滤算法[J];计算机系统应用;2007年01期
2 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期
3 王岚;翟正军;;基于时间加权的协同过滤算法[J];计算机应用;2007年09期
4 曾子明;张李义;;基于多属性决策和协同过滤的智能导购系统[J];武汉大学学报(工学版);2008年02期
5 张富国;;用户多兴趣下基于信任的协同过滤算法研究[J];小型微型计算机系统;2008年08期
6 侯翠琴;焦李成;张文革;;一种压缩稀疏用户评分矩阵的协同过滤算法[J];西安电子科技大学学报;2009年04期
7 廖新考;;基于用户特征和项目属性的混合协同过滤推荐[J];福建电脑;2010年07期
8 沈磊;周一民;李舟军;;基于心理学模型的协同过滤推荐方法[J];计算机工程;2010年20期
9 徐红;彭黎;郭艾寅;徐云剑;;基于用户多兴趣的协同过滤策略改进研究[J];计算机技术与发展;2011年04期
10 焦晨斌;王世卿;;基于模型填充的混合协同过滤算法[J];微计算机信息;2011年11期
相关会议论文 前10条
1 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
相关博士学位论文 前10条
1 纪科;融合上下文信息的混合协同过滤推荐算法研究[D];北京交通大学;2016年
2 程殿虎;基于协同过滤的社会网络推荐系统关键技术研究[D];中国海洋大学;2015年
3 于程远;基于QoS的Web服务推荐技术研究[D];上海交通大学;2015年
4 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
5 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
6 罗恒;基于协同过滤视角的受限玻尔兹曼机研究[D];上海交通大学;2011年
7 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
8 高e,
本文编号:2077046
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2077046.html