个性化推荐系统中基于用户的协同过滤算法与系统架构的研究与优化
本文关键词: 推荐系统 协同过滤 系统架构 LDA主题模型 栏目 出处:《山东大学》2017年硕士论文 论文类型:学位论文
【摘要】:信息技术和移动设备的成熟与发展,使网上服务与交易等业务越来越普及,大量的信息被聚集起来引发了数据的爆炸式增长。如何解决信息过载是人工智能与大数据时代面临的一个重要难题。而推荐系统是解决信息过载问题的一个非常有潜力的技术,它能够在用户没有明确目标的时候帮助他们发现感兴趣的新内容,是个性化服务研究领域的重要分支。在推荐系统的探究进程中,协同过滤算法被公认为最著名、应用最广泛的推荐算法,其核心思想是利用历史行为数据挖掘某种相似性来进行推荐,但与此同时也存在着诸如冷启动、数据稀疏、预测精确性不足等问题。本论文针对现有推荐系统的问题进行了以下三个方面的研究:1、对推荐系统架构进行优化,设置了自适应反馈机制,通过增加反馈环节,利用获取的用户反馈、上下文、以及群组信息不断调节融合参数,构成自适应闭环系统。使系统能够个性化地为用户选择最适于用户特征的推荐算法。2、在分析了多种推荐方法的基础上,重点研究推荐系统方法中的协同过滤算法,并针对基于用户的协同过滤算法进行了优化,提出了一种新的基于栏目与惩罚度的协同过滤推荐算法。其主要思想是采用一种基于栏目行为偏好与惩罚项因子相融合的方法来测量用户偏好相似性。该算法有效利用了属性层次、行为层次和评分层次信息,通过在MovieLens数据集上进行交叉验证仿真,实验结果表明,与协同过滤算法相比该算法大大提升了各项评测指标。3、通过对自然语言处理的研究,考虑将隐含狄利克雷分布(LatentDirichlet Allocation,LDA)与推荐系统结合。本论文提出了一种基于LDA特征提取的协同过滤推荐算法,通过主题模型生成相应主题以及在每个主题上的分布概率,以方便建立物品-特征向量。最后通过本论文提出的用户相似度计算方法,即加入权重距离因子的改进用户相似度计算方法,生成最近邻居集完成推荐。本论文按照数据挖掘基本流程在豆瓣图书数据集上完成实验仿真,实现了利用文本描述信息进行推荐的目标,并且获得了良好的推荐效果。通过以上研究,为推荐系统的进一步广泛应用提供了一定的参考和依据。
[Abstract]:With the maturity and development of information technology and mobile devices, online services and transactions are becoming more and more popular. A large amount of information has been gathered and triggered the explosive growth of data. How to solve the information overload is an important problem in the era of artificial intelligence and big data. Recommendation system is a very important solution to the problem of information overload. Potential technology. It can help users find new content when they have no clear goal. It is an important branch of personalized service research field. Collaborative filtering algorithm is recognized as the most famous and most widely used recommendation algorithm. Its core idea is to use historical behavior data mining some similarity to recommend, but at the same time, there are some such as cold start. In this paper, we focus on the following three aspects: 1, optimize the architecture of recommendation system and set up adaptive feedback mechanism. By adding feedback links, using the obtained user feedback, context, and group information to constantly adjust the fusion parameters. An adaptive closed-loop system is constructed, which enables the system to personalize the recommendation algorithm. 2, which is the most suitable for the user. Based on the analysis of various recommendation methods. The collaborative filtering algorithm in recommendation system is studied, and the user-based collaborative filtering algorithm is optimized. A new collaborative filtering recommendation algorithm based on column and punishment degree is proposed. The main idea of this algorithm is to measure the similarity of user preference based on the combination of column behavior preference and punishment factor. The effect takes advantage of the attribute hierarchy. Behavior level and score level information, through the MovieLens data set cross-validation simulation, experimental results show that compared with the collaborative filtering algorithm, the algorithm greatly improved the evaluation index. 3. Based on the study of natural language processing, the implicit Dirichlet Allocation is considered. In this paper, a collaborative filtering recommendation algorithm based on LDA feature extraction is proposed. The topic model is used to generate the corresponding topic and the distribution probability on each topic. In order to facilitate the establishment of object-feature vector. Finally, through the user similarity calculation method proposed in this paper, that is, adding the weight distance factor to improve the user similarity calculation method. According to the basic flow of data mining, this paper completes the experiment simulation on the Douban book data set, and realizes the goal of using the text description information to recommend. Through the above research, it provides a certain reference and basis for the further application of the recommendation system.
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 徐义峰;陈春明;徐云青;;一种基于分类的协同过滤算法[J];计算机系统应用;2007年01期
2 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期
3 王岚;翟正军;;基于时间加权的协同过滤算法[J];计算机应用;2007年09期
4 曾子明;张李义;;基于多属性决策和协同过滤的智能导购系统[J];武汉大学学报(工学版);2008年02期
5 张富国;;用户多兴趣下基于信任的协同过滤算法研究[J];小型微型计算机系统;2008年08期
6 侯翠琴;焦李成;张文革;;一种压缩稀疏用户评分矩阵的协同过滤算法[J];西安电子科技大学学报;2009年04期
7 廖新考;;基于用户特征和项目属性的混合协同过滤推荐[J];福建电脑;2010年07期
8 沈磊;周一民;李舟军;;基于心理学模型的协同过滤推荐方法[J];计算机工程;2010年20期
9 徐红;彭黎;郭艾寅;徐云剑;;基于用户多兴趣的协同过滤策略改进研究[J];计算机技术与发展;2011年04期
10 焦晨斌;王世卿;;基于模型填充的混合协同过滤算法[J];微计算机信息;2011年11期
相关会议论文 前10条
1 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
相关博士学位论文 前10条
1 纪科;融合上下文信息的混合协同过滤推荐算法研究[D];北京交通大学;2016年
2 程殿虎;基于协同过滤的社会网络推荐系统关键技术研究[D];中国海洋大学;2015年
3 于程远;基于QoS的Web服务推荐技术研究[D];上海交通大学;2015年
4 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
5 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
6 罗恒;基于协同过滤视角的受限玻尔兹曼机研究[D];上海交通大学;2011年
7 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
8 高e,
本文编号:1442672
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1442672.html