基于改进随机森林的推荐算法研究
本文选题:随机森林 + 推荐算法 ; 参考:《沈阳理工大学》2017年硕士论文
【摘要】:随着社会经济的发展,电子商务已经成为生活中不可缺少的一部分。面对电子商务中信息呈几何级数式增长,用户很难在海量的商品信息中快速准确的找到自己感兴趣的商品。个性化推荐算法就是这样的背景下所创建。推荐算法改变了电子商务中从被动接收用户请求到主动为其推荐的方式,同时也为用户解决了从信息过载的网络中找到自己喜欢物品的捷径。本文使用的是基于改进随机森林模型的推荐算法。随机森林算法是一种包含多个决策树分类器的统计学习理论,采用了特征子空间来构建模型,能较好的处理噪声且避免发生过拟合。本文针对几种典型的决策森林算法,阐述了其原理和算法的特点,并从决策森林的构建过程出发,提出了一种改进随机森林方法。本文提出一种支持向量机和随机森林算法融合的改进随机森林算法。随机森林中基本弱分类器是决策树,而决策树在进行节点分裂是选择分类能力最强的某个属性。本文在决策树的属性选择中结合支持向量机算法,以特征变量的线性组合(支持向量)构成的超平面进行分裂,比单一属性的分类能力更强,从而在随机森林决策树的建造过程中得到了改进。通过实验分析,充分说明了改进随机森林算法具有更高的准确率。本论文使用的是阿里巴巴线上的真实用户历史行为数据,通过挖掘用户行为建立改进随机森林算法模型,最终得到了为用户推荐商品列表。实验表明,在对用户历史行为数据的前提下,可以有效地对用户未来购买商品进行预测和推荐,对推荐算法发展具有重要意义。
[Abstract]:With the development of social economy, electronic commerce has become an indispensable part of life. In the face of the geometric growth of information in e-commerce, it is difficult for users to quickly and accurately find the goods they are interested in the mass of commodity information. Personalized recommendation algorithm is created in this context. Recommendation algorithm not only changes the way from passively receiving users' requests to actively recommending them in electronic commerce, but also solves the shortcut for users to find their favorite items from the information overload network. This paper uses a recommendation algorithm based on improved stochastic forest model. Stochastic forest algorithm is a kind of statistical learning theory which includes multiple decision tree classifiers. It uses feature subspace to construct the model, which can deal with noise and avoid over-fitting. In this paper, the principle and characteristics of several typical decision making forest algorithms are described, and an improved stochastic forest method is proposed based on the construction process of decision forest. In this paper, an improved stochastic forest algorithm based on support vector machine (SVM) and stochastic forest algorithm is proposed. The basic weak classifier is the decision tree in random forest, and the decision tree is the most powerful attribute in the node splitting. In this paper, the support vector machine (SVM) algorithm is combined in attribute selection of decision tree to split the hyperplane composed of linear combination of feature variables (support vector), which is stronger than the classification ability of single attribute. Therefore, the construction process of random forest decision tree is improved. The experimental results show that the improved stochastic forest algorithm has higher accuracy. This paper uses the real user history behavior data on the Alibaba line. By mining the user behavior, the improved stochastic forest algorithm model is established, and finally the list of recommended items for the user is obtained. The experimental results show that under the premise of user's historical behavior data, it can effectively predict and recommend the products purchased by users in the future, which is of great significance to the development of recommendation algorithm.
【学位授予单位】:沈阳理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【参考文献】
相关期刊论文 前10条
1 祝奇伟;陈家琪;;一种改进相似度计算方法的协同过滤推荐算法[J];信息技术;2015年03期
2 邓晓懿;金淳;韩庆平;j口良之;;基于情境聚类和用户评级的协同过滤推荐模型[J];系统工程理论与实践;2013年11期
3 梁宇;;移动网络个性化信息推荐技术及影响因素分析[J];电子世界;2013年06期
4 董师师;黄哲学;;随机森林理论浅析[J];集成技术;2013年01期
5 杨开睿;孟凡荣;梁志贞;;一种自适应权值的PCA算法[J];计算机工程与应用;2012年03期
6 钱志明;徐丹;;一种Adaboost快速训练算法[J];计算机工程;2009年20期
7 庄永龙;;基于项目特征模型的协同过滤推荐算法[J];计算机应用与软件;2009年05期
8 韩松来;张辉;周华平;;决策树的属性选取策略综述[J];微计算机应用;2007年08期
9 吴俊伟;孙国伟;张如;张媛;;基于SVD方法的INS传递对准的可观测性能分析[J];中国惯性技术学报;2005年06期
10 冀俊忠,沙志强,刘椿年;贝叶斯网模型在推荐系统中的应用研究[J];计算机工程;2005年13期
相关硕士学位论文 前6条
1 王美玲;基于加权信任关系和用户相似性融合的社会化推荐算法研究[D];山东大学;2015年
2 丁雪涛;基于协同关系主题回归模型的推荐算法研究[D];清华大学;2013年
3 魏欢;基于本体的影视个性化推荐算法研究[D];武汉理工大学;2013年
4 张腾季;个性化混合推荐算法的研究[D];浙江大学;2013年
5 郑直;VOD系统应用服务器中Web挖掘技术的研究与应用[D];北京邮电大学;2010年
6 杨芳;电子商务系统协同过滤推荐算法研究[D];河北工业大学;2006年
,本文编号:2109884
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2109884.html