基于梯度提升决策树与深度信念网络融合的推荐算法研究
本文选题:推荐算法 切入点:深度信念网络 出处:《广西师范大学》2017年硕士论文 论文类型:学位论文
【摘要】:随着科学技术以及互联网的不断发展,全球信息总量爆发性增长,人们进入信息时代,海量的数据不断产生,信息超载问题越来越严重。这些数据信息数量庞大,增加了人们获取所需信息的困难程度,如何充分利用这些海量的数据信息,筛选出其中的“垃圾”信息,分析和挖掘出人们需要的信息成为人们关注的热点,推荐算法的出现有效地解决了这种情况。推荐算法通过分析处理海量稀疏的数据信息,学习到用户的兴趣爱好和行为习惯,挖掘出用户可能的信息需求,将生成的预测结果推荐给用户。对推荐算法来说,其处理的数据量越大,就越能够充分地学习到数据中的潜在联系,收集到用户感兴趣的信息,从而更准确的推荐用户需求的信息,所以推荐算法的研究适用于数据快速增长的信息时代,成为人们研究的热点。推荐算法的研究,将海量信息中挖掘出的有效信息推荐给需求这类信息的用户,来满足不同用户的信息需求,节约用户搜寻信息所需的时间,提高信息的利用率。推荐算法应用广泛,其中最有经济价值的应用领域是电子商务领域,本课题研究的是在电子商务场景下的推荐算法。在大数据时代,电子商务场景下的数据量巨大,数据属性维度高,传统的推荐算法不能有效的处理这类数据,推荐效果受到限制。梯度提升决策树算法能够有效的处理大量的,高属性维度的特征数据,在搜索排序、广告点击率等方面有较好的应用,本文研究的电子商务场景下的数据同样适用于梯度提升决策树算法。梯度提升决策树算法是一种流行的机器学习算法,与传统的推荐算法相比,它能够处理大量的稀疏的数据,学习到数据中存在的潜在联系,生成更高准确率的推荐结果。但是实际应用中,数据特征过大时梯度提升决策树的学习效果就受到限制,我们引入深度信念网络来解决数据特征过大的问题。深度信念网络是深度学习领域的主流算法,可以用它来识别特征、生成特征数据,通过利用其处理数据特征的优势在特征选择工作中筛选掉对推荐结果无用的特征数据,将精简的特征数据引入梯度提升决策树模型学习,可以有效的提高推荐准确率。采用融合不同的算法模型,充分利用单一算法处理不同问题不同数据的互补优势,解决大规模数据量和高维度特征选择过程中的繁杂问题。本文开展了基于梯度提升决策树与深度信念网络融合的推荐算法研究,主要工作如下:1、提出了基于深度信念网络的特征集合构建算法。首先为了防止原始数据在训练过程中出现过拟合或者欠拟合做了数据准备,包括数据说明、数据分析和数据预处理。其次依据数据预处理与统计分析的结果,结合实际生活中影响推荐结果的多种因素,从十二大角度生成了基础类别和交叉组合类别的特征集合。然后在处理高维数据集合特征选取过程中,引入深度学习领域的深度信念网络模型,以解决特征集合的特征选择和高属性维度问题。通过在模型中训练其神经元间的权重,让整个模型网络依据最大概率生成训练特征数据,从而减少后续推荐算法训练特征的计算量。这种在特征模型的构建阶段引入了深度信念网络方法,对于提高推荐系统的推荐准确度和推荐效果起到了极其重要的作用。2、提出基于梯度提升思想的决策树算法。首先从推荐算法的核心算法入手,将决策树作为基础学习器,引入梯度提升的思想框架通过迭代的方式训练大量的基础学习模型,将这些训练好的基础学习器加权融合,实现将弱学习器组合成为强学习器,提高了推荐算法的泛化能力和推荐效果。运用深度信念网络模型将原始数据结合实际规则构建了特征集合,用这些特征集合不断训练优化梯度提升决策树,构建最终的推荐算法模型。3、基于梯度提升决策树与深度信念网络融合的推荐算法。首先构建深度信念网络初级算法模型,将初步处理提取出的特征集合,使用深度信念网络模型学习处理,筛选生成最终的特征集合。其次依据实际的业务场景,生成用户和商品可能存在的所有相关规则,以时间轴为基线并参考时间遗忘规律,划分训练集、测试集和验证集。最后,用深度信念网络模型选取出的特征集合充分训练梯度提升决策树,结合模型的验证集合不断迭代验证推荐模型的结果,调节优化两个模型的参数,实现算法模型的融合,生成最终的推荐模型。本课题基于阿里巴巴移动电子商务平台的真实用户-商品行为数据,进行了大量的实验,通过实现梯度提升决策树和深度信念网络的融合,与单个推荐算法的随机森林算法、梯度提升决策树算法和逻辑回归算法的对比分析,得出在处理大量稀疏数据和特征属性的数据中,梯度提升决策树能够快速学习数据中的潜在联系,生成推荐结果,同时为了筛选数据集中大量的特征数据提升算法效率,避免过多的特征数据对推荐效果的影响,引入深度信念网络,通过其训练学习降低特征数目。通过融合这两种推荐算法以及实验对比验证,总结出融合的推荐算法在电子商务场景下具有较高的推荐效果,取得了良好的性能。
[Abstract]:......
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 李颖基,彭宏,郑启伦,曾炜;自动分层推荐算法[J];计算机应用;2002年11期
2 徐义峰;徐云青;刘晓平;;一种基于时间序列性的推荐算法[J];计算机系统应用;2006年10期
3 余小鹏;;一种基于多层关联规则的推荐算法研究[J];计算机应用;2007年06期
4 张海玉;刘志都;杨彩;贾松浩;;基于页面聚类的推荐算法的改进[J];计算机应用与软件;2008年09期
5 张立燕;;一种基于用户事务模式的推荐算法[J];福建电脑;2009年03期
6 王晗;夏自谦;;基于蚁群算法和浏览路径的推荐算法研究[J];中国科技信息;2009年07期
7 周珊丹;周兴社;王海鹏;倪红波;张桂英;苗强;;智能博物馆环境下的个性化推荐算法[J];计算机工程与应用;2010年19期
8 王文;;个性化推荐算法研究[J];电脑知识与技术;2010年16期
9 张恺;秦亮曦;宁朝波;李文阁;;改进评价估计的混合推荐算法研究[J];微计算机信息;2010年36期
10 夏秀峰;代沁;丛丽晖;;用户显意识下的多重态度个性化推荐算法[J];计算机工程与应用;2011年16期
相关会议论文 前10条
1 王韬丞;罗喜军;杜小勇;;基于层次的推荐:一种新的个性化推荐算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 唐灿;;基于模糊用户心理模式的个性化推荐算法[A];2008年计算机应用技术交流会论文集[C];2008年
3 秦国;杜小勇;;基于用户层次信息的协同推荐算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 周玉妮;郑会颂;;基于浏览路径选择的蚁群推荐算法:用于移动商务个性化推荐系统[A];社会经济发展转型与系统工程——中国系统工程学会第17届学术年会论文集[C];2012年
5 苏日启;胡皓;汪秉宏;;基于网络的含时推荐算法[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
6 梁莘q,
本文编号:1573363
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1573363.html