基于特征工程和高效梯度提升树算法的精准化混合推荐方法研究

发布时间:2021-04-28 13:44
  随着互联网和信息技术的迅猛发展,互联网的信息量以指数形式增长。为了解决信息过载的问题,满足拥有不同兴趣爱好、关注领域、行为习惯、消费水平和个人成长经历的用户的信息需求,协同过滤推荐系统应运而生。但是,在互联网数据量指数增长的背景下,协同过滤推荐系统存在的数据稀疏性问题越来越严重。在高维的项目空间中,用户能够访问和打分的项目极少,这也导致了评分矩阵极度稀疏的问题。为了解决评分矩阵稀疏性的问题,本文从特征工程和推荐方法的角度出发,提出了一种基于用户行为数据以及用户与物品属性数据的混合推荐方法,并以电信运营商向用户推荐套餐为应用场景作具体论述。首先,对不同来源的特征进行有规律的特征组合,构造成组合特征。并运用word2vec方法对用户行为数据当中的时间序列数据进行特征增强,构建拥有相同消费习惯的用户之间的联系。然后,基于高效梯度提升树算法对大规模用户数据集进行建模,将高效梯度提升树模型的特征重要度以及模型输出的用户选择套餐的概率分布对套餐进行过滤,以达到对用户进行个性化套餐推荐的目的。最后,基于联通运营商发布的用户多源数据,根据构造完成的混合推荐方法,对用户的兴趣套餐进行预测并完成个性化套餐... 

【文章来源】:武汉科技大学湖北省

【文章页数】:67 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 推荐系统研究现状
        1.2.2 集成学习研究现状
    1.3 论文的研究设计
        1.3.1 研究内容
        1.3.2 研究方法
        1.3.3 论文技术路线
第2章 相关理论与方法
    2.1 推荐系统
        2.1.1 基于人口统计学的推荐
        2.1.2 基于内容的推荐
        2.1.3 基于协同过滤的推荐
        2.1.4 基于混合的推荐
    2.2 集成学习提升方法
        2.2.1 提升方法Adaboost算法
        2.2.2 梯度提升决策树(GBDT)
第3章 数据预处理与特征工程
    3.1 面向大规模用户推荐的数据处理
        3.1.1 问题描述
        3.1.2 数据处理思路
    3.2 数据预处理
        3.2.1 连续特征数据预处理
        3.2.2 离散特征数据预处理
    3.3 特征组合方法设计
    3.4 特征增强方法
        3.4.1 Word2vec
        3.4.2 基于Word2vec的特征增强
第4章 基于高效梯度提升树算法的混合推荐方法
    4.1 混合推荐方法设计思路
    4.2 高效梯度提升树算法
        4.2.1 XGBoost算法
        4.2.2 LightGBM算法
    4.3 基于高效梯度提升树算法建模
        4.3.1 S折交叉验证
        4.3.2 基于XGBoost算法建模
        4.3.3 基于LightGBM算法建模
    4.4 特征重要性分析方法
    4.5 基于高效梯度提升树算法的混合推荐方法构建
        4.5.1 混合推荐方法定义
        4.5.2 混合推荐方法描述
第5章 基于联通运营商多元数据的实例应用分析
    5.1 实例概述
    5.2 数据预处理和探索性数据分析
        5.2.1 数据预处理
        5.2.2 探索性数据分析
    5.3 基于特征组合和特征增强的特征工程
        5.3.1 基于统计的特征组合
        5.3.2 基于Word2Vec的特征增强
    5.4 基于高效梯度提升树算法的混合推荐方法实现
        5.4.1 实验条件
        5.4.2 分类模型评价指标
        5.4.3 超参数优化
        5.4.4 实验预测结果与分析
        5.4.5 特征重要性分析与个性化推荐结果
第6章 结论与展望
    6.1 结论
    6.2 展望
致谢
参考文献
附录1 攻读硕士学位期间发表的论文
附录2 攻读硕士学位期间参加的科研项目


【参考文献】:
期刊论文
[1]基于深度LightGBM集成学习模型的谷歌商店顾客购买力预测[J]. 叶志宇,冯爱民,高航.  计算机应用. 2019(12)
[2]面向高维特征和多分类的分布式梯度提升树[J]. 江佳伟,符芳诚,邵蓥侠,崔斌.  软件学报. 2019(03)
[3]改进的基于物品的协同过滤推荐算法[J]. 石京京,肖迎元,郑文广.  天津理工大学学报. 2019(01)
[4]基于独热编码和卷积神经网络的异常检测[J]. 梁杰,陈嘉豪,张雪芹,周悦,林家骏.  清华大学学报(自然科学版). 2019(07)
[5]基于二次组合的特征工程与XGBoost模型的用户行为预测[J]. 杨立洪,白肇强.  科学技术与工程. 2018(14)
[6]基于社交网络信息的协同过滤推荐算法[J]. 张朝恒,何小卫,陈勇兵.  计算机技术与发展. 2017(12)
[7]基于KNN算法的新浪微博用户行为分析及预测[J]. 解军,邢进生.  山西师范大学学报(自然科学版). 2016(02)
[8]基于用户人口统计特征与信任机制的协同推荐[J]. 时念云,葛晓伟,马力.  计算机工程. 2016(06)
[9]基于用户的协同过滤算法的推荐效率和个性化改进[J]. 王成,朱志刚,张玉侠,苏芳芳.  小型微型计算机系统. 2016(03)
[10]基于内容的推荐与协同过滤融合的新闻推荐方法[J]. 杨武,唐瑞,卢玲.  计算机应用. 2016(02)

硕士论文
[1]基于大数据技术的电信用户画像系统的实现与应用[D]. 王艺霖.北京邮电大学 2018
[2]基于用户通话行为的电信套餐业务推荐系统的设计与实现[D]. 李慧娟.贵州大学 2017
[3]基于神经网络与随机森林的套餐推荐模型的设计与研究[D]. 顾方婷.上海交通大学 2017
[4]基于协同过滤模型与隐语义模型的推荐系统研究与实现[D]. 鲁权.湖南大学 2013
[5]基于用户消费行为的移动业务推荐[D]. 田颖.华中科技大学 2013



本文编号:3165581

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3165581.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2edd7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com