当前位置:主页 > 经济论文 > 国际贸易论文 >

基于用户行为数据的再访问预测研究

发布时间:2020-11-04 21:08
   随着电子商务的迅猛发展以及移动终端技术的不断完善,网上购物作为一种新的消费方式越来越受欢迎,每天都有数以万计的网上浏览行为发生。人们随时随地都能够在线浏览商品,他们或点击、或收藏、或加购物车、或购买,因此电子商务领域逐渐积累了大量的用户行为日志数据,有效地挖掘这些数据进而得到有价值的信息现在是一个热门的研究课题。部分用户会重复访问电子商务平台或重复访问电子商务平台上的商家,基于用户行为日志数据预测用户的再访问行为蕴含着巨大的价值。精准和个性化的再访问预测,有助于电子商务平台统筹全局、合理安排资源、智能管理商铺和提供更好的服务;有助于商家对用户进行精准营销,并通过发放购物券等形式吸引消费者以此达到提高收益、降低成本、提高投资回报率的目的;有助于客户接收到符合自己兴趣爱好的个性化推荐,节约其时间和金钱成本等。本文主要根据电商平台的客户基本信息数据和用户行为日志数据,针对现有再访问预测工作存在的不足,对用户再访问预测问题进行深入研究,提出两个再访问预测模型。本文的工作和贡献如下:1.提出一种基于HMM的用户对平台的再访问预测模型。该模型使用了HMM研究用户对电子商务平台的再访问行为。具体来说,首先已知观测序列数据,利用Baum-Welch学习算法学习模型的参数,其中包含了隐数据状态序列;然后根据上一步学习好的模型,再已知观测序列数据,利用前向算法计算t+1时刻某用户可能的行为。基于真实的电子商务数据对提出的模型进行验证,实验结果表明,该模型预测用户对电商平台的再访问是有效的。2.提出了基于集成学习的用户对商家的精准再访问预测模型。本文首先介绍了基于集成学习的精准再访问预测算法Ensemble Learning-based Revisit Prediction(ELREVP)。具体的,该方法首先将原始电子商务平台用户行为日志数据预处理;然后将预处理后的数据从用户、商家和用户-商家相互作用三方面建立再访问预测特征工程;然后基于提出的关于再访问的相关特征使用集成学习算法Stacking进行用户对商家的再访问预测。集成学习方法中用到了一些基本的统计学习方法,包括决策树、随机森林、逻辑回归和神经网络。同时该方法还解决了样本类别不平衡问题和投票机制的最佳阈值选择问题。最后基于该方法做了用户对于商家的精准再访问预测实验,实验结果表明,与基线方法对比我们提出的方法是更精确的。
【学位单位】:山东大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F724.6;F274
【部分图文】:

技术路线图,投票机制,集成学习,选择问题


?山东大学硕士学位论文???互作用三方面建立再访问预测特征工程;最后基于提出的再访问预测相关特征使??用集成学习算法Stacking进行用户对商家的再访问预测。同时该方法还解决了??样本类别不平衡问题和投票机制的最佳阈值选择问题。??3-1:??

技术路线图,集成学习,算法,训练样本


3.3.2?Stacking?集成学习??在本文中,我们使用著名的集成学习算法Stacking预测再访问。因为在上一??小节中通过Easy?Ensemble算法解决样本类别不平衡问题,而Easy?Ensemble算??法可以把训练样本分为n份训练样本集私,外,…,A}。因此,在每一个训练样本??集上使用Stacking集成学习算法进行样本的训练。Stacking首先从初始训练集中??训练多个初级学习器,将初级学习器的输出作为新的训练样本,训练样本的类别??为原始类别,新的训练样本被使用于训练次级学习器。Stacking算法如算法3-1??所示。??算法3-1?Stacking算法??算法3-1.?Stacking算法??输入:训练集…,??初级学习算法而,“…,心;??

技术路线图,硕士学位论文,山东大学,路线


?山东大学硕士学位论文???04:?D'?=?0??05?:?for?i?=?1,2,?*????,?yz7?do??06?for?t?=?1,2,?Tdo??07:?Zit?-?h^Xj)??08:?end?for??09:?a?=?a?U?及2,".,及7*),尺)??10:?end?for??11:?hf?=?^D')??输出:ff{x)?=?h,{hl{x),h2{x),--1hT{x))??Stacking的技术路线如图3-3所示。??si:用征
【相似文献】

相关期刊论文 前10条

1 徐继伟;杨云;;集成学习方法:研究综述[J];云南大学学报(自然科学版);2018年06期

2 武玉英;严勇;蒋国瑞;;基于动态选择性集成学习的供应链产销协商优化策略[J];计算机工程;2017年05期

3 张沧生;崔丽娟;杨刚;倪志宏;;集成学习算法的比较研究[J];河北大学学报(自然科学版);2007年05期

4 米硕;孙瑞彬;李欣;明晓;;集成学习在文本分类问题中的应用[J];中国新通信;2018年09期

5 李晔;刘胜利;张兆林;;基于漂移检测和集成学习的木马检测模型[J];信息工程大学学报;2017年06期

6 徐桂云;陈跃;张晓光;刘云楷;;基于选择性集成学习的焊接缺陷识别研究[J];中国矿业大学学报;2011年06期

7 张春霞;张讲社;;选择性集成学习算法综述[J];计算机学报;2011年08期

8 饶峰;;核机器集成学习算法的误差分析[J];重庆文理学院学报(自然科学版);2010年04期

9 吴嘉乐;;异质集成学习器在鸢尾花卉分类中的应用[J];中国设备工程;2018年20期

10 陈德华;吴迪;潘乔;;基于超声特征集成学习的甲状腺结节分类方法研究[J];智能计算机与应用;2016年06期


相关博士学位论文 前10条

1 赵鹤;面向高维大数据的子空间集成学习方法研究[D];中国科学院大学(中国科学院深圳先进技术研究院);2017年

2 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年

3 侯勇;特征提取与集成学习算法的研究及应用[D];北京科技大学;2015年

4 孙永宣;集成学习下的图像分析关键问题研究[D];合肥工业大学;2013年

5 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年

6 阿里木·赛买提(Alim.Samat);基于集成学习的全极化SAR图像分类研究[D];南京大学;2015年

7 刘冲;模拟电路故障诊断AdaBoost集成学习方法研究[D];大连海事大学;2011年

8 钮冰;基于集成学习算法的若干生物信息学问题研究[D];上海大学;2009年

9 程丽丽;支持向量机集成学习算法研究[D];哈尔滨工程大学;2009年

10 李磊军;基于间隔和置信度的选择性集成学习算法研究[D];哈尔滨工业大学;2014年


相关硕士学位论文 前10条

1 朱飞鸿;基于集成学习的空气质量预测模型分析研究[D];长安大学;2018年

2 郭建威;基于集成学习的不平衡样本分类问题研究[D];哈尔滨工业大学;2017年

3 宋佳智;基于集成学习的膜蛋白金属离子结合位点预测[D];东北师范大学;2018年

4 赵帅;基于集成学习的高斯过程回归软测量建模方法研究[D];江南大学;2018年

5 郑旭曼;基于集成学习的O_3浓度逐小时预测模型研究[D];华东师范大学;2018年

6 石玥;基于集成学习的分子吸收能含时密度泛函计算校正模型研究[D];东北师范大学;2018年

7 黎竹平;基于集成学习的特征选择算法的设计与实现[D];哈尔滨工业大学;2018年

8 赵振贺;基于集成学习思想的矿产资源预测模型研究[D];吉林大学;2018年

9 刘毅;基于集成学习算法的冠心病早期筛查方法研究[D];山东大学;2018年

10 李鹏鹏;基于集成学习的文本分类方法研究[D];西安工业大学;2018年



本文编号:2870611

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2870611.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d11b2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com